Información y Datos Digitales conectados en Red

data-informacion

DEMANDA DE INFORMACIÓN

Se dice que la información es el conocimiento obtenido del análisis apropiado de los datos. Así mismo los datos carecen de importancia sino son capaces de brindarnos información útil.

El volumen de datos e información que manejamos se incrementa a diario, por lo que nos hemos convertido en dependientes de la información, ya que esperamos contar con la información en forma instantánea en el momento y lugar en que se requiera.

A diario accedemos a Internet para realizar búsquedas, interactuar en redes sociales, enviar y recibir emails, compartir imágenes y videos, así como acceder a distintas aplicaciones que involucran intercambio de información. Del mismo modo las empresas e instituciones acceden a la red para generar y acceder a información.

Cuando se genera nueva información, estos datos se almacenan localmente en distintos dispositivos. A fin de ser compartidos con otros usuarios, estos necesitan ser cargados en un dispositivo con conectividad a una red, con suficiente capacidad para brindar espacio de almacenamiento, seguridad a la información y rapidez en el acceso.

Las empresas dependen de que tan rápido y confiable sea su sistema de información que guarda data crítica para su negocio. Algunos procesos empresariales que dependen de la información digital son por ejemplo las reservas de tickets aéreos, el comercio electrónico, las transacciones bancarias, entre otros.

Las empresas usualmente mantienen uno o más servidores para almacenar y gestionar su información. Aquellas grandes organizaciones pasan a tener centros de datos (data centers) dedicados, debido al incremento de usuarios, la proliferación de nuevas aplicaciones y el uso de diversos paquetes informáticos requeridos por dichos usuarios, con lo cual se van a requerir mayores recursos computacionales y de conectividad de redes.

Ante este aumento de demanda de recursos, se vuelve más complejo el proceso de gestión de dichos recursos, en muchos casos se subdimensionan o sobredimensionan la capacidad técnica del equipamiento. Una solución es la virtualización de servidores, ya que optimiza la utilización de recursos tecnológicos, así como el cloud computing que ayuda a incrementar o reducir recursos bajo demanda cuando estos se necesiten sin retrasos en el tiempo de implementación o configuración.

tecnologia-datos

DATOS DIGITALES

Las empresas procesan datos que les permite generar información útil para las operaciones de negocio. Los datos pueden provenir de distintas fuentes, no necesariamente fuentes digitales, como por ejemplo una carta firmada o documentación escrita a mano. De modo de volver almacenable y accesible en red, la información no digital debe ser convertida a algún formato digital (por ejemplo imagen JPG, documento PDF, archivo DOC, audio MP3, etc.).

El aumento de los datos digitales se debe a los siguientes factores:

  • Alta capacidad de procesamiento de datos de las computadoras y dispositivos electrónicos modernos.
  • Bajos costos de los dispositivos de almacenamiento físico y/o almacenamiento cloud.
  • Mejor capacidad de ancho de banda que permite aumentar el volumen de transferencia de datos por segundo.
  • Mayor diversidad de dispositivos (PCs, notebook, tablets, smartphones, etc.) con conectividad a Internet o con capacidad de conexión a red.
  • Creación fácil y gratuita de contenidos.

El tipo, calidad, importancia, confidencialidad, cantidad, procedencia y utilización de los datos digitales, determinarán el sistema adecuado de almacenamiento y gestión. Sin embargo estas condiciones pueden variar en el tiempo, alterándose el grado de relevancia de cierta información con respecto a otra, por ejemplo la información contable del año actual dejará de ser tan relevante el año próximo. Pese a los cambios de relevancia que puedan surgir, la información siempre debe ser almacenada y conservada por períodos largos o indefinidos de tiempo.

Los datos digitales pueden ser clasificados como Estructurados y No Estructurados, basado en como son guardados y gestionados.

  • Los Datos Estructurados son organizados en filas y columnas siguiendo un formato estandarizado, de modo de mantener un orden y permitir ser procesados eficientemente. Estos datos son guardados utilizando un sistema de gestión de base de datos (Database Management System, DBMS).
  • Los Datos No Estructurados son aquellos que no siguen un orden o patrón de almacenamiento definido (lo cual dificulta su procesamiento y gestión), por ejemplo información proveniente de emails o de documentos .DOC, .TXT, .PDF. Se estima que más del 90% de los datos generados son de tipo no estructurados, por lo que se vienen desarrollando nuevas herramientas informáticas y algoritmos de procesamiento para capturar y analizar dichos datos.

datos-digitales

BIG DATA

El concepto de Big Data se refiere al conjunto de datos cuyos tamaños están más allá de la capacidad de las herramientas de software comúnmente utilizadas para capturar, almacenar, gestionar y procesar dentro de un tiempo aceptable. Incluye tanto datos estructurados como no estructurados, provenientes de fuentes como por ejemplo: transacciones comerciales, formularios web, imágenes, videos, emails, redes sociales, entre otros.

Estos datos son sometidos a herramientas informáticas de análisis que extraen información valiosa para predecir comportamientos futuros y formular estrategias de decisiones.

El Ecosistema Big Data, está conformado de los siguientes elementos:

  • Dispositivos que recopilan datos de múltiples ubicaciones y además generan nuevos datos utilizando los datos recopilados (metadatos).
  • Recopiladores de datos que recopilan datos de dispositivos y usuarios.
  • Los agregadores de datos que compilan los datos recopilados con el fin de obtener información valiosa.
  • Los usuarios de los datos, los cuales se benefician de la información obtenida y agregada por otros usuarios.

El Data Science es una especialización emergente, que le permite a las organizaciones obtener información valiosa del Big Data. Dada la variabilidad, versatilidad, dinamismo, volumen y complejidad de Big Data, se requiere personal especializado, hardware moderno y software de análisis en tiempo real que ofrezcan alto desempeño, procesamiento paralelo masivo, y análisis avanzado progresivo.

Los profesionales Data Scientists combinan las matemáticas, estadística, visualización de datos, y programación de software, para obtener información relevante para la toma de decisiones del negocio.

big-data-word-cloud

ALMACENAMIENTO EN RED

Los datos creados por personas o empresas deben ser guardados y almacenados, manteniéndose disponibles para acceder en futuras ocasiones. En el ambiente informático, los dispositivos diseñados para almacenar datos se denominan Data Storage Devices. Estos pueden ser tan simples como una memoria USB, DVD, CD-ROM, o complejos centros de almacenamiento en red (NAS Network Area Storage).

Según IOTEK NETWORKS (www.iotekperu.com), un sistema de almacenamiento en red permite habilitar un conjunto de dispositivos electrónicos, servidores, computadoras y/o discos duros dentro de una misma red, de tal manera que los datos que allí se almacenen permanezcan accesibles a todos los usuarios con acceso a dicha red, de este modo se conforma un sistema que permite compartir recursos y que optimiza el uso de los mismos.

Anteriormente la tendencia de los data centers era contar con computadoras (servidores) que centralizaran las aplicaciones y el almacenamiento de datos, para lo cual debían contar con la infraestructura, hardware, software, y personal para implementar y mantener dicha base operativa. Bajo esta arquitectura, cada servidor tiene un número limitado de dispositivos de almacenamiento y por ende una capacidad límite, además cualquier cambio de hardware o actualización de software requiere que se paralicen las operaciones y desconecte el servidor, suspendiéndose el acceso a la información.

En cambio las nuevas tecnologías hacen posible que se evolucione a una arquitectura de información centralizada (en lugar de servidor de datos centralizado). Lo cual permite unificar la capacidad de los servidores (inclusive si se ubican en locaciones distintas), potenciando la seguridad y capacidad técnica, reduciéndose y optimizándose la inversión en IT.

Bajo este esquema, los dispositivos de almacenamiento se gestionan en forma centralizada e independiente de los servidores, y trabajan en modalidad compartida, ya que se comparten entre varios servidores. La capacidad de almacenamiento compartido se puede aumentar o disminuir dinámicamente, ya sea añadiendo dispositivos nuevos o redistribuyendo (vía configuración) los recursos existentes.

grid-2

IMPORTANCIA DE LA INFORMACIÓN

Uno de los principales activos con que cuentan las empresas es su información, por eso la importancia de contar con un sistema de almacenamiento de información que sea confiable.

La política corporativa para el almacenamiento y gestión de información permitirá a las organizaciones sacar provecho y beneficiarse de dicho activo.

informacion-empresarial

BIBLIOGRAFÍA:

“Information Storage and Management”, 2nd Edition, EMC Education Services.

“The Holy Grail of Data Storage Management”, 1st Edition, Jon William Toigo.

“Storage Area Networks for Dummies”, 2nd Edition, Christopher Poelker.

Copyright @  Negocios y Tecnologías, Perú, 2017.

 

Anuncios