Galería de mapas mentales Conociendo a Big Bata
La "situación actual del Big data" muestra un crecimiento explosivo de la cantidad de datos y una diversificación de las fuentes. La "tecnología de Big data" abarca la adquisición, almacenamiento, procesamiento y análisis de datos, como hadoop, Spark y otros marcos. Como clave del almacenamiento de Big data, la "base de datos nosql" enfatiza su flexibilidad y escalabilidad, adecuada para datos no estructurados o semiestructurados, como mongodb, cassandra, etc.
Editado a las 2021-10-16 12:37:07,Conociendo a Big Bata
Teniendo en cuenta la importancia que ha adquirido el término Big Data, la presente investigación buscó estudiar y analizar de manera exhaustiva el estado del arte del Big Data; además, y como segundo objetivo, analizó las características, las herramientas, las tecnologías, los modelos y los estándares relacionados con Big Data, y por último buscó identificar las características más relevantes en la gestión de Big Data, para que con ello se pueda conocer todo lo concerniente al tema central de la investigación. La metodología utilizada incluyó revisar el estado del arte de Big Data y enseñar su situación actual; conocer las tecnologías de Big Data; presentar algunas de las bases de datos NoSQL, que son las que permiten procesar datos con formatos no estructurados, y mostrar los modelos de datos y las tecnologías de análisis de ellos, para terminar con algunos beneficios de Big Data. El diseño metodológico usado para la investigación fue no experimental, pues no se manipulan variables, y de tipo exploratorio, debido a que con esta investigación se empieza a conocer el ambiente del Big Data. REFERENCIA: Camargo-Vega, Juan José, Camargo-Ortega, Jonathan Felipe y Joyanes-Aguilar, Luis Conociendo Big Data. Facultad de Ingeniería. 2015;24(38):63-77. ISSN: 0121-1129. Disponible en: https://www.redalyc.org/articulo.oa?id=4139/413940775006.
1. Estado del arte de Big Data
Definición
Gartner, cita a Salgado (2014), define el Big Data como “un gran volumen, velocidad o variedad de información que demanda formas costeables e innovadoras de procesamiento de información que permitan ideas extendidas, toma de decisiones y automatización del proceso”.
Características o dimensiones
Volumen
Velocidad
Variedad
Y Russom (2012) indica que “Big Data consiste en consolidar toda la información de una organización y ponerla al servicio del negocio”.
A. Estado actual de Big Data
B. Dimensiones de Big Data
C. Análisis de Big Data
2. Tecnologías de Big Data
Componentes básicos
Hardware
Software
Aparecen nuevas técnicas y tecnologías
MapReduce
Hadoop
Hadoop está compuesto por dos módulos:
“Hadoop puede manejar todos los tipos de datos de sistemas dispares: estructurado, no estructurado, los archivos de registro, imágenes, archivos de audio, archivos de correo electrónico, las comunicaciones…, casi cualquier cosa que se pueda imaginar, sin importar su formato nativo” Cloudera (2013)
Hadoop Distributed File System (HDFS), y HadoopMapReduce
3. Bases de datos NoSQL
Característica principal
Que su estructura es distribuida, es decir, los datos se hallan distribuidos en varias máquinas
Some are available for Free version and all for Pro version
Las bases de datos NoSQL permiten
Obtener los datos con mayor velocidad.
Y que en otras con modelo relacional.
A continuación se presentan algunas Bases de Datos NoSQL:
A. DynamoDB
B. Cassandra
C. Voldemort
D. Google BigTable
E. HBase
F. Riak
G. CouchDB
E. HBase
I. BaseX
4. Modelo de datos
Los datos se clasifican en:
Estructurados
Este tipo de datos se dividen en
Estáticos (array, cadena de caracteres y registros).
Dinámicos (listas, pilas, colas, árboles, archivos).
No estructurados
Son aquellos que no pueden ser normalizados.
No tienen tipos definidos ni están organizados bajo algún patrón.
Tampoco son almacenados de manera relacional, o con base jerárquica de datos
Semiestructurados.
No tienen un formato definido
Estos datos no tienen un formato definido, lo que tienen son etiquetas que facilitan separar un dato de otro. Un dato de estos se lee con un conjunto de reglas de cierto nivel de complejidad
5. Tecnologías de análisis de datos
Análisis de datos
. BigQuery
“Google BigQuery es un servicio web que permite hacer un análisis interactivo de enormes conjuntos de datos hasta miles de millones de filas. Escalable y fácil de usar, permite a los desarrolladores BigQuery y las empresas aprovechar los análisis de datos de gran alcance en la demanda” Developers.google.com (2012)
ThinkUp
ThinkUp es un potente motor de análisis de datos que permite extraer información de Twitter, Facebook y Google
Infosphere Streams
Es una plataforma desarrollada por IBM, que permite el análisis de datos en milisegundos
Biginsights Infosphere
Es una plataforma desarrollada por IBM para Hadoop, buscando suplir las necesidades de las empresas, lo cual se puede lograr facilitando el trabajo de los analistas de sistemas, sin volverlos programadores en una herramienta de difícil manejo.
System PureData
El sistema PureData es una herramienta de IBM; permite realizar análisis de Big Data en menos tiempo que otras herramientas de análisis
Infosphere Information Server
Es una plataforma de integración de datos, producto desarrollado por IBM; permite limpiar y transformar datos, para luego entregar información confiable a la empresa o negocio.
Sap Hana
Sap Hana (System Applications Products HighPerformance Analytic Appliance) es una herramienta para el análisis de Big Data
Oracle Big Data Appliance
Es un software desarrollado por la empresa Oracle, que combina hardware con software optimizado, ofreciendo una solución completa y fácil de implementar para la organización de Big Data
HDinsight
Es un producto Microsoft, basado en Hadoop, permite gestionar datos estructurados y no estructurados de cualquier tamaño, que se pueden llegar a combinar perfectamente con herramientas de Inteligencia de Negocios de Microsoft
Textalytics
Textalytics es un software desarrollado por Daedalus (Data Decisions and Language S. A.), dedicado al análisis de texto; extrae con facilidad significado de lo escrito en medios sociales y todo tipo de documentos.
6. Beneficios del Big DataI
.
Las empresas que saben sacar provecho del Big Data pueden mejorar su estrategia y así permanecer en el mercado posicionadas.
Pueden
Ofrecer
Mejores productos
Desarrollar
Excelentes relaciones con sus clientes, además, se transforman en más ágiles y competitivas
7. REFERENCIAS
• Camargo-Vega, Juan José, Camargo-Ortega, Jonathan Felipe y Joyanes-Aguilar, Luis Conociendo Big Data. Facultad de Ingeniería. 2015;24(38):63-77. ISSN: 0121-1129. Disponible en: https://www.redalyc.org/articulo.oa?id=4139/413940775006. • Cloudera.com, Cloudera, Inc. Disponible en: http://www.cloudera.com/content/cloudera/en/ why-cloudera/hadoop-and-big-data.html, 2013. • Developers.google.com, Google BigQuery. Disponible en: https://developers.google.com/ bigquery/, 2012. • M. Salgado, Oracle apuesta por Big Data con tecnología y proyectos. Disponible en: http://www.computerworld.es/big-data/ oracle-apuesta-por-big-data-con-tecnologia-yproyectos, 2014. • P. Russom, Big Data Analytics, TDWI (The Data Warehousing Institute), 2012. • P. Russom, Big Data Analytics, TDWI (The Data Warehousing Institute), 2012. • T. Olavsrud, Big Data Causes Concern and Big Confusion.Disponible en:http:// www.cio.com/article/700804/Big_ Data_Causes_Concern_and_Big_ Confusion?page=2&taxonomyId=3002, 2012.
ROCÍO CONSUELO GUACÁN TANDAYAMO