Fran 🐝 Brizzolis

hace 5 años · 10 min. de lectura · ~100 ·

Blogging
>
Blog de Fran 🐝
>
Big Data, Machine Learning, Algoritmos, Business Intelligence -- ¡El futuro ya ha empezado!

Big Data, Machine Learning, Algoritmos, Business Intelligence -- ¡El futuro ya ha empezado!

10. Casos de uso

St on cs tere srw ro
Protetosinig ving pe

 
 
 
 
  

1. Tecnologias Big Data
13 ey rrr
1 maT.

me ape ws ms re

      
   

Big data
para dummies:

10 conceptos fundamentales

     

2. Real Time o Fast Data

     
 
 

4 iy nr ach

LH


Hola abejas, después de solucionar algunos problemillas "locales" en mi ordenador, con la "privacidad" y la "telemetría" de mi sistema operativo, que estaban dándome algunos dolores de cabeza sigo a la carga...

Esto me ha inspirado para publicar esta entrada, y hablaros de un tema complicado, pero que es el nuevo futuro que sin duda nos espera, y en el que ya empezamos a vivir de forma "muy leve".

Espero y deseo que os guste, y tened paciencia para leerlo, y ver los vídeos completamente, que sin duda os ayudarán a entender este nuevo futuro, que como siempre se suele decir: "el futuro es ahora".

Muchísimas gracias a tod@s por leerme, o por  lo menos por intentarlo.



                                                                              *            *            *            *            *



El escándalo Facebook ha sido la gota que ha colmado el vaso y ha sembrado la inquietud y las dudas sobre el uso de sus datos recabados por las redes sociales y los motores de búsqueda.


Los artículos publicados en prensa y algunas declaraciones indican que Facebook fue engañada y que supuestamente se obtuvo acceso a los datos de más de 50 millones de usuarios, que sirvieron luego mostrar anuncios políticos durante las elecciones presidenciales de 2016 en Estados Unidos…


¡La opinión pública fue manipulada!


Cambridge
Analytica



Hasta ahora, la mayoría de lo que habíamos escuchado sobre Facebook y las elecciones de 2016 se había centrado en la intromisión de agentes rusos. Esos esfuerzos están siendo investigados por la FBI y el Senado de EE.UU.


Cambridge Analytica representa un problema diferente. En su caso, la compañía con sede en Reino Unido supuestamente adquirió datos de millones de usuarios de Facebook de una manera que violaba las políticas de la red social. Después, aprovechó esa información para crear perfiles psicográficos de los usuarios y sus amigos, que se utilizaron para anuncios políticos específicos en la campaña de referéndum Brexit del Reino Unido, así como para el equipo de Trump durante las elecciones estadounidenses de 2016.


Facebook asegura que le dijo a Cambridge Analytica que eliminara esos datos, pero los informes sugieren que la información no fue destruida. Cambridge Analytica dice que cumple con las reglas de la red social, sólo recibe datos "obtenidos legal y equitativamente".


En tan solo 24 horas, el valor de Facebook cayó US$ 37.000 millones por un escándalo que comenzó con un aparentemente inocente test de personalidad en la red social y derivó en acusaciones de robo de datos, interferencia política y chantajes con prostitutas.


Las acciones de Facebook cayeron el lunes cerca de un 7% tras la publicación de una serie de investigaciones periodísticas que afirman que la consultora Cambridge Analytica adquirió de forma indebida información de 50 millones de usuarios de la red social en Estados Unidos.

  • Mark Zuckerberg reconoce que Facebook cometió errores en medio del peor escándalo que ha enfrentado la red social.
  • Cómo un test de personalidad de Facebook le sirvió a Cambridge Analytica para recolectar información privada de millones de usuarios sin que lo supieran
 




Las redes sociales


DATOS QUE RECOGEN: Todo lo que un usuario escribe, por ejemplo, en su página Facebook o en otras de sus “amigos”, todas las fotos o videos que publica, todos los “Me gusta” sobre los que cliquea, todo lo que comparte, todo lo que consulta, la identidad de los usuarios con los que interactúa, o su geolocalización. Lo mismo sucede con Instagram y WhatsApp, filiales de Facebook, Snapchat o Twitter, aunque el abanico es menor en estas últimas plataformas. Si el usuario lo autoriza, Facebook puede también ir a buscar informaciones en los sitios internet que consulta mientras está conectado a la red social.


DATOS QUE VENDEN: Facebook asegura que no vende a sus clientes anunciantes los datos personales identificables o los datos agregados. Lo que vende es la posibilidad de que un anunciante llegue entre los usuarios de Facebook al público al que apunta, multiplicando así la eficacia de una campaña. Twitter, por su lado, vende tuits, o más bien el acceso a un motor de búsqueda interna para ver todos los mensajes publicados en un periodo dado.


LO QUE COMPARTEN: La inmensa mayoría de las redes sociales abren sus puertas a compañías externas que crean aplicaciones que se nutren en parte o totalmente de la explotación de los datos de usuarios de esas redes.


En el caso de Facebook, la parte pública, es decir toda la página para algunos, únicamente el nombre, apellido y la foto para otros, no necesita autorización del usuario. En cambio, la utilización del resto requiere el consentimiento del interesado, afirma.


Únicamente los datos bancarios o de pago que posee Facebook están fuera de límites. Pero cuando los datos son recabados por estas aplicaciones, escapan a Facebook o a otras redes sociales.


Cuando alguien accede a esos datos, Facebook no tiene manera de saber lo que harán con ellos. Es como enviar un correo electrónico y preguntarse qué hará con él el destinatario.



Business Intelligence Architecture

Information Data Warehouse Server OLAP Servers Clients
Sources (Tier 1) (Tier 2) (Tier 3)

Fa # lil
, i
|, TN Bi,

~~

Data Mining

 

[= nr



Los motores de búsqueda


LO QUE RECOGEN: Todos los datos que conciernen las búsquedas, la geolocalización u otros datos consultados. Como Google, Yahoo! (grupo Oath) o Bing (Microsoft), los principales motores de búsqueda están integrados en los gigantes de internet que proponen varios otros servicios a los internautas. A través de ellos, los grupos recaban datos adicionales que, cruzados con los recabados de los motores de búsqueda, trazan un perfil aún más preciso del internauta.


LO QUE VENDEN: Al igual que las redes sociales, sus ingresos provienen en gran parte de la publicidad. No venden datos, sino el acceso a un consumidor de características muy precisas, fruto del cruce de datos del motor de búsqueda, pero también en el caso de Google, de todas las búsquedas y contenidos vistos en YouTube, su filial. Google incluso desde hace tiempo explota el contenido de los mensajes electrónicos de los internautas con una cuenta Gmail, pero en junio pasado anunció que no lo hará más.


LO QUE COMPARTEN: Abren las puertas a otros programadores y a las aplicaciones, y a las redes sociales.




¿Hay límites?


En Estados Unidos no existe casi ninguna ley que proteja la utilización de datos provenientes de las redes sociales o motores de búsqueda. Pero la autoridad reguladora, la Federal Trade Commission (FTC), las vigila y ha sancionado a Facebook a partir de 2011 por su gestión de datos personales. También concluyó un acuerdo con Google en 2013 por prácticas que atentaban contra la competencia.


En Canadá y Europa, hay límites para el uso de datos, sobre todo para lo que concierne informaciones ligadas a la salud, no obstante que la jurisprudencia sobre estos asuntos es casi inexistente.


En Europa, Facebook fue sancionado en 2017 con una multa de unos 135 millones de dólares por la Comisión Europea por compartir datos personales con WhatsApp.


En Francia, la Comisión Nacional de Informática y Libertades (CNIL) aplicó en mayo de 2017 una multa de 185.000 dólares a Facebook por “faltas” en su gestión de datos de los usuarios.


El nuevo Reglamento General sobre la Protección de Datos (RGPD), un texto europeo que entró en vigor el pasado 25 de mayo de 2018, define normas más claras en la recolección de datos.



" BIGDATA?

IT pubs ware created for
8ig Data 1 2015, ball

44 Millon

C@ESE

snares = fats St Mate
204 Million

    

 

Big Data is massive data sets that can be analyzed computationally to reveal
patterns, treads & associations, relating to human behavior & interactions.

Louk To al Xt
Torn DL rE
day ws. bcs ry Be

on 1 44 1vmbytes ia 21310 44 reece ie 220
Ra TET Er

 

SOCIAL MEDIA

Over 530 Malle: Dod
Twters Oe Tuner

Over | Balce Focbock
(SI Cog ® Users Workdwde.
Seerhes Ere Arvo 41,000 Pos
Serge Secaad, Aresspmg rable)
35 Bika A Dey =

snicgorcers LR
Tacgram frey Send @®

HOW IS BIG DATA
CHANGING THE WORLD?

Sports Predictions Easier Commates Smartphones

Bg Dato wes wed in 2012 8g Doto swesmbines tfc, Saceipbane users utlkre
to lomousty preda the US wing ota bom GPS syems. Big Deo when csking far
would win 108 medals in Traffic lights now react to neff direcnons & rerdelly eskng
the Summer Olympus conditions, wecther & oxodents. theut phone Guestons.

The woe 104
lL:

Personaloed Advertising. PresdestilCampaigas Advanced Healthcare

83 Date 1s wed 0 Seid ht She id By Bag Dota 1 vied ¢ predic
recommend purchases § Dats 10 predict the ovkcome of where outbreaks of poteatiolly
perioach zed website ods, the 2012 presidenticl election epidemic wivies will occur
malung ods mare relevant

   

100 Hors OF Videos
ne Te
Toutsbe Every Wencte

 

  

 

hg ww bores cote be dmnt 191 05/3 hg dome 19 cmd Beg S30 eveyone am evo

  
  

rhe bsg me es a hed
can e740 T7208 vos bg do wll ges. 12
An we th neadn cosh og fot Coch bg pk 44 cn by 015 md
palsy
An wv co 23 TO) CAT mt os set XA ole gm, pe wot Mood
Nog vs wear a hg TOS U1 da soe whi wericunde 20S
Ap ww se co

Qué es el “Big Data”


Big Data es el proceso de recolección de grandes cantidades de datos y su inmediato análisis para encontrar información oculta, patrones recurrentes, nuevas correlaciones, etc.; el conjunto de datos es tan grande y complejo que los medios tradicionales de procesamiento son ineficaces. Y es que estamos hablando de desafíos como analizar, capturar, recolectar, buscar, compartir, almacenar, transferir, visualizar, etc., ingentes cantidades de información, obtener conocimiento en tiempo real y poner todos los sentidos en la protección de datos personales. El tamaño para albergar todo el proceso ha ido aumentando constantemente para poder recopilar e integrar toda la información.


La recolección de datos ha existido casi desde siempre, cuando en el amanecer del hombre se hacían muescas en piedras o huesos para hacer seguimiento de las actividades cotidianas o de los suministros esenciales para subsistir. La invención del ábaco supuso un determinante empuje al cálculo y análisis que tanto necesitábamos cuando los dedos y la memoria no eran suficientes, y las primeras bibliotecas representaron además un primer intento de almacenar datos. En la época actual, todo lo que hacemos está continuamente dejando un rastro digital que se puede utilizar y analizar; los avances en tecnología, junto a la expansión de Internet y el almacenamiento en la nube, han provocado que crezca la cantidad de datos que podemos almacenar.





 


Big Data: su utilidad en la sociedad


Con la irrupción de Internet, llegaron nuevos conceptos que con el tiempo se han vuelto de uso cotidiano y que nos acompañan en nuestro día a día. Han repercutido para bien en nuestras vidas y casi no podemos entender las nuevas tecnologías sin estas geniales ideas. Uno de estos conceptos que han resonado mucho últimamente es Big Data; aunque como ya ha pasado en anteriores ocasiones, el halo de escepticismo y desconfianza ha planeado en torno a todo lo que lo rodea. Hay muchas dudas (fundadas) en cuanto a su concepto, uso y alcance; de esta manera se crea un ambiente de recelo aparejado a algo que parece intangible, incontrolable y sobre todo, que puede atentar nuestra privacidad. Vamos a arrojar un poco de luz sobre este tema, para por lo menos tener una opinión más fundamentada sobre todo esto, y de esta manera discutir, criticar y polemizar con argumentos


Se pueden utilizar 5 “V” como definición de Big Data (empezaron siendo 3), que es lo que “habitualmente” caracteriza al sistema:


  • Volumen. La más evidente y la que hacer honor al nombre; captar y organizar absolutamente toda la información que nos llega es esencial para tener registros completos, y que las conclusiones que obtengamos sirvan eficientemente a la hora de la toma de decisiones. Es el Business Intelligence que todos conocemos, pero a lo grande.
  • Velocidad. Siempre es importante el tiempo si afrontamos tanto la necesidad de generar información (y recordemos que estamos hablando de muchos datos) como de analizarla, pero lo es más si necesitamos reaccionar inmediatamente.
  • Variedad. Hay que dar uniformidad a toda la información, que tendrá su origen en datos de lo más heterogéneos, tal como veremos en el siguiente apartado. Una de las fortalezas del Big Data reside en poder conjugar y combinar cada tipo de información y su tratamiento específico para alcanzar un todo homogéneo.
  • Veracidad. Hay que encontrar herramientas para comprobar la información recibida; las tecnologías creadas al servicio del Big Data se muestran imprescindibles y eficientes para afrontar los retos.
  • Valor. Trabajar con Big Data tiene que servir para aportar valor a la sociedad, las empresas, los gobiernos, en definitiva, a las personas; todo el proceso tiene que ayudar a impulsar el desarrollo, la innovación y la competitividad, pero también mejorar la calidad de vida de las personas. 





Tipos de datos en Big Data


Para aclarar qué es lo que se recoge para el análisis, podemos dividirlos en dos grandes categorías:


  • Datos estructurados. Aquellos que tienen longitud y formato (por ejemplo, fechas) y que pueden ser almacenados en tablas (como las bases de datos relacionales). En esta categoría entran los que se compilan en los censos de población, los diferentes tipos de encuestas, los datos de transacciones bancarias, las compras en tiendas online, etc.
  • Datos no estructurados. Son los que carecen de un formato determinado y no pueden ser almacenados en una tabla. Pueden ser de tipo texto (los que generan los usuarios de foros, redes sociales, documentos de Word), y los de tipo no-texto (cualquier fichero de imagen, audio, vídeo). Dentro de esta categoría, podemos añadir los Datos semiestructurados, que son los que no pertenecen a bases de datos relacionales ya que no se limitan a campos determinados, aunque poseen organización interna o marcadores que facilita el tratamiento de sus elementos; estaríamos hablando de documentos XML, HTML o los datos almacenados en bases de datos NoSQL. 




El uso del análisis de datos


Para poder analizar todo esto, se precisan técnicas potentes y avanzadas. Las clásicas medias matemáticas que aprendimos en el colegio sirven para extraer suficiente de toda esa cantidad de información, ni para entender los diferentes tipos de datos que hemos descrito.


Antes de la irrupción Big Data, ya existían algoritmos matemáticos que nos facilitaban descubrir información oculta en los datos, como todos los que engloban el Data Mining (minería de datos): K-medias, arboles de decisión, redes neuronales, etc., que con la llegada de la potencia de cálculo de los ordenadores permitieron acortar el tiempo que se tardaba en obtener resultados. Aunque no se pensó para ser en tiempo real si no a posteriori, permite analizar datos para encontrar correlaciones entre ellos y de este modo desarrollar por ejemplo una estrategia de marketing adaptada a las conclusiones.


Por eso el análisis de datos siempre ha tenido un gran peso en el marketing, un mejor conocimiento del consumidor y sus necesidades propicia saber cómo aumentar las ventas; el análisis de datos nos permite establecer relaciones entre variables, predecir comportamientos, realizar agrupaciones (clustering) de grupos homogéneos, e incluso analizar textos para extraer información. Ahora con Big Data, todo esto se consigue en tiempo real y con cada nueva actualización de nuestro repositorio de datos es posible ver los cambios en las estadísticas inmediatamente.




¿Para qué sirve?


Como todas las cosas en esta vida, puede tener un buen uso o usarse para propósitos “malvados”. Lo primero que llama la atención es el tema de la privacidad, ya que cada vez más detalles de nuestras vidas son almacenados y analizados por empresas y gobiernos; por supuesto, no es algo que nos debamos tomar a la ligera, pero a medida que siga avanzando la tecnología, habrá que ir adaptando las leyes y regulaciones para proteger a las personas. Por ahora, no hay más rastro de nosotros que los que ya estamos dejando día a día, y que ya están siendo analizados por terceros; a partir de este momento, todos esos registros se unen para formar un todo. Sí, podemos hablar de una representación de nosotros, pero no deja de ser un número entre millones de números, sin cara ni alma. Lo único que va a contar para estudiar es el comportamiento de grupos homogéneos tratados como tendencias en un segundo, para que al siguiente empiece de nuevo el proceso. Si alguien quiere hacer de esto algo punible, está todavía por ver, aunque no hay que bajar la guardia.


Un “eCommerce” puede optimizar el stock de sus almacenes a través de la información extraída de lo que busca la gente en su web o analizando las tendencias en redes sociales y foros; también fijar precios dinámicos en sus productos extrayendo datos de múltiples fuentes (las acciones de los clientes, preferencias de los proveedores o recopilación de precios de la competencia).


El sector de las telecomunicaciones es una industria privilegiada, gracias a sus redes y a la proliferación de dispositivos móviles; la oportunidad más evidente es extraer información de la experiencia del usuario gracias al tráfico de voz y datos, y así poder ofrecer altas en contratos personalizados, ampliar la batalla por la competencia e incluso crear nuevas fuentes de ingresos.


La banca tiene ante sí un reto, y una oportunidad, de poner medios para luchar contra el fraude, los delitos financieros y las brechas de seguridad, mediante Big Data. Las entidades financieras están invirtiendo enormes cantidades de dinero en perfeccionar algoritmos y la tecnología de análisis para minimizar riesgos y fortalecer su imagen de cara al cliente.


La Federación Alemana de Fútbol empezó a usar el análisis de grandes volúmenes de datos para mejorar el rendimiento de sus jugadores, y con los deberes bien hechos se presentaron en el Mundial de Brasil 2014.


Si piensas que todo lo que puede dar de sí Big Data es sólo aprovechable por grandes corporaciones, vas mal encaminado; por ejemplo, las fuerzas de seguridad utilizan estas herramientas para perseguir criminales y luchar contra el terrorismo de cualquier tipo.


En materia de sanidad, el cruce de información de historiales clínicos, antecedentes familiares, clima y entorno, junto a los hábitos de consumo, permitirá un modelo predictivo personal para cada paciente, y de esta manera ayudar en la detención precoz de enfermedades y estrategias más efectivas para combatirlas. En muchas ciudades, ya se usa el análisis de datos para transformarse en más modernas e inteligentes: transportes públicos interconectados para minimizar los tiempos de espera, o semáforos que ante la previsión de un aumento del tráfico se regulan para minimizar los atascos.


Las PYMES también pueden subirse al carro del Big Data, ya que no es necesaria una gran inversión. Es suficiente con tener un CRM y a un analista de datos para extraer conclusiones de la información que utiliza una pyme, aunque siempre cabe la posibilidad de externalizarlo.




Big Data, modelando el futuro


Todo el mundo habla cada día más, es una tendencia en aumento y ha llegado para quedarse. A medida que las herramientas se hagan más accesibles, se integrará poco a poco en nuestras vidas y pasará de ser algo desconocido o temido, a una forma más de comprender el comportamiento humano y nuestra relación con el entorno.


Es como el Social Media, al principio las empresas lo veían como algo ajeno a ellas, que no debían destinar recursos porque creían que no reportaría ningún beneficio; ahora, lo más normal es hacer Social Marketing y elaborar informes exhaustivos con las estadísticas derivadas de su presencia online. Pues ahora es el momento de cruzar esos datos con el resto de aspectos de la organización, como ventas, tráfico web, interacción con distribuidores, etc., para encontrar nuevas vías de negocio y crear nuevas estrategias.


Y por supuesto, para analizar toda esta información, es necesario contar con profesionales que tengan parte analista y parte creativa; estos “científicos de datos” serán muy demandados por las empresas y organizaciones, por lo que se abre un interesantísimo campo laboral para los amantes de los números.







Referencias:


https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos

https://docs.microsoft.com/es-es/sql/analysis-services/data-mining/data-mining-concepts?view=sql-server-2017

https://techlandia.com/mejores-10-algoritmos-mineria-datos-info_295108/

https://www.vox.com/policy-and-politics/2018/3/23/17151916/facebook-cambridge-analytica-trump-diagram

https://en.wikipedia.org/wiki/Machine_learning

https://www.xataka.com/robotica-e-ia/machine-learning-y-deep-learning-como-entender-las-claves-del-presente-y-futuro-de-la-inteligencia-artificial

https://es.wikipedia.org/wiki/Herramientas_de_inteligencia_de_negocios

http://elartedemedir.com/blog/inteligencia-de-negocio/

https://www.ibm.com/developerworks/ssa/local/data/dm-bi-pymes/index.html

http://www.elmundo.es/papel/2018/03/20/5aafa72f22601dd23b8b4656.html



""""
Comentarios

Fran 🐝 Brizzolis

hace 5 años #3

#3
Gracias por el apoyo Sonia Rosell\u00f3 Puig... Sólo pretendo dar a conocer cosas de nuestro día a día de la tecnología, y de cómo el futuro que nos decían ya ha comenzado... Por eso en cuestión de ciberseguridad a nivel de usuario, todo (o casi todo) comienza por una gestión adecuada de la privacidad, por lo menos yo así lo creo, pero "vaya usted a saber"... Jajaja

Fran 🐝 Brizzolis

hace 5 años #2

Gracias por compartirlo Julio Angel \ud83d\udc1dLopez Lopez.... Un abrazo.

Fran 🐝 Brizzolis

hace 5 años #1

Todo está cambiando, ahora hay mucha información en la red, y combinandola adecuadamente poedemos obtener resultados sorprendentes.

Artículos de Fran 🐝 Brizzolis

Ver blog
hace 5 años · 10 min. de lectura

Hola abejas, estos días me costaba bastante encontrar un tema sobre el que escribir, y que no me hic ...

hace 5 años · 4 min. de lectura

Hola abejas, después de este período navideño en el que "se me han pegado los turrones" (os pido dis ...

hace 5 años · 10 min. de lectura

¡Hola abejas!... Hoy os traigo un post sobre una de las tendencias de mayor crecimiento en los últim ...

Puede que te interesen estos puestos de trabajo

  • beBee Professionals

    Desarrollador/a de Machine Learning

    Encontrado en: beBee Professionals - hace 1 semana

    Aplicar directamente

    beBee Professionals Bilbao, España Desarrolladores Freelance

    beBee Professionals está buscando un/a Desarrollador/a de Machine Learning para unirse a su equipo de Bilbao. Estamos buscando a alguien con una pasión por la innovación y la tecnología, que tenga una sólida comprensión de los principios de Machine Learning y una motivación para ...

  • beBee Professionals

    Desarrollador/a de Machine Learning

    Encontrado en: beBee Professionals - hace 1 semana

    Aplicar directamente

    beBee Professionals Murcia, España Desarrolladores Freelance

    beBee Professionals está buscando un/a Desarrollador/a de Machine Learning para unirse a su equipo de Murcia. Estamos buscando a alguien con una pasión por la innovación y la tecnología, que tenga una sólida comprensión de los fundamentos de Machine Learning y una motivación para ...

  • beBee Professionals

    Desarrollador/a de Machine Learning

    Encontrado en: beBee Professionals - hace 1 semana

    Aplicar directamente

    beBee Professionals Sevilla, España Desarrolladores Freelance

    beBee Professionals está buscando un/a Desarrollador/a de Machine Learning para unirse a su equipo de Sevilla. Estamos buscando a alguien con una pasión por la innovación y la tecnología, que tenga una sólida comprensión de los fundamentos de Machine Learning y una motivación par ...