Google y el valor de la gestión de datos, Big Data

Concept of smart urban city with server room and database icons, data center and database, big data processing isometric vector

 

Google no solo ha influido significativamente en la forma en que podemos ahora analizar Big Data (pensar en MapReduce, BigQuery, etc.) pero son probablemente más responsable que cualquier otra persona por hacer que sea parte de nuestra vida cotidiana, creo que muchas de las cosas innovadoras que Google esta haciendo hoy la mayoría de las empresas lo harán en los próximos años.

La innovación de big data va más allá de la búsqueda básica que sigue siendo su núcleo, las empresas procesan 3.5 billones de solicitudes por día, y cada solicitud consulta una base de datos de 20 mil millones de páginas web.

Esto se actualiza diariamente, a medida que los robots de Google rastrean la web, copiando lo que ven y lo llevan a ser almacenado en el índice de Google. Lo que empujó a Google frente a otros motores de búsqueda ha sido su capacidad para analizar conjuntos de datos más amplios para su búsqueda.
Inicialmente fue PageRank el que incluía información sobre los sitios que vinculado a un sitio en particular en el índice, para ayudar a tomar una medida de importancia de ese sitio en el gran esquema de las cosas.

Previamente los motores de búsqueda líderes trabajaron casi enteramente en el principio de hacer coincidir las palabras clave relevantes en la consulta de búsqueda con sitios que contienen esas palabras. PageRank revolucionó la búsqueda incorporando otros elementos junto con el análisis de palabras clave.
Su objetivo siempre ha sido hacer que la mayor parte de la información del mundo disponible para la mayor cantidad de personas posible y la forma en que funciona la búsqueda de Google ha sido constantemente revisado y actualizado para mantenerse al día con esta misión.
Ir más lejos de la búsqueda basada en palabras clave y hacia la búsqueda semántica es el objetivo actual. Esto implica analizar no solo los “objetos” (palabras) en la consulta, pero la conexión entre ellos para determinar lo que significa con la mayor precisión posible.
Con este fin Google arroja un montón de información en la mezcla, a partir del 2007 lanzó Universal Search, que extrae datos de cientos de fuentes incluido el idioma, previsiones meteorológicas, datos históricos, datos financieros, viajes, tipos de cambio de moneda, estadísticas deportivas y una base de datos de funciones matemáticas.

Continuó evolucionando en el 2012 hacia el Knowledge Graph, que muestra información sobre el tema de búsqueda desde una amplia gama de recursos directamente en los resultados de búsqueda. Luego mezcla lo que sabe sobre usted de su búsqueda anterior, que puede incluir información sobre
su ubicación, así como los datos de su perfil de Google+ y Gmail, para llegar a su mejor conjetura en lo que está buscando.
Nos hemos acostumbrado a ver en la ciencia ficción durante décadas, una computadora con la que puedes tener una conversación en tu lengua nativa, y que nos responderá precisamente con la información que requerimos.
Sin embargo, la búsqueda no es todo lo que hace Google después de todo, es gratis y Google es una de las empresas más rentables en el planeta. Ese beneficio proviene de lo que obtiene a cambio de sus búsquedas.
Google acumula grandes cantidades de datos sobre las personas que lo usan, esencialmente empareja empresas con clientes potenciales a través de su algoritmo Adsense. Las empresas pagan generosamente para estas introducciones que aparecen como anuncios en los navegadores de los clientes.
En 2010 lanzó BigQuery, su servicio comercial para permitir a las empresas almacenar y analizar grandes conjuntos de datos en sus plataformas en la nube, las empresas pagan por el espacio de almacenamiento y el tiempo de la computadora en que se va ejecutando las consultas.

Otro proyecto de big data en el que Google está trabajando es el auto-manejo de coche. Usa grandes cantidades de datos, sensores, cámaras, dispositivos de rastreo y reales análisis de datos a tiempo real de Google Maps, Streetview y otras fuentes.

Esto permite que el auto de Google conduzca de manera segura en las carreteras sin ninguna entrada
de un conductor humano.
En 2008 la empresa publicó un artículo en la revista científica Nature afirmando que su tecnología tenía la capacidad de detectar brotes de la gripe con más precisión que las técnicas médicas actuales para detectar la propagación de epidemias.
Los resultados fueron controvertidos, el debate continúa sobre la precisión de las predicciones, pero el incidente reveló la posibilidad de “multitud predicción”, que en mi opinión es probable que sea una realidad en el futuro a medida que la analítica se vuelve más sofisticada.
Es posible que Google todavía no esté listo para predecir el futuro, pero su posición como jugador principal e innovador en el espacio de Big Data no esta lejano.