Google DeepMind, IA que aprende sola

Google DeepMind, IA que aprende sola

Google DeepMind, inteligencia artificial

Google DeepMind es una compañía de inteligencia artificial inglesa. Creada en 2010 como Tecnologías DeepMind, fue adquirida por Google en 2014. DeepMind ha creado una red neuronal que aprende cómo jugar a los videojuegos de una manera similar a la de los seres humanos, una red neuronal que puede ser capaz de acceder a una memoria externa como una máquina Turing, lo que resulta en una computadora que imita la memoria a corto plazo del cerebro humano. La que perdía Dory en “Buscando a Nemo”

En 2016 la compañía genero mucha publicidad después de que su programa AlphaGo derrotó a un jugador humano profesional de Go por primera vez.

La start-up fue creado 2010 por Demis Hassabis, Shane Legg y Mustafa Suleyman. Hassabis y Legg se conocieron por primera vez en UCL en la Unidad de Neurociencia Computacional Gatsby. Desde entonces las principales firmas de capital de riesgo Horizons Ventures y Founders Fund han invertido en ella, así como Scott Banister, Jaan Tallinn fue de los primeros inversionistas y consejeros de la compañía.

DeepMind recibió el premio de la "Compañía del año" por el Laboratorio de Computación de Cambridge en el 2010. La compañía creó una red neuronal que puede ser capaz de acceder a la memoria externa como una máquina de Turing, resultando en una computadora que parece imitar posiblemente la memoria a corto plazo del cerebro humano

Una máquina de Turing es un dispositivo que manipula símbolos sobre una tira de cinta de acuerdo a una tabla de reglas. Una máquina de Turing puede ser adaptada para simular la lógica de cualquier algoritmo de computador.


Maquina de Turing

Google adquiere DeepMind

El 26 de enero de 2014, Google anunció​ adquirir Tecnologías DeepMind. La adquisición tuvo lugar después de que Facebook terminara negocios con Tecnologías DeepMind en 2013. Después la compañía fue renombrada a Google DeepMind. Una de las condiciones de DeepMind para Google era que establecieran un comité de Ética de la inteligencia artificial.

El 4 de diciembre de 2017, el equipo de DeepMind logró un gran avance al derrotar el módulo AlphaZero a Stockfish 8 en una serie de cien partidas, la mitad jugando con blancas y la mitad con negras. El resultado fue que ganó 28 e hicieron tablas en 72, no perdiendo ninguna. Para lograrlo, tan solo ha necesitado conocer las reglas del juego y 4 horas de entrenamiento jugando contra sí mismo. ​ En 2017, StockFish 8 era el campeón vigente del campeonato mundial de ajedrez por computadora, con un ELO de 3400 puntos. 

AlphaZero vs StockFish

El objetivo de Tecnologías DeepMind es "resolver inteligencia", la cual están tratando de lograr mediante la combinación de " Las mejores técnicas de Aprendizaje automático y Neurociencia de sistemas para construir potentes algoritmos de aprendizaje de propósito general". 

"El intento de destilar inteligencia en una construcción algorítmica puede llegar a ser el mejor camino para la comprensión de algunos de los misterios perdurables de nuestra mente."

Actualmente el enfoque de la compañía está en publicar investigaciones en sistemas computacionales que son capaces de jugar juegos, y desarrollar estos sistemas, que van desde juegos como Go, hasta juegos de arcade. De acuerdo con Shane Legg la inteligencia a un nivel humano en una máquina puede ser lograda " cuando una máquina pueda jugar un rango amplio de juegos desde la percepción de corriente de entrada y salida, y transferir conocimiento a través de los juegos[...]." La investigación describe una IA jugando 7 juegos diferentes en Atari (Pong, Breakout, Space Invaders, Seaquest, Beamrider, Enduro, y Q*bert).

Aprendizaje profundo

A diferencia de otras IA, como Deep Blue o Watson de IBM, las cuales fueron desarrolladas para un propósito predefinido y solo funcionan dentro de su ámbito, DeepMind dice que sus sistemas no están pre-programados: aprenden de la experiencia. Prueban el sistema en videojuegos, en especial en juegos arcade, como Space Invaders o Breakout.​ Sin alterar el código, el IA empieza a entender como jugar el juego, y después de jugar varias veces, en algunos juegos (especialmente en Breakout), tiene una mayor eficiencia al jugar que cualquier humano. Para la mayoría de los juegos (por ejemplo, Space Invaders, Ms Pacman, Q*Bert), DeepMind jugó por debajo del actual récord mundial. La aplicación del IA de DeepMind para videojuegos es actualmente para juegos que se crearon en los setentas y en los ochentas, con el trabajo que se realiza en juegos más complejos en 3D como Doom, el cual apareció por primera vez al principio de los años noventa.

AlphaZero es un programa informático desarrollado por DeepMind, que utiliza el enfoque generalizado de AlphaGo Zero. El 5 de diciembre de 2017, el equipo de DeepMind lanzó una preimpresión presentando AlphaZero, que logró en 24 horas un nivel de juego sobrehumano en ajedrez, shogi y Go al derrotar a los campeones del mundo, Stockfish, Elmo y la versión de 3 días de AlphaGo Zero en cada caso. AlphaZero dominó a Stockfish después de solo 4 horas de autoaprendizaje, sin acceso a libros de apertura o base de datos de tablas de finales. 

Google DeepMind

Comentarios

Entradas populares de este blog

"Algo que tienes, algo que sabes y algo que eres"

Realidad virtual para el gimnasio

Casas inteligentes, que es la domótica?