Google pone en marcha un equipo para construir una IA que simule el mundo físico
Google está creando un nuevo equipo de trabajo que se encargará de desarrollar modelos de inteligencia artificial (IA) capaces de simular el mundo físico. Tim Brooks, que fue uno de los cabecillas del generador de vídeos Sora en OpenAI y que migró a Google DeepMind en octubre de 2024, es el líder de este proyecto que todavía está en pañales, pero promete grandes cosas.
Llevamos varios años en los que la IA se ha convertido en el tema central cuando hablamos de tecnología. Aunque son muchas las empresas que se han sumado a esta tendencia, Google ha conseguido situarse entre las que lideran el sector. Sin embargo, a la marca no le basta con lo que ha lanzado y está desarrollando y busca a profesionales que sean capaces de crear la IA del futuro, capaz de entender el mundo real. Brooks lidera estos planes de Google y ha compartido una página web para que expertos en el área se postulen para trabajar en su equipo:
«DeepMind tiene planes ambiciosos para crear modelos generativos masivos que simulen el mundo. Estoy contratando a un nuevo equipo con esta misión. ¡Ven a construir con nosotros!»
Tim Brooks@_tim_brooksDeepMind has ambitious plans to make massive generative models that simulate the world. I’m hiring for a new team with this mission. Come build with us!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl
Research Engineer, World ModelingDe boards.greenhouse.io06 de enero, 2025 • 18:57
2K
53
Lo que Google DeepMind busca para su equipo de IA
Las ofertas de trabajo que Brooks ha compartido invitan a ingenieros especializados a colaborar con distintos equipos de inteligencia artificial que ya están en la empresa como:
- Gemini. Es un modelo de lenguaje grande multimodal que sirve como sucesor de LaMDA y PaLM.
- Veo. Es un modelo de IA que permite generar vídeo a partir de texto.
- Genie. Es una herramienta de IA capaz de crear entornos interactivos jugables, muy interesante para desarrolladores de videojuegos.
En la página web compartida, invitan a profesionales en IA a unirse al proyecto «para crear modelos generativos que simulen el mundo físico». Google DeepMind cree que «la ampliación del preentrenamiento en vídeo y datos multimodales es un paso fundamental hacia la inteligencia artificial general» y pretende ampliar las capacidades de los equipos de Gemini, Veo y Genie a través del trabajo de un nuevo equipo que colaborará con ellos.
Requisitos para ser científico investigador en Google DeepMind
Google señala que buscan «personas a las que les apasionen los modelos del mundo y que crean que aprender de los datos del mundo físico es crucial para la inteligencia». Los requisitos que piden para pasar a ser un científico investigador en Google DeepMind son:
- Experiencia con modelos de transformadores a gran escala y/o canalizaciones de datos a gran escala.
- Maestría o doctorado en ciencias de la computación o aprendizaje automático, o experiencia equivalente en la industria.
- Historial de lanzamientos, publicaciones y/o proyectos de código abierto relacionados con la generación de vídeo, modelos mundiales, modelos de lenguaje multimodal o arquitecturas de transformadores.
- Sólidas habilidades en sistemas e ingeniería en marcos de aprendizaje profundo como JAX o PyTorch.
Además, Google DeepMind valora positivamente que el que solicite formar parte del equipo tenga experiencia «en la creación de bases de código de capacitación para transformadores multimodales o de vídeo a gran escala» y/o «en optimizar la eficiencia de sistemas de entretenimiento distribuido y/o sistemas de inferencia».
Las tareas de las que se encargarán en Google DeepMind
Con el objetivo de construir modelos generativos del mundo físico, los expertos que manden su solicitud de empleo deberán estar comprometidos a realizar las siguientes tareas:
- Implementar la infraestructura básica.
- Realizar investigaciones para construir modelos generativos del mundo físico.
- Resolver problemas esenciales para entrenar simuladores del mundo a gran escala.
- Desarrollar métricas y leyes de escalamiento para la inteligencia física.
- Seleccionar y anotar datos de entrenamiento.
- Permitir la generación interactiva en tiempo real.
- Estudiar la integración de modelos del mundo con modelos de lenguaje multimodal.
- Aceptar la amarga lección y buscar métodos simples que se puedan escalar, con énfasis en sistemas e infraestructuras sólidos.
En el sitio web que Brooks ha facilitado, indican que el rango salarial base en EEUU para este puesto de tiempo completo sería de entre 136.000 y 245.000 dólares. A este sueldo, habría que sumarle bonificaciones, acciones y beneficios.