El equipo de dos personas de Hugging Face está desarrollando modelos de IA similares a ChatGPT

Por: Bohdan Kaminskyi | 09.11.2023, 21:24

Hugging Face

La startup Hugging Face ha formado un equipo H4 de dos desarrolladores para construir chatbots basados en modelos de IA de código abierto.

Esto es lo que sabemos

Según el ingeniero Lewis Tunstall, tras el lanzamiento de ChatGPT, empezaron a experimentar con el uso de bibliotecas y modelos de código abierto para replicar dicha funcionalidad. El objetivo principal de H4 es entrenar modelos para interactuar con humanos.

El equipo ya ha presentado varios modelos lingüísticos perfeccionados, como Zephyr-7B-α y Falcon-40B. Para entrenarlos se está utilizando un clúster de más de 1000 tarjetas gráficas Nvidia A100.

H4 también está investigando técnicas de alineación de modelos y creando herramientas para probarlas.

H4 se mantiene deliberadamente pequeño para ser flexible y adaptarse a los rápidos cambios del panorama de la IA. Para ello, colabora con otros grupos de investigación de Hugging Face.

El equipo pretende potenciar la comunidad de la IA de código abierto liberando código y datos para entrenar modelos de chat. Comercializar su trabajo no es un objetivo de H4, señalaron los desarrolladores.

Fuente: TechCrunch