Learn languages naturally with fresh, real content!

Explore By Region

AI startup Galileo Technologies ranks Claude 3.5 Sonnet, Google's Gemini, and Alibaba's Qwen2-72B-Instruct top in the Hallucination Index benchmark. La startup de inteligencia artificial Galileo Technologies clasifica a Claude 3.5 Sonnet, Gemini de Google y Qwen2-72B-Instruct de Alibaba en los primeros puestos del índice de referencia Hallucination Index.

flag AI startup Galileo Technologies has ranked midrange and open-source large language models highly in a new benchmark test, the Hallucination Index. flag La empresa emergente de inteligencia artificial Galileo Technologies ha clasificado en un lugar destacado los modelos de lenguaje grandes, de código abierto y de rango medio en una nueva prueba comparativa, el Índice de Alucinaciones. flag The benchmark, which evaluates 22 leading generative AI models, measured their accuracy across three task collections. flag El punto de referencia, que evalúa 22 modelos líderes de IA generativa, midió su precisión en tres colecciones de tareas. flag Anthropic's Claude 3.5 Sonnet topped the ranking, while Google's Gemini 1.5 Flash performed best on cost. flag Claude 3.5 Sonnet de Anthropic encabezó la clasificación, mientras que Gemini 1.5 Flash de Google obtuvo el mejor desempeño en cuanto a costo. flag Alibaba's Qwen2-72B-Instruct was the top-performing open-source model. flag El Qwen2-72B-Instruct de Alibaba fue el modelo de código abierto de mayor rendimiento.

3 Articles

Articles

SiliconANGLE

SD Times

PYMNTS.com

-- show less --

Popular Topics

Explore By Region

Articles

Further Reading

Popular Topics

Explore By Region

Articles

Further Reading

Related Stories