关键信息:
- 数学模型如NuminaMath和Mathstral。
- NuminaMath获得AIMO一等进步奖,模型与数据都开源
- 小型模型在手机上的性能越来越好。
- Agents和Function Calling在大型语言模型(LLM)中越来越流行。
- 多模态模型,特别是在图像+文本领域和音频领域,CogVLM2、InternVL 2.0
- 无需OCR或分割即可获得文档良好嵌入的视觉嵌入模型。
- 文本到图像的技术有新的玩家加入,如Anole、Fal和腾讯。
- 开源大模型越来越强,Meta的Llama 3.1 405B,以及Mistral Large 2(代码生成、数学和推理方面表现出色,与 GPT-4o、Claude 3 Opus 和 Llama 3 405B 等相当)
报告PPT详情: