原文内容,附发布会中文字幕视频
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦
OpenAI于12月5日开始,举行了为期12天的系列发布活动,期间每天发布一个产品或样品,涵盖了一系列创新技术,包括备受期待的AI视频生成工具Sora和新的推理模型。本文将为您详细介绍这12天的发布会每日的发布内容和相关亮点信息。
🚀 快速阅读
- Day1:最强推理模型 o1 满血版及其Pro版本上线,推出ChatGPT Pro订阅服务。
- Day2:发布强化微调技术,支持少量数据训练。
- Day3:Sora正式版和Sora Turbo上线,支持高清视频生成。
- Day4:ChatGPT Canvas全面开放,提供人+AI协作模式。
- Day5:ChatGPT正式集成到Apple Intelligence,支持Siri使用。
- Day6:ChatGPT高级语音模式增强,加入视频输入和屏幕共享功能。
- Day7:推出Projects功能,支持项目管理和协作。
- Day8:ChatGPT Search全面升级,免费开放。
- Day9:o1推理模型开放API,成本下降60%。
- Day10:通过电话和WhatsApp使用ChatGPT,降低使用门槛。
- Day11:ChatGPT与Mac应用深度集成,支持编程和写作。
- Day12:推出高性能AI推理模型o3及其轻量级版本o3 Mini。
正文
Day1:o1满血版上线,ChatGPT Pro订阅服务
第一天的发布会上正式推出了最强推理模型 o1 满血版及其Pro版本。模型比之前的 o1-preview 版本更加完备,性能提升了34%,错误率降低了34%。且支持多模态输入。
同时,OpenAI推出了ChatGPT Pro订阅服务,价格为每月200美元,提供无限制访问o1和专业版o1。
亮点分析:
- 基础版:适用于日常使用,功能强大、反应迅速。
- 多模态能力增强:处理文本和图像的能力大幅提升,支持图像内容分析和相关问题解答。
- 语言理解能力提升:更准确捕捉语言细节和上下文,文本生成、翻译和摘要表现更加流畅自然。
- 错误率降低:比起预览版,错误率降低了35%,生成内容更加准确可靠。
- 响应速度提升:速度提升50%,减少用户等待时间,带来更流畅的使用体验。
- Pro 版本:面向对AI性能要求更高的专业用户,强大而精确。
- 深度推理能力:可处理复杂的数学和科学问题,支持多步推理和专业计算,思考时间约1-3分钟。
- 专业领域知识:在科学、数学、编程等领域表现出色,提供专业、准确的解答。
- 长文本处理能力:支持更长的文本输入和输出,轻松应对长文档处理与内容生成。
- 自定义能力:提供更多微调选项,用户可根据自身需求进行个性化定制。
Day2:强化微调(ReinforcementFine-Tuning)
第二天的发布会上,介绍了强化微调技术。这是一种新的模型训练方法,支持用户使用少量的训练数据在特定领域创建专家模型。
强化微调通过强化学习算法优化模型的输出,使其更符合用户的预期。强化微调预计要到2025年春季才开放给用户。
亮点分析:
- 少量数据训练:使用极少的样本就能让模型学习到新的推理方式。
- 强化学习算法:根据用户提供的评分机制不断优化模型的输出。
- 适用于复杂任务:特别适合需要深入专业知识的领域,如法律、金融、医疗等。
Day3:Sora正式版登场
在第三天的发布会上,OpenAI推出了 Sora 正式版和新版本 Sora Turbo。Sora是一个视频生成工具,可以根据文本描述生成连贯、逼真的视频内容。
Sora支持生成高达1080p分辨率、最长20秒的视频,支持多种视频比例,提供了多种视频编辑功能。现阶段,Sora仅面向ChatGPTPlus和Pro用户开放,Plus用户每月有50条视频生成配额,Pro用户则高达5000条。
亮点分析:
- 故事板功能:用户通过时间线指导视频中多个动作,创作复杂视频序列。
- 多种视频编辑功能:包括Remix、Re-cut、Storyboard等,增强创作的逻辑性和流畅度。
- 视频混合:支持将两个视频场景合并为一个全新场景,生成具有创意的新内容。
- 高分辨率和时长支持:支持生成1080p分辨率和最长20秒的视频。
Day4:ChatGPT Canvas全面开放,人+AI协作模式启动
第四天的发布会上,OpenAI宣布Canvas功能全面开放。从聊天工具升级为生产力工具,Canvas支持用户与ChatGPT在写作和编程方面进行协作,提供了一个共享画布,用户和ChatGPT可以共同编辑文档和代码。
亮点分析:
- 写作和编程协作:用户可以与ChatGPT共同完成写作和编码项目。
- 支持Python代码运行:Canvas内置了几乎所有常用的Python库,可以在编写代码时与AI实时协作。
- 图片识别:Canvas支持图片识别,用户可以上传图片并生成相关的文本内容。
- Canvas:提供写作、审稿、编码和图片识别的协作功能。
Day5:OpenAI与苹果合作,ChatGPT集成到Apple Intelligence
第五天的发布会上,OpenAI宣布ChatGPT正式集成到Apple Intelligence。意味着iPhone、iPad和Mac用户可以通过Siri使用ChatGPT的功能。
亮点分析:
- Siri支持:用户可以通过Siri语音命令完成更复杂的任务。
- 写作工具升级:苹果的智能写作工具将引入ChatGPT能力。
- 视觉智能能力:用户可以利用搜索功能快速识别眼前物品。
- ChatGPT集成:在iOS,iPadOS,MacOS生态系统中提供ChatGPT的智能支持。
Day6:OpenAI版「Her」上线,高级语音模型增强
第六天的发布会上,OpenAI为 ChatGPT 的高级语音模式带来了视频输入和实时屏幕共享功能。使ChatGPT能“看到”用户和周围环境,基于这些视觉信息来更好地理解用户的指令和问题。
高级语音模式使用多模态4o模型,可直接输入音频并输出音频,支持语言超过50种,面向移动端用户,Plus和Pro订阅用户开放。
亮点分析:
- 视频输入功能:ChatGPT的高级语音模式加入了视频输入功能,使其能够“看到”用户。
- 屏幕共享功能:ChatGPT可以通过屏幕共享功能,帮助用户回复消息、辅助工作和学习等场景。
- 圣诞老人虚拟角色:用户可以通过高级语音模式与“圣诞老人”进行视频或语音通话。
Day7:ChatGPT发布 Projects 功能
第七天的发布会上,OpenAI推出了 Projects 新功能。支持用户将相关资料、文件、聊天记录等信息集中到一个“Project”中,支持项目管理与写作、文件与数据管理、个性化定制等场景。
整合Canvas和ChatGPT Search,面向ChatGPTPlus/Pro用户开放,计划于明年初向企业和教育用户提供。
亮点分析:
- 项目管理:用户可以创建项目,上传文件,设定个性化指令。
- Canvas和ChatGPT Search集成:Projects功能整合了Canvas和网络搜索能力。
- 多步骤任务执行:为未来执行多步骤任务奠定了基础。
- Projects:支持用户上传文件、设置自定义指令、分组聊天和数据等。
Day8:ChatGPT Search全面升级,免费开放
第8天的发布会上,OpenAI 展示了 ChatGPT Search 最新搜索功能,基于GPT-4o模型的微调版本。功能通过与第三方搜索提供商及ChatGPT的合作伙伴直接提供的内容相结合,用户能快速并准确地获取所需信息。
新增的可搜索信息包括最新体育比分、新闻、股票报价等实时信息。用户可以通过指向相关网络资源的链接获得快速、及时的答案。
亮点分析:
- 搜索性能提升:搜索速度更快,移动端体验更好,加入了地图体验。
- 语音搜索整合:用户可以通过语音对话获取实时网络信息。
- 全球免费开放:搜索功能向全球所有登录用户免费开放。
- 对话式搜索:ChatGPT能够保持对话上下文、理解用户意图。
Day9:o1推理模型开放 API,成本暴降60%
第9天的发布会上,OpenAI 宣布了o1模型正式推出API,成本降低60%,可定制升级,新增函数调用,开发者消息和图像分析等功能。是一次重要的技术升级。
新模型不仅变得更聪明,还能更快地回应用户需求。实时API进行了全面升级,包括引入WebRTC支持,降低价格以及更灵活的响应控制。
亮点分析:
- o1模型API:正式推出满血版o1模型API,支持功能调用、开发者消息、Structured Outputs以及视觉识别等功能。
- 实时API升级:集成简单的WebRTC功能,GPT-4o音频价格下调60%。
- 偏好微调:推出基于直接偏好优化(DPO)算法的偏好微调功能。
- 多语言SDK支持:开放Go和Java SDK测试版,支持多种编程语言。
- 性能提升:o1模型在多个领域展现出了优秀的表现,如编程能力测试中达到76.6%的高分。
Day10:通过电话和WhatsApp使用ChatGPT
第10天的发布会上,OpenAI 介绍了通过电话和WhatsApp使用ChatGPT的新功能,极大地降低了使用门槛。
这一更新意味着用户可以通过最基础的电话功能或WhatsApp与最先进的AI进行对话,号码是1-800-CHAT-GPT,或者是1-800-242-8478。支持智能手机,老人机和座机等设备。
亮点分析:
- 电话接入:用户可以通过拨打1-800-CHAT-GPT与ChatGPT进行语音对话。
- WhatsApp集成:全球用户可以在WhatsApp上给ChatGPT发消息,提供服务的模型是4o-mini。
- 简单易用:不需要注册账号,不需要记住密码,只需要像打电话一样简单操作。
- 跨设备支持:从最新款的iPhone到老式的翻盖机,都能直接和AI对话。
- 多语言支持:ChatGPT能够提供多语言服务,如教用户用西班牙语交流。
Day11:ChatGPT与Mac应用深度集成
第11天的直播中宣布了ChatGPT与Mac应用的深度集成,特别在编程和写作方面进行了更新。现在,用户可以通过简单的复制粘贴操作,与Warp、XCode等应用协同工作,无需详细交流即可执行任务。
此外,ChatGPT还支持在语音模式下与Notion、Apple Notes等应用协同工作。这些新功能已在Mac最新版ChatGPT应用中推出,而Windows用户还需等待。
亮点分析:
- 桌面应用全新升级:ChatGPT 桌面应用支持与多种应用程序协同工作,包括开发工具和文档编辑工具。通过 ChatGPT 分析 Git 提交数据并生成可视化图表。
- 实时演示与 Warp 终端、Xcode IDE 的智能协作:展示了 ChatGPT 如何与开发环境无缝协作,为编程任务提供实时支持。在 Xcode 中实现代码自动补全和功能添加。
- 对 Notion、Apple Notes、Quip 等写作工具的支持:这些功能现已在 Mac 桌面应用上线,Windows用户需等待。
- 高级语音交互模式:通过语音模式与 ChatGPT 交谈,提供了更加自然和高效的体验。
- 搜索辅助功能:确保输出信息的准确性,结合搜索功能来优化写作内容。
Day12:o3 压轴登场!推理成本是 o1 的2000倍
第12天的发布活动中,OpenAI正式推出了其最新的高性能AI推理模型o3,以及它的轻量级版本o3 Mini。
这两款新模型展示了前所未有的数学推理能力、编程效率以及科学问题解决能力,其中o3更是在多个专业领域超越了人类专家的表现。
亮点分析:
- 顶级数学解决能力:o3在解决复杂的数学问题上展现出了惊人的准确率,如在美国AIME数学竞赛中的得分高达96.7%,远超大多数参赛者。对于概率、几何等方面的问题同样处理得当。
- 优秀的编程辅助工具:根据测试,o3能够在CodeForces平台上达到2727的ELO分数,这不仅表明它有很强的编程能力和代码生成能力,还意味着它可以有效辅助开发者优化程序结构。
- 科学研究的强大助力:GPQA结果显示o3能够以87.7%的准确率解决科学相关问题,这一成绩比专业研究人员高出许多,显示了它在科研领域的巨大潜力。
- 高透明度的推理机制:不同于以往的模型,o3能向用户清晰地展示其思考过程及依据,让结果更加可信、易于理解。
- 强大的多模态处理能力:o3不仅擅长处理文本信息,还能有效处理图像数据,使得它在视觉推理等跨模式的应用中具有优势。
- 轻量级选择o3 Mini:对于计算资源有限的情况,o3 Mini提供了另一种解决方案。它依旧保留了关键功能如函数调用和支持结构化输出等,但占用资源更少,成本更低。
资源
- 官方博客:<https://openai.com/blog>
- GitHub 仓库:<https://github.com/openai>
- 官方文档:<https://platform.openai.com/docs>
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦