0 o1 System Card
更新后的OpenAI o1 System Card在以往的安全工作基础上进一步优化,重点介绍了稳健性评估、红队测试见解以及安全性改进。
https://openai.com/index/openai-o1-system-card/
1 Introducing ChatGPT Pro
拓展前沿人工智能的应用
01和01 Pro模式发布:
- OpenAI发布01模型的完整版本,智能程度更高、速度更快,并且支持多模态(可同时处理文本和图像)
- 面向ChatGPT Pro用户的01 Pro模式提供更强大的计算能力,用于解决数学、编程和科学等复杂问题
增强功能和性能:
- 01比早期预览版本准确率提高34%,速度提升50%,解决了用户反馈的响应速度慢的问题
- 改进包括更好的多模态输入能力、减少错误率,以及在简单和复杂查询上的更快性能
ChatGPT Pro套餐推出:
- 针对高级用户,Pro套餐以每月200美元的价格提供无限制的模型访问、高级语音功能和01 Pro模式
- 着重于为技术性和高要求工作流程提供可靠性和高性能
功能演示:
- 展示了01在解决历史查询、多模态推理和模糊物理问题等复杂任务的能力
- 突出展示了Pro模式在高级化学场景中的增强问题解决能力,提供显著的计算能力
未来计划和开发者工具:
- OpenAI正在开发API集成、结构化输出、网页浏览、文件上传和函数调用等开发者工具
- 承诺在OpenAI 12天活动期间为Pro用户和开发者提供更多功能和持续改进
2 OpenAI's Reinforcement Fine-Tuning Research Program
- 强化学习微调(RFT)概述: OpenAI推出了一种新的模型定制方法,称为强化学习微调(RFT)。与标准微调不同,RFT通过强化正确的推理路径并抑制错误路径,使模型能够以新的方式进行推理,从而创建针对特定领域的专家模型。
- 应用和示例: RFT具有广泛的应用,特别是在需要深度专业知识的领域,如法律、金融、保险和医疗保健。一个突出的例子是通过分析症状和基因突变的精选数据集,对O1 Mini模型进行微调以协助诊断罕见遗传疾病。
- 定制工作流程: 用户提供训练数据集和评分工具(打分器),而OpenAI负责微调过程。评分工具将模型输出与正确答案进行比较,分配分数来指导强化学习。
- 性能提升: RFT提升了模型的推理能力,这一点通过微调后的O1 Mini在特定任务上超越更大的O1模型得到证明,例如在对疾病最可能相关基因的排序方面。
- 可访问性和未来计划: RFT目前处于预览阶段,计划明年向公众发布,并为高校、研究人员和企业提供早期访问权限。OpenAI计划扩展评分工具选项,并支持自定义评分器定义,以实现更广泛的适应性。
3 Sora
以各种格式创建视频,从文本生成新内容,或增强、重混和混合您自己的素材。
Sora已经到来,我们正将视频生成模型从研究预览阶段推向正式发布。
Sora系统说明:Sora建立在DALL-E和GPT模型的经验基础上,旨在为人们提供扩展的讲故事和创意表达工具。
Sora视频产品发布: OpenAI推出了突破性的视频生成工具Sora,旨在促进创意协作和推进AI能力。该产品已集成到ChatGPT Plus Pro账户中,无需额外费用。
主要特点和功能:
- 可以从文本生成视频、制作图像动画、重混风格、延长片段等
- 支持从480p到1080p的分辨率,视频时长从5秒到20秒
- 包含"重混"(用于创意变体)、"故事板"(用于动作排序)和"重剪"(用于编辑和扩展视频)等工具
创意社区和探索:
- "探索"功能展示社区生成的视频以供灵感,包括详细的复制方法
- 预设和宽高比选项让用户轻松定制创作
高级AI发展目标:
- Sora通过使AI能够理解和生成视频,扩展超越文本交互,为OpenAI的AGI路线图做出贡献
- 增强讲故事能力,支持休闲和高级创作者
实时演示:
- 团队展示了Sora的多功能性,包括创建如沙漠中的猛犸象、将其转变为机器人,以及从上传图像生成视频等场景
- 循环和优化视频等功能展示了Sora在创意工作流程中的潜力
Sora概述与基本功能
Sora是OpenAI开发的视频生成模型,具有以下核心特点:
- 可接受文本、图像和视频输入,生成全新的视频输出
- 支持生成1080p分辨率、最长20秒的视频
- 用户可以浏览精选和最新内容源,获取创作灵感
- 基于DALL·E和GPT模型的技术积累
- 采用扩散模型技术,通过逐步去噪生成视频
- 使用Transformer架构实现更好的扩展性能
技术实现
- 采用"视觉片段"(visual patches)作为基本单位,类似语言模型使用token
- 训练数据来源广泛,包括:
- 公开数据集
- 专有合作伙伴数据
- 内部开发的定制数据集
- 人类反馈数据
安全措施
主要包括三层防护:
- 技术层面:
- 多模态内容审核
- 自定义LLM过滤
- 输出分类器
- 内容黑名单
- 政策层面:
- 18岁以上年龄限制
- 禁止未经授权使用他人肖像
- 禁止生成违法和有害内容
- 完善的内容举报机制
- 特定风险领域:
- 儿童安全保护
- 色情内容过滤
- 虚假信息防范
- 艺术家风格保护
未来发展
OpenAI计划在以下方面持续改进Sora:
- 肖像生成试点项目
- 增强内容溯源能力
- 提升输出的代表性和包容性
- 持续完善安全标准和政策
这个系统展现了OpenAI在推进AI视频生成技术的同时,也非常重视安全和负责任的部署策略。
4 Canvas
Canvas允许用户在一个协作环境中进行写作和编码,并通过ChatGPT提供帮助。探索Canvas的所有可能性,这是我们在去年十月推出的一个与ChatGPT协作编写和编程的界面。主要新功能包括:
关键点
- 推出Canvas供所有用户使用,将其集成到主要ChatGPT模型中
- 能够在Canvas内直接运行Python代码,并获得即时反馈
- 新增并排视图,方便协作和编辑
- 功能包括对文章进行评论,以及利用ChatGPT调试代码
- 自定义GPT现在也可利用Canvas提升功能
https://openai.com/index/introducing-canvas/
5 ChatGPT in Apple Intelligence
OpenAI 公开发布了 ChatGPT 在 iOS 和 macOS 上的集成功能,使用户可以直接通过 Siri 访问 ChatGPT。新功能增强了 ChatGPT 的可访问性和可用性,用户可以使用 ChatGPT 执行各种任务,如创作和总结文档。此外,视觉智能功能还允许用户通过 iPhone 上的相机输入来了解物体信息。这些新功能增强了跨设备的无缝交互,提高了生产力和创造力。
关键要点
- 苹果公司推出了 ChatGPT 在 iOS 和 macOS 上的集成,增强了可访问性
- 用户可以通过 Siri 直接调用 ChatGPT 进行各种任务
- 写作工具允许用户使用 ChatGPT 创作和总结文档
- 视觉智能功能使用户能够通过 iPhone 相机输入了解物体信息
- 增强的功能允许跨设备的无缝交互,提高了生产力和创造力
6 Advanced voice with video & Santa mode
OpenAI发布了新的"圣诞老人模式"和高级语音功能,包括视频和屏幕共享。这些新功能对于视力受损的用户来说是一个重大突破,可以增强他们的可访问性。用户普遍对这些新功能感到兴奋和赞赏。
关键要点
- OpenAI发布了新的"圣诞老人模式"和高级语音功能,包括视频和屏幕共享
- 这些新功能对于视力受损的用户来说是一个重大突破,可以增强他们的可访问性
- 用户普遍对这些新功能感到兴奋和赞赏
7 Projects in ChatGPT
- 推出"Projects"功能,可以帮助用户在 ChatGPT 中组织和管理对话。
- "Projects"功能可以用于管理Home Maintenance、个人网站开发等任务。
- "Projects"功能目前正在逐步推广至 OpenAI 的付费用户。
8 Search
一段展示SearchGPT如何直接回答问题的视频,它能提供来自网络的最新信息,同时提供清晰的相关来源链接。探索ChatGPT搜索的潜力,这是一种在2024年10月首次亮相的快速获取相关网络来源答案的方式。
- OpenAI推出ChatGPT搜索功能已有两个月,为ChatGPT提供了访问实时信息和网络搜索的能力
- 新功能包含三个方面:支持多语言、提高结果质量和创建个性化搜索体验
- ChatGPT搜索功能对于用户日常使用来说非常有用,这个功能将向所有用户开放
https://openai.com/index/introducing-chatgpt-search/
9 Holiday treats for developers
OpenAI o1 和开发人员的新工具 介绍 OpenAI o1、实时 API 改进、一种新的微调方法以及更多内容。
- 会议亮点:OpenAI 的 API 成功,全球有 200 万开发者。
- 00:29 🎁 OpenAI 01 正式发布,具备函数调用、结构化输出、开发者消息和视觉输入功能。
- 02:47 🛠️ 演示展示了使用新 API 功能(如视觉和结构化输出)进行税务表单错误检测。
- 08:13 🧪 评估显示,OpenAI 01 在函数调用、结构化输出和编码任务上超越了 GPT-4。
- 09:33 🚀 OpenAI 01 更快且更高效,使用的 token 数量减少了 60%。
- 10:15 🔊 实时 API 现已支持 WebRTC,提高了延迟、音质,并减少了复杂性。
- 15:29 💰 音频 token 成本下降 60%,同时宣布支持 GPT-4 Mini。
- 16:13 🎨 偏好微调改善了模型与用户偏好的对齐,提升了性能。
- 20:30 💻 新的 Go 和 Java SDK 简化了开发者的集成过程。
- 21:52 🤝 启动了 AMA(问我任何事)环节,供开发者进行实时问答。
https://openai.com/index/o1-and-new-tools-for-developers/
10 1-800-CHATGPT
直播展示了通过电话和WhatsApp与ChatGPT互动的新功能,包括语音对话、实时翻译和个性化食谱推荐,进一步降低了使用AI的门槛并提升了便利性。
11 Work with apps
视频介绍了OpenAI的桌面应用程序升级,包括支持多种应用和语音模式,展示了如何通过ChatGPT提高写作和编码效率,所有新功能现已上线。
- 本视频介绍了OpenAI桌面应用程序的最新进展,强调了其强大的功能和未来方向。
- Kevin介绍了自己以及今天的主题,显示出对与会者的尊重和感激。
- OpenAI在桌面应用方面的努力,包括Mac和Windows版本的推出,展示了其产品的不断进化。
- ChatGPT的能力正在增强,不仅限于问答,还将开始为用户自动执行任务,提升用户体验。
- 团队介绍了即将发布的新功能,强调桌面应用的优势,能够提供比浏览器更丰富的功能。
- 本视频介绍了如何使用ChatGPT与应用程序进行交互,并展示了Warp应用程序生成数据图表的过程。
- 强调用户在使用ChatGPT时始终保持对共享内容的控制。
- 感谢Warp团队的支持,说明在应用程序合作时的初步挑战与进展
- 演示如何通过ChatGPT生成命令以获取过去两个月的提交次数。
- 展示如何请求生成节日主题的条形图,体现与其他功能的协同工作。
- 讨论高级数据分析功能如何与ChatGPT结合,为用户提供更强大的数据处理能力。
本视频展示了如何使用应用程序的文本字段功能,并通过集成ChatGPT来增强应用的实时更新能力:
- 介绍了文本字段的功能,包括其行数和内容展示
- 提到目前的应用程序没有实时更新功能,计划通过ChatGPT添加此功能
- 讨论了使用新模型01来解决复杂的编码问题,并展示了如何给模型输入提示
- 展示了模型快速生成代码的能力以及其思考过程。
本视频展示了如何使用多种应用程序,并介绍了新功能和支持的IDE:
- 讨论尝试重新运行代码,并提到使用的IDE和其他支持的IDE
- 表达对Matlab支持的兴奋,认为这对学生很有帮助
- 成功运行代码后,分享了使用ChatGPT的写作帮助,并宣布对新应用程序的支持。
本视频展示了如何将ChatGPT与Notion结合使用,来增强文档编写和研究的效率:
- 介绍了如何让ChatGPT直接与Notion协作,增强文档的上下文理解
- 强调了文档的事实准确性,并展示了如何通过搜索功能确保信息的可靠性
- 通过调整ChatGPT的风格,使生成的内容与作者的语气一致,提升了文本的连贯性
- 视频最后展示了如何将生成的内容复制回Notion,并提到后续的迭代过程。
在这段视频中,用户通过语音与虚拟助手圣诞老人互动,讨论节日歌曲的选择和推荐,同时介绍了新推出的语音模式功能:
- 用户开始使用新的语音模式,与圣诞老人进行互动
- 用户询问圣诞老人关于节日歌曲的推荐,特别是想替换掉一首歌曲
- 用户希望找到更有活力的歌曲来让大家跳舞,并与圣诞老人讨论替换的选项
- 视频最后提到新功能已经上线,并鼓励用户更新应用以获得最新体验
12 o3 preview & call for safety researchers
深思熟虑的对齐:推理能力让语言模型更安全。介绍我们针对o系列模型的新对齐策略,这些模型直接学习安全规范并对其进行推理。
OpenAI发布宣布推出新版O3和O3-mini模型,O3在多项基准测试如编程、数学和ARC AGI测试中都表现卓越。