0 o1 System Card

一文回顾OpenAI系列发布会:从工具到AGI_新功能

更新后的OpenAI o1 System Card在以往的安全工作基础上进一步优化,重点介绍了稳健性评估、红队测试见解以及安全性改进。

https://openai.com/index/openai-o1-system-card/

1 Introducing ChatGPT Pro

一文回顾OpenAI系列发布会:从工具到AGI_新功能_02

拓展前沿人工智能的应用

01和01 Pro模式发布:

  • OpenAI发布01模型的完整版本,智能程度更高、速度更快,并且支持多模态(可同时处理文本和图像)
  • 面向ChatGPT Pro用户的01 Pro模式提供更强大的计算能力,用于解决数学、编程和科学等复杂问题

增强功能和性能:

  • 01比早期预览版本准确率提高34%,速度提升50%,解决了用户反馈的响应速度慢的问题
  • 改进包括更好的多模态输入能力、减少错误率,以及在简单和复杂查询上的更快性能

ChatGPT Pro套餐推出:

  • 针对高级用户,Pro套餐以每月200美元的价格提供无限制的模型访问、高级语音功能和01 Pro模式
  • 着重于为技术性和高要求工作流程提供可靠性和高性能

功能演示:

  • 展示了01在解决历史查询、多模态推理和模糊物理问题等复杂任务的能力
  • 突出展示了Pro模式在高级化学场景中的增强问题解决能力,提供显著的计算能力

未来计划和开发者工具:

  • OpenAI正在开发API集成、结构化输出、网页浏览、文件上传和函数调用等开发者工具
  • 承诺在OpenAI 12天活动期间为Pro用户和开发者提供更多功能和持续改进

2 OpenAI's Reinforcement Fine-Tuning Research Program

  • 强化学习微调(RFT)概述: OpenAI推出了一种新的模型定制方法,称为强化学习微调(RFT)。与标准微调不同,RFT通过强化正确的推理路径并抑制错误路径,使模型能够以新的方式进行推理,从而创建针对特定领域的专家模型。
  • 应用和示例: RFT具有广泛的应用,特别是在需要深度专业知识的领域,如法律、金融、保险和医疗保健。一个突出的例子是通过分析症状和基因突变的精选数据集,对O1 Mini模型进行微调以协助诊断罕见遗传疾病。
  • 定制工作流程: 用户提供训练数据集和评分工具(打分器),而OpenAI负责微调过程。评分工具将模型输出与正确答案进行比较,分配分数来指导强化学习。
  • 性能提升: RFT提升了模型的推理能力,这一点通过微调后的O1 Mini在特定任务上超越更大的O1模型得到证明,例如在对疾病最可能相关基因的排序方面。
  • 可访问性和未来计划: RFT目前处于预览阶段,计划明年向公众发布,并为高校、研究人员和企业提供早期访问权限。OpenAI计划扩展评分工具选项,并支持自定义评分器定义,以实现更广泛的适应性。

3 Sora

以各种格式创建视频,从文本生成新内容,或增强、重混和混合您自己的素材。

Sora已经到来,我们正将视频生成模型从研究预览阶段推向正式发布。

Sora系统说明:Sora建立在DALL-E和GPT模型的经验基础上,旨在为人们提供扩展的讲故事和创意表达工具。

Sora视频产品发布: OpenAI推出了突破性的视频生成工具Sora,旨在促进创意协作和推进AI能力。该产品已集成到ChatGPT Plus Pro账户中,无需额外费用。

主要特点和功能:

  • 可以从文本生成视频、制作图像动画、重混风格、延长片段等
  • 支持从480p到1080p的分辨率,视频时长从5秒到20秒
  • 包含"重混"(用于创意变体)、"故事板"(用于动作排序)和"重剪"(用于编辑和扩展视频)等工具

创意社区和探索:

  • "探索"功能展示社区生成的视频以供灵感,包括详细的复制方法
  • 预设和宽高比选项让用户轻松定制创作

高级AI发展目标:

  • Sora通过使AI能够理解和生成视频,扩展超越文本交互,为OpenAI的AGI路线图做出贡献
  • 增强讲故事能力,支持休闲和高级创作者

实时演示:

  • 团队展示了Sora的多功能性,包括创建如沙漠中的猛犸象、将其转变为机器人,以及从上传图像生成视频等场景
  • 循环和优化视频等功能展示了Sora在创意工作流程中的潜力

Sora概述与基本功能

Sora是OpenAI开发的视频生成模型,具有以下核心特点:

  • 可接受文本、图像和视频输入,生成全新的视频输出
  • 支持生成1080p分辨率、最长20秒的视频
  • 用户可以浏览精选和最新内容源,获取创作灵感
  • 基于DALL·E和GPT模型的技术积累
  • 采用扩散模型技术,通过逐步去噪生成视频
  • 使用Transformer架构实现更好的扩展性能

技术实现

  • 采用"视觉片段"(visual patches)作为基本单位,类似语言模型使用token
  • 训练数据来源广泛,包括:
  • 公开数据集
  • 专有合作伙伴数据
  • 内部开发的定制数据集
  • 人类反馈数据

安全措施

主要包括三层防护:

  • 技术层面:
  • 多模态内容审核
  • 自定义LLM过滤
  • 输出分类器
  • 内容黑名单
  • 政策层面:
  • 18岁以上年龄限制
  • 禁止未经授权使用他人肖像
  • 禁止生成违法和有害内容
  • 完善的内容举报机制
  • 特定风险领域:
  • 儿童安全保护
  • 色情内容过滤
  • 虚假信息防范
  • 艺术家风格保护

未来发展

OpenAI计划在以下方面持续改进Sora:

  • 肖像生成试点项目
  • 增强内容溯源能力
  • 提升输出的代表性和包容性
  • 持续完善安全标准和政策

这个系统展现了OpenAI在推进AI视频生成技术的同时,也非常重视安全和负责任的部署策略。

https://openai.com/sora/

4 Canvas

一文回顾OpenAI系列发布会:从工具到AGI_新功能_03

Canvas允许用户在一个协作环境中进行写作和编码,并通过ChatGPT提供帮助。探索Canvas的所有可能性,这是我们在去年十月推出的一个与ChatGPT协作编写和编程的界面。主要新功能包括:

关键点

  • 推出Canvas供所有用户使用,将其集成到主要ChatGPT模型中
  • 能够在Canvas内直接运行Python代码,并获得即时反馈
  • 新增并排视图,方便协作和编辑
  • 功能包括对文章进行评论,以及利用ChatGPT调试代码
  • 自定义GPT现在也可利用Canvas提升功能

https://openai.com/index/introducing-canvas/

5 ChatGPT in Apple Intelligence

OpenAI 公开发布了 ChatGPT 在 iOS 和 macOS 上的集成功能,使用户可以直接通过 Siri 访问 ChatGPT。新功能增强了 ChatGPT 的可访问性和可用性,用户可以使用 ChatGPT 执行各种任务,如创作和总结文档。此外,视觉智能功能还允许用户通过 iPhone 上的相机输入来了解物体信息。这些新功能增强了跨设备的无缝交互,提高了生产力和创造力。

关键要点

  • 苹果公司推出了 ChatGPT 在 iOS 和 macOS 上的集成,增强了可访问性
  • 用户可以通过 Siri 直接调用 ChatGPT 进行各种任务
  • 写作工具允许用户使用 ChatGPT 创作和总结文档
  • 视觉智能功能使用户能够通过 iPhone 相机输入了解物体信息
  • 增强的功能允许跨设备的无缝交互,提高了生产力和创造力

6 Advanced voice with video & Santa mode

OpenAI发布了新的"圣诞老人模式"和高级语音功能,包括视频和屏幕共享。这些新功能对于视力受损的用户来说是一个重大突破,可以增强他们的可访问性。用户普遍对这些新功能感到兴奋和赞赏。

关键要点

  • OpenAI发布了新的"圣诞老人模式"和高级语音功能,包括视频和屏幕共享
  • 这些新功能对于视力受损的用户来说是一个重大突破,可以增强他们的可访问性
  • 用户普遍对这些新功能感到兴奋和赞赏

7 Projects in ChatGPT

  • 推出"Projects"功能,可以帮助用户在 ChatGPT 中组织和管理对话。
  • "Projects"功能可以用于管理Home Maintenance、个人网站开发等任务。
  • "Projects"功能目前正在逐步推广至 OpenAI 的付费用户。

8 Search

一段展示SearchGPT如何直接回答问题的视频,它能提供来自网络的最新信息,同时提供清晰的相关来源链接。探索ChatGPT搜索的潜力,这是一种在2024年10月首次亮相的快速获取相关网络来源答案的方式。

一文回顾OpenAI系列发布会:从工具到AGI_搜索_04

  • OpenAI推出ChatGPT搜索功能已有两个月,为ChatGPT提供了访问实时信息和网络搜索的能力
  • 新功能包含三个方面:支持多语言、提高结果质量和创建个性化搜索体验
  • ChatGPT搜索功能对于用户日常使用来说非常有用,这个功能将向所有用户开放

https://openai.com/index/introducing-chatgpt-search/

9 Holiday treats for developers

OpenAI o1 和开发人员的新工具 介绍 OpenAI o1、实时 API 改进、一种新的微调方法以及更多内容。

  • 会议亮点:OpenAI 的 API 成功,全球有 200 万开发者。
  • 00:29 🎁 OpenAI 01 正式发布,具备函数调用、结构化输出、开发者消息和视觉输入功能。
  • 02:47 🛠️ 演示展示了使用新 API 功能(如视觉和结构化输出)进行税务表单错误检测。
  • 08:13 🧪 评估显示,OpenAI 01 在函数调用、结构化输出和编码任务上超越了 GPT-4。
  • 09:33 🚀 OpenAI 01 更快且更高效,使用的 token 数量减少了 60%。
  • 10:15 🔊 实时 API 现已支持 WebRTC,提高了延迟、音质,并减少了复杂性。
  • 15:29 💰 音频 token 成本下降 60%,同时宣布支持 GPT-4 Mini。
  • 16:13 🎨 偏好微调改善了模型与用户偏好的对齐,提升了性能。
  • 20:30 💻 新的 Go 和 Java SDK 简化了开发者的集成过程。
  • 21:52 🤝 启动了 AMA(问我任何事)环节,供开发者进行实时问答。

https://openai.com/index/o1-and-new-tools-for-developers/

10 1-800-CHATGPT

直播展示了通过电话和WhatsApp与ChatGPT互动的新功能,包括语音对话、实时翻译和个性化食谱推荐,进一步降低了使用AI的门槛并提升了便利性。

11 Work with apps

视频介绍了OpenAI的桌面应用程序升级,包括支持多种应用和语音模式,展示了如何通过ChatGPT提高写作和编码效率,所有新功能现已上线。

  • 本视频介绍了OpenAI桌面应用程序的最新进展,强调了其强大的功能和未来方向。
  • Kevin介绍了自己以及今天的主题,显示出对与会者的尊重和感激。
  • OpenAI在桌面应用方面的努力,包括Mac和Windows版本的推出,展示了其产品的不断进化。
  • ChatGPT的能力正在增强,不仅限于问答,还将开始为用户自动执行任务,提升用户体验。
  • 团队介绍了即将发布的新功能,强调桌面应用的优势,能够提供比浏览器更丰富的功能。
  • 本视频介绍了如何使用ChatGPT与应用程序进行交互,并展示了Warp应用程序生成数据图表的过程。
  • 强调用户在使用ChatGPT时始终保持对共享内容的控制。
  • 感谢Warp团队的支持,说明在应用程序合作时的初步挑战与进展
  • 演示如何通过ChatGPT生成命令以获取过去两个月的提交次数。
  • 展示如何请求生成节日主题的条形图,体现与其他功能的协同工作。
  • 讨论高级数据分析功能如何与ChatGPT结合,为用户提供更强大的数据处理能力。

本视频展示了如何使用应用程序的文本字段功能,并通过集成ChatGPT来增强应用的实时更新能力:

  • 介绍了文本字段的功能,包括其行数和内容展示
  • 提到目前的应用程序没有实时更新功能,计划通过ChatGPT添加此功能
  • 讨论了使用新模型01来解决复杂的编码问题,并展示了如何给模型输入提示
  • 展示了模型快速生成代码的能力以及其思考过程。

本视频展示了如何使用多种应用程序,并介绍了新功能和支持的IDE:

  • 讨论尝试重新运行代码,并提到使用的IDE和其他支持的IDE
  • 表达对Matlab支持的兴奋,认为这对学生很有帮助
  • 成功运行代码后,分享了使用ChatGPT的写作帮助,并宣布对新应用程序的支持。

本视频展示了如何将ChatGPT与Notion结合使用,来增强文档编写和研究的效率:

  • 介绍了如何让ChatGPT直接与Notion协作,增强文档的上下文理解
  • 强调了文档的事实准确性,并展示了如何通过搜索功能确保信息的可靠性
  • 通过调整ChatGPT的风格,使生成的内容与作者的语气一致,提升了文本的连贯性
  • 视频最后展示了如何将生成的内容复制回Notion,并提到后续的迭代过程。

在这段视频中,用户通过语音与虚拟助手圣诞老人互动,讨论节日歌曲的选择和推荐,同时介绍了新推出的语音模式功能:

  • 用户开始使用新的语音模式,与圣诞老人进行互动
  • 用户询问圣诞老人关于节日歌曲的推荐,特别是想替换掉一首歌曲
  • 用户希望找到更有活力的歌曲来让大家跳舞,并与圣诞老人讨论替换的选项
  • 视频最后提到新功能已经上线,并鼓励用户更新应用以获得最新体验

12 o3 preview & call for safety researchers

深思熟虑的对齐:推理能力让语言模型更安全。介绍我们针对o系列模型的新对齐策略,这些模型直接学习安全规范并对其进行推理。

OpenAI发布宣布推出新版O3和O3-mini模型,O3在多项基准测试如编程、数学和ARC AGI测试中都表现卓越。