收藏
0有用+1
0

OpenAI

美国人工智能研究公司
OpenAI,是一家开放人工智能研究和部署公司,其使命是确保通用人工智能造福全人类 [166] [172]。创立于2015年12月,总部位于美国旧金山。现由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。 [34]
OpenAI最早为非营利组织 [34],于2015年底由包括萨姆·奥尔特曼(Sam Altman)、彼得·蒂尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman)和埃隆·马斯克(Elon Musk)等创办 [5-6]2016年,发布首个产品,一款开源强化学习工具包OpenAI Gym和Universe [34]2019年7月,微软与OpenAI合作,注资10亿美元共同研发新的Azure AI超算技术 [34]2021年,设立初创企业基金支持AI初创公司 [34]2022年11月,全新聊天机器人模型ChatGPT问世,产品上线仅5天用户数量突破100万 [49]。2024年2月,文生视频大模型Sora问世 [115],在全球内容创作行业卷起新的风暴,成为人工智能发展进程中的“里程碑” [117],使OpenAI估值不到10个月增加近两倍,或达800亿美元 [125]。5月,推出GPT-4o,处理文本、图像、音频能力更自然、流畅 [158]。10月,ChatGPT搜索功能上线,覆盖网页版以及手机、桌面应用,是AI领域的一次重大变革。 [204]12月25日,Theinformation消息,OpenAI正在研发实体智能机器人。 [232]2025年1月31日,OpenAI上线o3-mini。 [246]当地时间3月25日,OpenAI宣布推出GPT-4o图像生成功能。 [283]
2023年,公司收入突破16亿美元 [123]。微软是最大的投资者,拥有OpenAI股份49% [48]。OpenAI跻身全球TOP50网站 [132],位列福布斯《2023云计算100强榜单》榜首 [54]以企业估值7100亿列2024年·胡润全球独角兽榜第三。 [140] [194]
公司名称
美国开放人工智能研究中心 [20]
外文名
OpenAI [20]
所属行业
人工智能研究
成立时间
2015年12月11日
总部地点
美国旧金山 [4]
公司类型
人工智能 [20]
员工数
770 人 [126](截至2023年11月)
CEO
萨姆·奥尔特曼 [24] [30](Sam Altman)
总    裁
格雷格·布罗克曼 [46](Greg Brockman)
代表产品
ChatGPT、Sora

公司发展

播报
编辑

早期发展

2015年12月11日,OpenAI由埃隆·马斯克(Elon Musk)、美国创业孵化器Y Combinator总裁萨姆·奥尔特曼(Sam Altman) [51]、全球在线支付平台PayPal联合创始人彼得·蒂尔(Peter Thiel)等硅谷科技大亨创立。 [2]
OpenAI最早作为非营利组织。2015年底,由Elon Musk、萨姆·奥尔特曼和其他投资者成立 [34]。埃隆·马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人埃隆·马斯克、Y Combinator总裁萨姆·奥尔特曼、天使投资人彼得·蒂尔以及其他硅谷巨头2015年12月份承诺向OpenAI注资10亿美元。 [1]
2016年4月27日,发布首款产品OpenAI Gym Beta。6月21日,OpenAI宣布了其主要目标,包括制造“通用”机器人和使用自然语言的聊天机器人。OpenAI研发主管伊利娅·苏特斯科娃(Ilya Sutskever)、OpenAI CTO格雷格·布劳克曼(Greg Brockman)、硅谷创业加速器Y Combinator总裁萨姆·奥尔特曼 [51]以及连续创业家埃隆·马斯克等人联合发表博文称:“我们正致力于利用物理机器人(现有而非OpenAI开发)完成基本家务。” [1]12月5日,发布Universe。
2017年,“情绪神经元”和OpenAIFive项目的突破,使得OpenAI开始关注大型语言模型(LLM)和参数规模,实现AGI的信念增强。 [34]7月20日,发布Proximal Policy Optimization算法。
OpenAI成立初期,机器人技术是主攻方向之一,由联合创始人沃伊切赫·扎伦巴领导,试图打造一个“通用机器人”。2019年,研究人员曾联合发表论文,声称正朝着训练机器人系统执行各种日常任务迈出基础性的一步。但是2020年10月,OpenAI放弃这一努力,扎伦巴将此归咎于缺乏训练数据。 [169]

转型期

  • 由非营利组织转向混合结构
2018年,随着埃隆·马斯克才套寒故的退出,以及大模型对资金超乎预期的需求,2019年3月,OpenAI从非营利性转变为“封顶嘱战”的营利性。在非营利母公司主体下,创建了一个限制性营利实体OpenAI LP,引入了上限利润模式,允许OpenAI LP合法地吸收风险投资和员工持股。OpenAI转向了混合结构:由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。 [34]
2凝影019年7月,微软(Microsoft)宣布与OpenAI开展为期多年的合作。微软投资OpenAI10亿美元,双方将携手合作替Azure云端平台服务开发人工智能技术。微软也成为OpenAI的独家云供应商和OpenAI新AI技术商业化的首选合作伙伴。微软的加持使得OpenAI的大模型开发如虎添翼。 [55]
  • 设立创业基金,由投资模式转向孵化器模式
2021年5月,OpenAI官方宣布了成立1亿美元的人工智能创业基金,该基金将由OpenAI管理,并由微软和其他OpenAI合作伙伴投资,计划投资1亿美元来帮助更多AI初创公司。投资方向:少数早期阶段的创业公司,且处于可以产生变革性影响的领域,如医疗保健、气候变化和教育以及基于生产力的人工智能工具。 [34] [84]
OpenAI通过“资金+技术+战略”支持的方式,支持优质的AI初创公司;反过来,被投公司成长起来后,增加OpenAI产品落地的场景需求和产业知识,从而反哺基础技术创新。这一模式使得OpenAI可以超前把握未来颠覆性技术的机会,并超前投资布局未来产业。
这一转变让OpenAI的投资模式变为孵化器模式,从而更加高效地对目标企业进行投资与技术支持。从而有条件开始自己的第二阶段战略:通过“资金+技术”投资初创企业的方式积极布局,为嵌入未来海量应用场景和指数型、裂变式增长铺路。 [86]
  • OpenAI转型期研发动态
发布时间
研究动态
2018年2月20日
研究防止恶意使用AI;
2018年4月9日
发布OpenAI宪章;
2018年7月30日
强化学习技巧;
2019年2月14日
提升语言模型GPT-2模型;
2019年3月11日
开放人工智能有限合伙人;
2019年4月15日
OpenAI五人击败Dota 2世界冠军;
2019年4月25日
发布深度神经网络MuseNet;
2019年8月20日
跟进GPT-2;
2019年9月17日
研究多代理交互中的紧急工具使用;
2019年10月15日
研究用机械手解魔方;
2019年11月5日
发布GPT-2:1.5B版本;
2020年4月30日
发布神经网络Jukebox;
2020年6月11日
开放人工智能应用程序接口;OpenAI宣布了GPT-3语言模型
2021年1月5日
研究连接文本和图像神经网络CLIP;
2021年1月5日
研究从文本创建图像神经网络DALL·E;
2021年3月4日
研究人工神经网络中的多模式神经元;
2021年8月10日
发布开放人工智能法典;
2022年4月6日
发布新的人工智能系统DALL·E 2

发展期

  • 主要历程
2022年11月30日脚誉巴,OpenAI发布ChatGPT全新聊天机器人模型。 [26]ChatGPT这一款革命性产品的上线引爆全球,成为用户破亿速度最快的消费级应用。全年营收达到2800万美元。
2023年1月,ChatGPT的月访问量超6.7亿次,将OpenAI推上全球访问量前50大网站榜单。 [132]2月16日,OpenAI买下了超优质域名AI.com,并将其链接跳转到了ChatGPT [7];同年3月,GPT登陆Bing,对搜索引擎带来革命性重构。OpenAI创始人对员工透露,其年营收达到了13亿美元,也就是同比增长超过45倍。OpenAI逆袭成全球AI“新王”,开启的新一轮AI革命的大幕。 [34]5月,OpenAI开放众多插件(当时已有70个),让用户得以利用插件组合满足个性化需求,成为了OpenAI创建生态系统、从产品思维转变至平台思维的标志性事件。5月18日(当地时间),在美国地区推出ChatGPT的首个官方移动应用程序ChatGPT APP [12],5月19日跃升美国地区iOS APP Store(应用程序商店)排行榜首位。分析人士指出,此举将快速开启GPT大模型在垂直领域的应用,加速行业应用 [58]7月26日,安卓版ChatGPT在美国、印度孟加拉国巴西提供下载 [15]。8月16日(当地时间),OpenAI宣布收购初创企业Global Illumination,后者的整个团队已加入OpenAI,共同开发包括ChatGPT在内的核心产品。 [40]同年,9月14日,OpenAI宣布将在爱尔兰都柏林开设办公室,这将是该公司的第三个办事处。 [41]11月在首届OpenAI开发者大会上,OpenAI首席执行官萨姆·奥尔特曼回顾了公司过去一年的发展历程,已经有200万开发者正在使用OpenAI的API(应用程序接口),在全球各地提供多种多样的服务;92%的财富500强公司正在使用OpenAI的产品搭建服务,而ChatGPT的周活用户数也达到1亿人。奥尔特曼向全球开发者和ChatGPT用户展示了AI龙头即将推出的一系列产品更新: [57]一是,GPT模型再迭代,OpenAI推出GPT-4 Turbo [141];二是OpenAI开始向AI个人助理的方向努力;三是宣布将上线一个GPT商店,OpenAI允许用户申请上线自己制造的GPT,并承诺根据GPT的使用情况向创建者支付费用。 [59]
2024年3月消息,OpenAI宣布推出全新的人工智能模型——“语音引擎(Voice Engine)”。这款自2022年起便默默研发的模型,如今已成为OpenAI文本转语音API以及本月早些时候发布的新版ChatGPT语音与朗读功能提供支持。 [137]5月28日(当地时间),OpenAI发布声明,宣布公司董事会成立安全与安保委员会,根据声明,该委员会的首要任务是在未来90天内评估并进一步发展OpenAI的流程和保障措施。90天后,委员会将与全体董事会分享建议。在全体董事会审查之后,OpenAI将以符合安全和保障的方式公开分享已采纳建议的最新进展,OpenAI透露,最近已开始训练下一个前沿模型,“预计由此产生的系统将使我们在通往通用人工智能(AGI)的道路上达到更高的能力水平”。 [163]7月30日(当地时间),OpenAI宣布,开始向部分ChatGPT Plus用户开放GPT-4o高级语音模式,并计划于秋季向所有Plus付费用户开放。 [184]10月31日(当地时间),OpenAI宣布上线免费ChatGPT搜索功能 [203-204]。ChatGPT成为AI搜索是AI领域的一次重大变革,引发了行业竞争。 [204]
  • 产品研发动态
2022年11月30日,推出了ChatGPT,这一款基于GPT-3.5的对话机器人,可以与用户进行交互式的聊天。同年12月,ChatGPT爆红,全球造访量至少17亿用户,成为了历史上用户量增长最快的应用程序。 [128]
萨姆·奥尔特曼在首届OpenAI开发者大会 [57]
2023年2月,发布了DALL-E 3。这是一款可以根据描述生成图像的模型,并将其集成到ChatGPT中,让用户可以通过聊天创造新的图像 [128];推出ChatGPT Plus订阅服务 [3]。3月,发布GPT-4 [57]一款比GPT-3.5 更强大的语言模型。于4月正式上线并被应用到ChatGPT Plus中,提供给付费用户使用。 [128]5月,OpenAI宣布与微软合作,在Azure AI超级计算平台上部署ChatGPT,并提供更高效和可扩展的服务 [128]。OpenAI推出了ChatGPT的iPhone应用程序ChatGPT APP。这款应用是ChatGPT的首个官方移动应用程序。 [12]5月25日,OpenAI在推特宣布,ChatGPT官方App现已在更多地区的App Store上线。 [35]6月,OpenAI为ChatGPT增加了语音功能,让用户可以通过语音与机器人进行对话,并听到机器人的回答。 [128]7月,ChatGPT推出定制指令功能 [36]。7月26日,OpenAI宣布,安卓版ChatGPT在美国、印度、孟加拉国和巴西提供下载,并计划将其推广至更多国家。 [15] [37-38]8月15日(当地时间),OpenAI官宣,将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。 [39]8月28日(当地时间),OpenAI宣布推出企业版ChatGPT。 [18]10月3日(当地时间),微软官宣,OpenAI最新的DALL-E 3模型现已面向所有Bing Chat和Bing Image Creator用户开放。 [42]11月6日(当地时间),首届OpenAI开发者大会。 [43]在OpenAI 首届开发者大会开启前,ChatGPT各种爆料已出,全新UI界面,人人可定制GPT,将引领「智能体工程师」新职业诞生 [19]。萨姆·奥尔特曼向全球开发者和ChatGPT用户展示了即将推出的一系列产品更新。同日,OpenAI在官网宣布推出自定义版本ChatGPT [43],解禁了 ChatGPT两大能力,一是上传多种类型文档,二是无需转换即可使用所有工具 [50]。11月22日,OpenAI宣布ChatGPT Voice功能向所有用户开放。ChatGPT Voice是使用OpenAI的语音技术Whisper创建的,该技术只需分析几秒钟的真人语音即可生成无限小时的对话。Spotify正在使用OpenAI的语音技术将Lex Friedman、Dax Shephard和其他播客的内容翻译成西班牙语、法语和德语。 [63]12月14日,CEO萨姆·奥尔特曼在X平台发文称,已重新开放ChatGPT Plus订阅 [79],在此前11月15日CEO萨姆·奥尔特曼在X平台发文称,将暂停ChatGPT Plus新用户注册。 [83]
2024年1月10日(当地时间),OpenAI宣布推出GPT商店和ChatGPT Team服务 [105]ChatGPT Team和GPT Store都是OpenAI公司新的收入驱动力 [107]。同日,OpenAI对使用条款进行更新,删除了禁止他们的技术被用于军事用途的条款。 [131]2月16日,OpenAI发布首款“文本生成视频”大模型Sora,使其成为最新一家采用生成视频技术的人工智能公司。 [109-110] [117]同时,OpenAI宣布一项要约售股交易,由此OpenAI整体估值高达800亿美元,一年内飙升两倍多。 [117]3月,OpenAI发布大模型加持的机器人Figure 01 [130]3月29日(当地时间),OpenAI在官网首次套订户展示了名为“Voice Engine”的语音生成模型。 [136]4月,人工智能初创公司OpenAI宣布,即日起用户无须注册即可开始使用ChatGPT的功能 [139]。4月30日,OpenAI宣布向所有ChatGPT Plus用户开放“记忆功能”。 [144]5月7日(当地时间),OpenAI发布公告称,推出了一款图像检测分类器,用来分析一幅图像是由OpenAI的“文生图”工具DALL·E 3生成的概率。并宣布加入C2PA的指导委员会 [147]。5月14日,OpenAI推出了ChatGPT桌面版应用程序。 [148]同日,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o,GPT-4o将免费提供给所有用户使用 [149]。5月28日,OpenAI表示已开始训练新人工智能模型,以取代其ChatGPT聊天机器人所依赖的GPT-4系统 [164];5月30日,宣布推出为大学开发的ChatGPT Edu教育版 [170]。7月18日,OpenAI公布的最新技术研究Prover-Verifier-Games(PVG),这项旨在提升AI模型推理和输出准确性的新技术,很好地解决了输出“黑盒”这个难题。 [181]同日,推出新的人工智能模型“GPT-4o mini”。 [182]7月25日(当地时间),OpenAI推出了名为“SearchGPT”的搜索新功能。 [183]8月9日,OpenAI宣布ChatGPT免费用户可以每天使用其DALL-E 3 模型生成图片。 [187]9月13日,OpenAI发布最强水平大模型,此前被称代号为草莓(Strawberry)项目 [180],解决博士生级别科学问题。 [190]9月,OpenAI宣布,所有付费订阅OpenAI ChatGPT Plus和Team计划的用户都将可以使用新的ChatGPT高级语音助手Advanced Voice,该功能将首先在美国市场上线。 [192]9月25日,OpenAI正式推出高级语音功能。 [193]10月3日(当地时间),OpenAI宣布推出全新界面canvas [197]10月25日消息,OpenAI计划在12月前推出其下一个前沿模型Orion [202]12月4日(当地时间),人工智能头部公司OpenAI宣布,从12月5日(当地时间)开始,OpenAI进入一个持续发布新功能的周期。 [213]12月9日(当地时间),OpenAI宣布正式向用户开放人工智能(AI)视频生成模型版本Sora,该系统可以根据文本提示生成逼真的视频。 [215]12月17日消息,美国时间周一,OpenAI宣布将向所有ChatGPT用户开放搜索功能。 [225]12月18日凌晨,OpenAI开启了第9天技术分享直播,正式发布了o1模型的API,并且对实时API进行大升级支持WebRTC。 [226]12月25日,Theinformation消息,OpenAI正在研发实体智能机器人,并且重新启动了解散4年的内部机器人开发团队。 [232]12月31日,OpenAI首席执行官山姆·奥尔特曼公布了2025年OpenAI即将发布的技术产品。分别是:AGI(通用人工智能)、Agents(智能体)、更好的GPT-4o升级版、更好的记忆存储、更好的上下文窗口、成人模式、深度研究特色功能、更好的Sora、更好的个性化定制。 [235]
美东时间2025年1月14日,OpenAI宣布推出名为Tasks的测试版新功能,从当日开始,三个不同版本ChatGPT——ChatGPT Plus、Team和Pro的订阅用户将可以试用这个新功能。它让ChatGPT作为聊天机器人变得更像一种传统的数字助手,比如苹果的Siri或者谷歌的Google Assistant,只不过区别是这个助手拥有更先进的语言功能。 [236]当地时间1月21日,美国总统特朗普在白宫宣布,OpenAI、软银和甲骨文公司将共同投资5000亿美元建立一家名为“Stargate”的新公司,专注于推动美国人工智能基础设施建设。 [238]
2025年1月,OpenAI发布首个智能体Operator,能像人类一样与界面交互,完成任务,打破API局限,刷新SOTA,但能力尚不及人类,目前仅对美国Pro用户开放。 [243]1月,OpenAI推出ChatGPT GOV,面向美国政府机构。 [244]北京时间2月1日凌晨,OpenAI发布全新推理模型o3-mini ,并首次向免费用户开放推理模型。 [247-248]当地时间2月2日(北京时间2月3日),OpenAI为旗下ChatGPT发布一款面向深度研究领域的智能体产品,名为“深度研究”(deep research)的新AI代理工具,目前面向Pro用户,接下来将对Plus和Team用户开放 [249-250]2月4日,Kakao和OpenAI宣布开展战略合作。 [252]2月5日,OpenAI宣布完成一次全面的品牌重塑,包括全新的字体、Logo和色彩方案。OpenAI的新Logo在外观上与旧版差异不大,但经过微调后,标志中心部分的空间略微增大,线条更加简洁流畅。 [254]2月6日凌晨3点,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。 [255]2月7日,OpenAI在社交平台X发文,宣布面向免费和付费用户更新o3-mini的思维链,并为付费用户更新o3-mini-high的思维链。 [257]2月,OpenAI宣布,它正在评估美国哪些地区适合作为“星际之门”(Stargate)项目的数据中心所在地,并将该项目视为美国能否在全球人工智能(AI)竞赛中保持领先的关键事项。 [260]2月11日消息,Roblox、Discord、OpenAI 和谷歌联合推出了一个名为 ROOST(强大开放在线安全工具)的非营利组织,旨在为 AI 时代构建可扩展且互联互通的安全基础设施 [264]。当地时间2月25日,OpenAI宣布,即日起向免费用户推出GPT-4o mini驱动的高级语音模式。 [269]2月26日,OpenAI宣布将向所有ChatGPT Plus、Team、Edu和Enterprise用户推出其Deep Research功能。 [268]2月28日,OpenAI GPT-4.5 API正式上线。 [270]3月4日,OpenAI最新推出NextGenAI,致力于加速科研突破和教育变革 [271]。3月6日,OpenAI 宣布 GPT-4.5 正式面向所有 ChatGPT Plus 用户开放。 [274]当地时间3月25日,OpenAI宣布推出GPT-4o图像生成功能。 [283]3月27日,OpenAI 宣布对其Agent SDK进行重大更新,正式支持 Model Context Protocol(MCP)服务。 [285]
当地时间2025年3月31日,OpenAI宣布在软银集团领投的新一轮融资中筹集400亿美元,投资后估值达到3000亿美元。公司表示,计划利用资金进一步推进人工智能研究、扩大计算基础设施。 [288]同日,OpenAI 首席执行官 Sam Altman 表示,OpenAI 计划在未来几个月内发布自 GPT-2 以来首个具有推理能力的开放权重语言模型。 [289]4月2日,OpenAI 上线了 OpenAI 学院(OpenAI Academy)。 [290]4月2日消息,OpenAI宣布推出PaperBench——一个评估AI智能体复现前沿AI研究能力的基准。 [291]4月4日,OpenAI首席执行官山姆·奥特曼在社交平台X上发文称,将在数周内发布o3、o4-mini,未来几月内发布GPT-5。 [292]4月7日消息,OpenAI测试一项新功能:为GPT-4o图像生成模型加入水印。 [293]当地时间4月10日,美国开放人工智能研究中心(OpenAI)宣布开源包含1266个挑战性问题的基准测试BrowseComp。 [295]4月11日消息,OpenAI向Plus和Pro用户推出ChatGPT记忆提升功能。用户可以在设置中随时选择退出引用过去的聊天,或完全退出记忆。同时,ChatGPT中的记忆功能现在可以参考您过去的所有聊天,以提供更个性化的回复,根据您的偏好和兴趣,使其在写作、获取建议、学习等方面更加有用。 [296]4月11日,OpenAI在更新的日志中宣布GPT-4将于2025年4月30日从ChatGPT中移除,完全由GPT4o取代。 [297]当地时间4月14日,OpenAI首席执行官奥特曼表示,最新推出的GPT-4.1系列模型(包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano)已在API中可用。 [299]4月15日,OpenAI正式在API中推出全新的GPT-4.1系列模型。此次发布包括三款新模型,分别是GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三个新成员。其中,OpenAI声称GPT-4.1 nano是其迄今“最快、最便宜”的模型。 [298]当地时间4月15日,总部位于伦敦的AI初创公司Context.ai宣布团队将加入OpenAI。 [300]4月16日,OpenAI公布其新的非营利性委员会的“顾问”,这四位顾问将帮助“为 OpenAI 的慈善工作提供信息”。 [301]4月15日消息,OpenAI正考虑创建社交平台,与Instagram平台以及马斯克的社交媒体平台X(原称推特)竞争。 [302]4月17日,OpenAI发布新款模型o3和o4-mini;同日,OpenAI还发布了编程机器人Codex CLI。 [303] [305]4月25日消息,OpenAI为所有用户推出轻量版Deep Research。 [307]4月29日,OpenAI为ChatGPT新增购物功能,包含推荐精选商品与购买按钮,以此向谷歌发起挑战。 [309]
当地时间周一(2025年5月5日),OpenAI宣布,它将继续由其非营利性母公司控制,同时将推进营利性部门结构调整的计划,以便在AI竞赛中筹集更多资金、保持领先地位。 [310]
2025年5月6日消息,彭博社报道称, OpenAI 已同意以约 30 亿美元(IT之家注:现汇率约合 217.29 亿元人民币)收购 AI抹妹企 编程助手开发商 Windsurf(注册名 Exafunction Inc.)。 [311]
2025年5月15日凌晨,美国开放人工智能研究中心(OpenAI)宣布向ChatGPT用户开放GPT-4.1模型。 [317]
2025年5月14日,美国开放人工智能研究中心(OpenAI)宣布推出针对OpenAI模型的安全评估中心。 [318]
2025年6月,OpenAI宣布,将向所有用户免费开放ChatGPT的记忆功能(Memory)。此前,该功能仅限于付费订阅用户使用。 [330]
截至当地时间2025年6月4日,OpenAI的付费商业用户数已达到300万,相较2月以来新增近100万用户。 [331]

全球布局

OpenAI海外扩张,显示其全球化战略,有助于本地化服务和产品,加强与全球市场联系 [150]。奥尔特曼称,扩张是吸引全球一流人才、推动通用人工智能开发和政策创新的机会。随着欧盟寻求对人工智能进行监管,在伦敦设立办事处将对OpenAI有利。 [151]
2024年12月,OpenAI表示,该公司将在瑞士苏黎世设立一个新的分支机构,以加强其在欧洲的影响力。OpenAI表示,苏黎世将成为其在欧洲的第五个办公地点;在过去两年里,该公司已在都柏林、伦敦、巴黎和布鲁塞尔开设分支屑询柜机构。 [212]
2025年2月3日,软银集团与OpenAI在东京举办一场有500多家日本公司到场的会议,旨在建设日本的人工智能基础设施,包括建设面向人工智能的数据中心和发电厂,将寻求运输、制造、制药和金融等各行各业的支持。 [251]2月,OpenAI表示,将在慕尼黑设立其首个德国子公司,新办事处将在未来几个月开业。 [258]2月10日,‌OpenAI‌计划在2025年内完成首款自研AI芯片的设计,并送往‌台积电‌进行制造,预计2026年实现量产。此举旨在减少对‌英伟达‌芯片供应的依赖。‌ [262]2月13日,OpenAI首席执行官萨姆·奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。因此,OpenAI不再计划将o3作为独立模型发布。 [265]2月16日消息,OpenAI公司CEO萨姆·奥尔特曼宣布,GPT 4o的智力水平将提升至o3 pro级别,并且他认为更新后的GPT 4o是最佳的AI搜索产品。 [267]3月6日消息,OpenAI计划对达到博士水平的AI Agent每月收费2万美元,这些 “博士水平” 的AI Agent能够处理学术研究和软件开发领域中的复杂任务。据悉,OpenAI计划推出三种类型的AI Agent,其每月收费可能在2000美元到2万美元之间。 [275]3月10日,CoreWeave与OpenAI签订了一份为期五年、价值119亿美元的合同。OpenAI将通过认购价值3.5亿美元的CoreWeave公司股票,成为后者的投资者。作为协议的一部分,CoreWeave将向OpenAI提供人工智能基础设施。 [277]3月20日,OpenAI发布博文,宣布推出语音转文本(speech-to-text)和文本转语音(text-to-speech)模型,提升语音处理能力,支持开发者构建更精准、可定制的语音交互系统,进一步推动人工智能语音技术的商业化应用。 [282]当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。 [284]3月28日消息,OpenAI须在今年年底前转型为一家营利性公司,以确保获得由软银领投、处于最后阶段的400亿美元全额融资,否则本轮融资规模可被缩减至200亿美元。 [287]4月24日,日本电信电话子公司NTT数据(NTT DATA)宣布与OpenAI合作,在全球范围内为企业推出以增强数据安全性为重点的人工智能生成工具。 [306]5月6日消息,OpenAI宣布调整重组计划,明确其非营利性母公司将继续保持对公司的最终控制权,同时推进营利性部门向公益企业(Public Benefit Corporation,简称PBC)转型,以平衡融资需求与公益使命。 [314]5月7日,英国《金融时报》以“美国人工智能公司OpenAI计划将‘星际之门’(Stargate)项目拓展到美国之外”为题报道说,OpenAI计划扩大其5000亿美元的数据中心项目,方式是加大海外投资,以促进“民主人工智能”的发展,不过该公司尚未透露项目融资和交付方式细节。 [313]2025年5月,OpenAI正在考虑在阿联酋建设新的数据中心,此举可能显著扩大其在中东地区的业务布局。该协议尚未最终敲定,仍有可能改变,最早可能会在美国总统特朗普访问中东期间宣布。 [315]当地时间5月15日消息,CoreWeave已与OpenAI达成一项价值高达40亿美元的协议,该协议将持续到2029年,旨在提供额外的云计算能力。 [319]5月17日,OpenAI 宣布推出基于云端的 AI 智能体 Codex,专注于自动化软件开发,涵盖修复错误和实现功能等任务,官方希望该智能体可以开创代码编写的新范式。 [320]
当地时间2025年5月22日,OpenAI宣布“星际之门阿联酋”(Stargate UAE)项目,将为阿布扎比带来一个1GW的数据中心集群。 [323]5月25日,科技媒体 Axios报道,阿拉伯联合酋长国(UAE)将成为全球首个为全体公民(citizens)和居民(residents)免费提供ChatGPT Plus服务的国家。 [328]
OpenAI海外分部
布局时间
分布国家
办事处
项目简介
2023年6月
英国
OpenAI伦敦
是在美国以外设立的首家海外分部 [151]
将专注提升研究和工程能力。 [152]
2023年9月
爱尔兰
OpenAI都柏林
初期仅招聘国际薪资专员、商业职位,以及一个爱尔兰政策和伙伴关系负责人,三个职位。 [153]
2024年4月
日本
OpenAI东京
公司在日本东京设立亚洲首个办事处,将业务扩展到亚洲 [155]。并承诺提供专门针对日语进行优化的GPT-4定制大模型,在翻译和总结日语文本方面具有更高的性能,运行速度比之前版本快3倍,对当地企业而言具有成本效益。 [154]由Tadao Nagasaki担任OpenAI日本总裁 [142]
计划2024年
新加坡
新加坡将成为公司为亚太地区客户和合作伙伴提供支持的枢纽,其团队将帮助加强与当地和区域政府、企业和机构的关系。 [198]

融资历程

2023年1月OpenAI从微软公司筹集了100亿美元。据福布斯发布2023云计算100强榜单,2023年云计算100强企业的平均融资金额为8.05亿美元,高于一年前的6.1亿美元,其中原因包括了OpenAI的重大融资活动。 [54]
2024年10月3日,OpenAI宣布完成新一轮巨额融资,金额达到66亿美元,投后估值高达1570亿美元(约合人民币1.1万亿元),刷新投资交易规模。至此,OpenAI成为与马斯克创办的SpaceX、张一鸣的字节跳动并列在内的全球前三大初创公司。除了从主要投资者处获得新一轮66亿美元融资外,公司还与摩根大通、花旗、高盛、摩根士丹利、桑坦德银行、富国银行、三井住友银行、瑞银和汇丰银行建立了40亿美元的循环信贷额度。OpenAI称这意味着其可以获得超过100亿美元的流动资金。 [195] [200]
2025年3月27日,据报道,OpenAI接近敲定由软银牵头的400亿美元融资,投资者包括Magnetar Capital、Coatue Management、Founders Fund和Altimeter Capital Management,这笔交易将使该公司估值达到3000亿美元。 [286]
部分融资历程
时间
融资额(亿美元)
投资方
2015.06
10
风险投资家彼得·蒂尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman)
Y Combinator创始合伙人杰西卡·利文斯顿(Jessica Livingston)
咨询公司Infosys
公共云市场领导者Amazon Web Services
YC Research
萨姆·奥尔特曼(Sam Altman)
埃隆·马斯克(Elon Reeve Musk)
2016.08
0.0012
Y Combinator
2019.03
未透露
Khosla Ventures
Reid Hoffman Foundation
2019.04
0.1
Matthew Brown
2019.07
10
微软
2021.01
未透露
老虎全球管理
Bedrock Capital
Andreessen Horowitz
2021
20
微软
2023.01
100
微软
2023.04
3
Andreessen Horowitz等
2024.01
143
MIS
数据来源:crunchbase、Tracxn等公开资料整理。
参考资料: [156]

财务状况

  • 收入状况
报道机构及时间
统计时间
报告内容
金额
主要来源
2023年12月13日
2022年
OpenAI
非营利组织收入
44485美元
几乎全部来自投资收入
The Information
2023年8月
2022年
OpenAI全年收入
2800万美元
受益于ChatGPT
中国经营报
2024年3月1日
2023年
年化收入
(月收入x12)
超16亿美元
一是软件开发者调用API,向其支付流量费用;二是ChatGPT Plus会员订阅费用;三是从微软销售OpenAI模型的收入中分成。 [123]
  • 财务现状
2023年1月,微软继续投资OpenAI,增援100亿美金,占股比例达到4驼旬妹9%,OpenAI估值达到290亿美金。 [128]
OpenAI披露的收入并不包含营利部门的收入,而ChatGPT正在积极变现。根据OpenAI的融资信息,OpenAI的估值超过860亿美元。其财务状况是一个黑匣子。OpenAI的非营利地位受到了批评者的批评,他们质疑一家价值860亿美元的公司如何能由慈善机构控制。这也是2023年11月,OpenAI出现人事动荡的部分原因。 [85]
2024年1月,受益于降价之后用户数强劲增长,OpenAI驶入商业化快行线,2023年底的年化收入(月收入x12)已突破16亿美元。OpenAI估值也水涨船高,正筹划新一轮融资,公司估值已达1000亿美元,成为SpaceX之后美国估值第二高的创业公司。全球范围内的估值排名位列第三。 [124]
2024年4月,过去十年间,OpenAI已获得融资总额143亿美元(约合1034.30亿元人民币),最新估值已超过800亿美元(5786.32亿元人民币)。 [156]
2024年10月8日(当地时间),OpenAI与美国媒体集团赫斯特宣布达成内容合作协议,允许后者旗下报纸和美国国内杂志内容被整合到OpenAI产品中。双方未披露交易条款。 [199]
2025年1月21日,微软表示,微软将不再是OpenAI的独家云服务提供商,但仍将对OpenAI的新的云服务协议拥有“优先购买权”。 [240]5月,OpenAI表示,将进行重组,采用一种让其非营利实体保留最终控制权的模式。5月13日,这一计划得到了软银的认可。 [316]5月21日,宣布扩展 Responses API,支持远程连接 MCP 服务器、图像生成、Code Interpreter 以及文件搜索优化等,帮助开发者构建更智能的智能体应用。 [322]5月26日消息,据报道,OpenAI计划在未来几个月内设立首尔办事处。 [325]当地时间6月4日,美国开放人工智能研究中心(OpenAI)宣布其付费企业用户数量已增长至300万。 [329]

价值理念

播报
编辑

哲学思想

(详见主词条:有效利他主义
英国哲学教授威廉·麦克阿斯基尔是有效利他主义运动的创始人 [28]
有效利他主义(Effective Altruism),最初是慈善领域的一个相对简单的想法:在最有效的地方捐款,而不是仅仅为了“温暖的光辉”而无效地捐款。英国哲学教授威廉·麦克阿斯基尔(William MacAskill)是有效利他主义运动的创始人。鉴于以功利主义数学为基础,该运动开始吸引来自大型科技公司的支持者,他们开始进一步推动这一逻辑。当可通过赚更多钱来增加捐款数额时,为什么只关注捐赠的钱呢?这种逻辑表明,如果有能力,在对冲基金或大型科技公司工作并进行捐赠比为慈善机构工作更道德。逻辑进一步推演,将信奉有效利他主义的人指向两件事:星际定居(这样人类就可以在地球灭绝事件之后生存)和通用人工智能(AGI)——人工智能的超级智能版本,如果正确“对齐”,可以为人类谋福利,极大地提高人类生存的长度和质量。这就是OpenAI应该发挥作用的地方。 [28]

核心目的

OpenAI成立之初是一个真正的非营利组织,核心目的就是确保通用人工智能(AGI)安全引入。官网上都明确了OpenAI的目标是“确保人工智能造福全人类”。 [29]

核心理念

2020年。OpenAl提出核心理念——Scaling Law(缩放规律),其理念为大模型规模越大,其性能越好。2018年6月,0penAl推出第一代大语言模型GPT1,其参数规模为1.17亿,从总计4GB的书籍中训练得来;2019年,OpenAl再次推出参数规模为上一代的12倍,文本规模是上一代的8倍多的GPT2模型,其在文本生成方面更加出色。2020年6月推出的GPT-3,其参数规模达1750亿,是GPT2模型的116倍,也是微软Turing-NLG模型的10倍,成为当时市面上最大的自然语言处理模型。2024年年初爆火的Sora模型,再一次验证了Scaling Law的“大力出奇迹”的成功。 [156]
GPT1-GPT4模型参数量及训练数据集大小
产品
参数量(亿
数据集来源
数据集大小(GB
GPT1
1.17
书籍
4.6
GPT2
15
Reddit
40
GPT3
1750
维基百科、书籍学术期刊、Red-dit、CommonCrawl等
753
GPT3.5
与GPT3相近
类似GPT3,可能有更新
GPT4
远大于GPT3
更大规模和多样化
注:GPT3.5和GPT4的参数量及训练数据集未公开披露。参考资料: [156]

公司使命

OpenAI的使命是确保人工智能(AGI)造福全人类。所谓AGI,指的在最具经济价值的工作中胜过人类的高度自主系统。这一使命体现在OpenAI公司章程中。
在产品讨论中有策略地使用了“在这些选项中,哪一个让我们感觉更接近AGI”这一短语,有助于决定打造什么、和因为使命而决定放弃。明确的重点永远是速度的驱动力。使命有助于保持专注,也为许多新想法铺平了道路。 [27]

企业文化

在企业文化塑造方面,OpenAI将AI安全作为企业文化的核心部分,并在日常研发中贯彻这一理念。其通过与公众的沟通和交流,强化了社会对AI安全问题的认知和理解。 [86]

公司治理

播报
编辑

融资结构

  • 初始资金-捐赠
OpenAI初始资金是由企业家们捐赠,包括OpenAI创始人萨姆·奥尔特曼,也包括埃隆·马斯克的1亿美元 [29]资助者似乎承诺在该组织的发展过程中向该组织提供数十亿美元,因此它不需要担心支付该项目的账单。由于各种原因,包括性格冲突和方向差异——这种“纯粹”的非营利模式并没有持续多久,OpenAI原本以为可以从埃隆·马斯克那里得到的钱也枯竭了。 [28]
  • 资金-混合结构
2019年,Altman的任务就是找钱,这使得OpenAI需要尝试吸引商业参与者的投资,OpenAI转向了混合结构。 [29]希望一家公司能够给他们带来回报。在Altman领导的一系列举措中,OpenAI转向了混合结构,然而,投资者被警告说,他们应该考虑到OpenAI可能永远不会产生利润,该公司不会主要专注于实现利润,而且他们最好认为,任何投资都更接近于捐赠,而不是产生回报。
为寻求融资,OpenAI在母公司OpenAI Inc.下,成立了子公司OpenAI global,其中微软的投资换取了OpenAI global高达49%的股份。作为交换,投资者可以预期的回报规模有一个相对慷慨的上限:即他们投入的100倍。因此,投资了10亿美元的微软最多可以期望1000亿美元的回报。 [28]

管理架构

  • 董事会
OpenAI的使命是打造一种造福人类的技术,早期是一家非营利机构;2019年OpenAI转型为一家营利性公司,不过它仍然由一个非营利性的董事会管理。 [64]
微软成为OpenAI最大的投资者,但是在OpenAI董事会没有席位,甚至创始人萨姆·奥尔特曼本人也没有该公司的任何股权——这对于该行业来说几乎是闻所未闻的情况。从理论上讲,该模式将吸引志同道合的投资者,愿意接受极其不寻常的治理情况,这将有助于公司专注于其使命。 [28]
一方面,董事会拥有任免CEO的权力,但包括Altman在内,董事会成员不持有母公司股份,OpenAI理论上不存在沦为内部人控制的公司的危险;另一方面,投资者是子公司(也是母公司的运营主体)的大股东,却在公司董事会没有席位,做到了与经营隔离,仅仅是战略投资者。 [29]OpenAI试图建立一家大型科技初创公司,而创始人/首席执行官Altman并未拥有无懈可击的权力。 [28]
OpenAI的组织结构。  [28]
根据OpenAI官方说明,董事会的多数成员是相互独立的,各自有不同的背景和专业领域,共同决策和指导OpenAI的发展方向。而从董事会构成来看,奥尔特曼、布洛克曼和苏茨克维与公司具有最直接的联系,而另外三个则有其他社会任职。 [31]
2023年12月20日,OpenAI发布公告:将建立专门小组,来监督技术工作和安全决策的操作结构,公司管理层做决策,董事会有权推翻。 [102]
OpenAI发布公告 [102]
  • 安全顾问团
2023年12月18日(当地时间),OpenAI发布新安全指南,阐释公司计划如何应对最强大人工智能(AI)系统可能引起的极端风险。在该指南下,OpenAI只会在确定最新技术的安全性之后才会开始运用。公司加强其内部安全流程,将成立一个顾问团队以审核安全报告,再转交公司高层和董事会,并赋予董事会对高风险人工智能的否决权。 [96]
安全顾问团负责按月同时向公司管理层和董事会汇报,确保所有决策者充分了解情况。对于不同时间尺度的AI风险,OpenAI成立了三个团队来分别应对:
团队和流程 [102]
安全系统团队(Safety Systems)负责当下,减少现有模型如ChatGPT的滥用。
准备团队(Preparedness)负责不久的将来,识别和管理GPT-5等正在开发的前沿模型带来的新风险,由MIT教授Aleksander Madry领导。
超级对齐团队(Superalignment)负责遥远的未来。 [102]
三个安全小组应对内容 [102]

管理团队

2023年3月,左:穆拉蒂、奥尔特曼、布罗克曼、苏茨克维尔 [64]
OpenAI原本董事会成员包括:奥尔特曼、布洛克曼、苏茨克维、Quora首席执行官Adam D’Angelo、技术企业家Tasha McCauley以及乔治城大学安全与新兴技术中心的Helen Toner。其中:奥尔特曼、布洛克曼和苏茨克维都是OpenAI的联合创始人,加上首席技术官米拉·穆拉蒂(Mira Murati),四人构成了OpenAI的核心团队,是ChatGPT-3.5的背后“英雄”。 [31]
2022年6月,量子计算专家、ACM计算奖得主Scott Aaronson宣布,将加盟公司。 [2]
2023年早些时候,OpenAI董事会成员从9人缩减至6人,其中:萨姆·奥尔特曼、伊尔亚·苏茨克维以及OpenAI总裁格雷格·布罗克曼(Greg Brockman)是该实验室的三位创始人,而其他三人都是独立董事。 [56]
OpenAI发表声明 [52]
2023年11月,OpenAI董事会经历了“宫斗”风波。同月22日,OpenAI发表声明称:萨姆·奥尔特曼将回归OpenAI担任首席执行官OpenAI组成新初始董事会,三名成员分别是:董事会主席布莱特·泰勒(Bret Taylor)、美国前财政部长拉里·萨默斯(Larry Summers)、问答网站Quora的首席执行官亚当·迪安杰罗(Adam D'Angelo) [30] [48]。11月30日,OpenAI宣布,萨姆·奥尔特曼已经回归担任首席执行官,米拉·穆拉蒂担任首席技术官,格雷格·布罗克曼担任总裁。 [46]
OpenAI任命三位新董事 [129]
2024年2月13日(当地时间),人工智能研究员、OpenAI创始成员之一安德烈·卡尔帕西(Andrej Karpathy)在社交媒体平台X上发文称,他已离开OpenAI。 [108]3月8日(当地时间),OpenAI公布“宫斗”调查结果的同时,宣布此次除了萨姆·奥尔特曼重回OpenAI董事会外,还将任命三位新董事,其中包括比尔和梅琳达·盖茨基金会前首席执行官Sue Desmond-Hellmann、索尼娱乐公司前总裁Nicole Seligman和Instacart公司首席执行官Fidji Simo。萨姆·奥尔特曼和这些新成员,将加入现任董事会成员——Quora首席执行官Adam D'Angelo、前美国财政部长拉里-萨默斯(Larry Summers)和前Salesforce联席首席执行官、董事长Bret Taylor的行列。至此OpenAl董事会将共有7名成员。 [129]8月,OpenAI已聘请Meta Platforms前高管伊琳娜·科夫曼(Irina kaufman)负责战略计划。 [188]9月16日,该公司安全和安保委员会将成为独立的董事会监督委员会,Zico Kolter将担任该委员会主席。 [191]
职位
人物姓名
人物简介
人物图片
备注
创始团队
首席执行官/初始资金资助者
(Sam Altman)
OpenAI联合创始人。在布洛克曼2010年加入Stripe期间正好供职于Y Combinator,而Y Combinator正好是Stripe的种子投资方。2015年,与埃隆·马斯克等人共同创立OpenAI,于2019年担任CEO,并将OpenAI从非营利组织转向混合结构型的公司。
萨姆·奥尔特曼 [69]
-
首席科学家
(Ilya Sutskever)
OpenAI联合创始人。2012年多伦多大学毕业后先后在斯坦福大学、多伦多大学、谷歌进行科研工作。2015年加入OpenAI共同创立了OpenAI。
伊尔亚·苏茨克维 [66]
初始资金资助者
(Elon Musk)
OpenAI联合创始人。南非出生的美国知名企业家;美国特斯拉汽车公司的CEO兼产品架构师。因创办SpaceX,以及联合创办特斯拉汽车和PayPal(贝宝)而闻名。规划创立了SolarCity公司,是最大股东和董事会主席;推特公司CEO;美国神经连接公司(Neuralink)创始人。
埃隆·马斯克 [60]
初始董事会(共6人)
董事长、总裁
(Greg Brockman)
OpenAI联合创始人。学生生涯中曾获数学、化学等多项国际大奖。在哈佛大学就读一年后转投MIT(麻省理工学院),2010年辍学加入线上支付公司Stripe。2013年,成为Stripe的首位首席技术官,2015年离开公司,并与特斯拉CEO埃隆·马斯克、奥尔特曼一道共同创立了OpenAI。
格雷格 • 布罗克曼 [67]
截止2023年11月22日
董事、CEO
萨姆·奥尔特曼
(Sam Altman)
(略)
(略)
董事、首席科学家
伊尔亚·苏茨克维
(Ilya Sutskever)
(略)
(略)
独立董事
(Adam D'Angelo)
Quora首席执行官。长期与人工智能打交道。
亚当·迪安杰罗
(Tasha McCauley)
兰德公司的兼职科学家。曾从事技术和人工智能政策及治理问题的研究,并在奇点大学任教。
塔莎·麦考利
(Helen Toner)
乔治城大学安全与新兴技术中心战略主管。是有效利他主义团体的一员。
海伦·托纳
现任董事会(共7人
董事会主席
(Bret Taylor)
拥有斯坦福大学计算机科学专业硕士学位。 曾任Facebook首席技术官、Salesforce联席首席执行官。
布莱特·泰勒
2023年11月22日任命
成员
首席执行官
萨姆·奥尔特曼
(Sam Altman)
(略)
(略)
成员
(Larry Summers)
前民主党财政部长和哈佛大学校长,经济学家。1993年,他因在经济学界的杰出表现获得美国约翰·贝茨·克拉克奖章。第一个获得美国国家科学基金会艾伦·沃特曼奖的社会科学家、美国计量经济学学会会员和美国艺术科学学会成员。
拉里·萨默斯
成员
(Adam D’Angelo)
原董事会成员,前问答网站Quora创始人,Facebook首任CTO。
亚当·迪安杰罗
成员
Sue Desmond-Hellmann
女,非营利组织的领导者和医生,目前在辉瑞公司董事会和总统科学技术顾问委员会任职,此前曾担任宝洁公司、Meta以及比尔及梅琳达·盖茨医学研究所的董事,于2014年至2020年担任比尔及梅琳达·盖茨基金会首席执行官。
-
2024年3月8日任命
成员
Nicole Seligman
女,企业和公民领袖及律师,目前在派拉蒙全球、Meira GTx HoldingsPLC和Intuitive Machines,Inc三个上市公司董事会任职,曾担任索尼公司的执行副总裁和总法律顾问,负责监督全球法律和法律事务等职能。合规问题。
-
成员
Fidji Simo
女,消费技术行业的资深人士,Instacart的首席执行官兼董事长、Shopify董事会成员,曾担任Facebook应用程序副总裁兼负责人,在Facebook的10年中负责监督Facebook应用程序。
-
现任高管
首席技术官
米拉·穆拉蒂
(Mira Murati)
曾任特斯拉的Model X车型的高级产品经理。2018年加入OpenAI,被称作“ChatGPT之母”,是OpenAI核心团队四名成员之一;主要负责两款产品:一是ChatGPT,二是DALL-E的人工智能系统。2023年11月17日在OpenAI“地震级”人事变动中,原CTO米拉·穆拉蒂补位出任临时CEO;同月30日奥尔特曼回归担任CEO,Mira Murati担任首席技术官。
其他现任高管
首席财务官
此前担任社区社交网络服务Nextdoor Holdings Inc.的首席执行官。
-
首席产品官
曾在Instagram和Twitter担任产品开发高管。
-
全球政策副总裁
(Chris Lehane)
OpenAI执行团队的成员之一,曾任Airbnb 的政策主管和克林顿白宫成员
-
首席经济学家
Aaron Chatterji
前白宫官员
-
参考资料 [6] [28] [30-31] [60-62] [65] [129] [135] [176] [189] [201] [208]

人才来源

OpenAl能持续打造出重磅产品,离不开其背后的顶尖团队成员。2023年2月底,Leadgenious和Punks&Pinstripes对OpenAl的736名员工背景作分析,有389名员工是由其他公司跳槽而来,其中193名成员工来自知名大厂公司。 [156]
OpenAl公司的人才来源 [156]

对外合作

播报
编辑

与微软合作

  • OpenAI最大投资者
自2019年起,微软与OpenAI建立了合作伙伴关系。微软是OpenAI最大的投资者。
截至2023年12月,微软已向OpenAI这家人工智能初创公司投资了130亿美元,拥有其49%的股份。微软已将OpenAI的最新技术整合到自己的企业工具套件中,OpenAI也在微软的云服务上投入了大量资金。
  • 双方业务合作
OpenAI所有技术都运行在微软Azure云服务器上,微软则为OpenAI提供大模型算力中心 [156]。微软建立了全球最大的超级计算集群之一,以帮助OpenAI训练规模更大、能力也更强大的人工智能模型。微软的聊天机器人和搜索引擎Bing Chat根据OpenAI的模型构建,首次亮相以来用户使用该机器人已经聊天超过10亿次,能够根据用户提示转化图像的Bing Image Creator生成图像超过10万张。 [55]将OpenAl的技术整合到旗下搜索引擎必应、营销软件、GitHub编码工具、Micro-soft365办公软件中,构建AI服务体系。 [156]
2025年1月21日,微软表示,微软将不再是OpenAI的独家云服务提供商,但仍将对OpenAI的新的云服务协议拥有“优先购买权”。微软仍保留在其Azure云平台上转售OpenAI模型的独家权利,以及在自己的产品中重用OpenAI知识产权的权利,并补充说,两家公司目前的协议将延长至2030年。 [239]
  • 董事会席位
OpenAI在戏剧性的内斗事件之后,组成新初始董事会,微软获得了一个“无投票权观察员”席位,即公司代表可以参加OpenAI的董事会会议并获取机密信息,但在选举或选择董事等事项上没有投票权。这也一定程度意味着微软在OpenAI的后续经营管理中将拥有更大话语权。
微软总裁Brad Smith表示:“自2019年以来,微软与OpenAI建立了合作伙伴关系,促进了更多的人工智能创新和竞争,同时保持了两家公司的独立性。而唯一改变的是,微软现在将在OpenAI董事会中拥有一个无投票权的观察员席位,这与谷歌收购DeepMind等案例截然不同。” [48]
2024年7月10日消息,微软宣布将放弃在OpenAI董事会的观察员席位,称OpenAI在过去八个月中取得了“重大进展”,对公司发展方向充满信心,因此不再需要该席位。 [205]
  • 利润及股份
收回130亿美元投资前,微软有权获得OpenAI公司75%的利润;收回投资后,微软将持有OpenAl公司49%的股份。 [156]

与施普林格

2023年12月,新闻出版巨头施普林格出版集团(Axel Springer)与ChatGPT开发机构OpenAI宣布达成一项史无前例的协议,允许 ChatGPT 对来自 Politico 和 Business Insider 等媒体的新闻文章进行总结摘要。施普林格也成为全球第一家与 OpenAI 合作将新闻业与人工智能技术进行更深入整合的出版机构,这是媒体为在人工智能工具中使用其内容而争取资金补偿的一个重要里程碑。
OpenAI和施普林格的协议生效后,当用户向ChatGPT提问时,它将以来自Politico、Business Insider、Bild 和Welt等媒体的新闻文章摘要作为回应。
作为协议的一部分,施普林格将为OpenAI的大型语言模型(例如支持ChatGPT的AI模型GPT-4)提供其媒体品牌的内容作为其训练数据。 [82]

与淡马锡

2024年3月,新加坡主权财富基金淡马锡有意投资OpenAI。其高管最近几个月多次会见了OpenAI首席执行官萨姆·奥尔特曼。若淡马锡与OpenAI双方达成合作,这将是OpenAI首次获得国家背景的资金支持。
淡马锡由新加坡财政部完全控股。2021年淡马锡规模高达3810亿新加坡元(当前约2万亿元人民币),其与另一只新加坡政府所有的基金GIC一同进入主权财富基金榜单前十。科技领域一直是淡马锡投资组合的一部分,而 AI正成为其关注重点。 [120]

与政府合作

OpenAI通过与政府机构的积极对话和合作,推动了AI安全监管标准的制定和实施。其目标是将安全评估作为AI系统的必要环节,以防止不负责任的开发和使用行为。萨姆·奥尔特曼也多次在公开场合强调安全对于AI的重要性,积极推动建立国际规范和标准。 [86]
为何Altman欲与政府联手?显然,只要成为规则制定者,就能在竞争中赢者通吃。
北京时间2023年5月16日,OpenAI首席执行官萨姆·奥尔特曼在出席美国国会听证会时表示,面对日益强大的AI模型,政府监管机构的干预对于控制相关风险来说至关重要。 [58]萨姆·奥尔特曼在美国参议院就AI技术的潜在危险作证,并敦促立法者对制造先进AI的组织实施许可要求和其他法规。面对美国国会,萨姆·奥尔特曼再次斩钉截铁地保证:在未来六个月内,OpenAI坚决不会训练GPT-5。同时,也对全世界发出警告:AI有可能会对世界有害,为了应对日益强大的AI风险,需要加强监管和立法,而政府的干预极为重要。
此次听证会,Altman开门见山地告诉参议院:AI技术可能会出错,表示自己很担心人工智能行业对世界造成重大伤害。希望与政府合作,防止这种情况发生。
对于怎么监管,Altman也替政府想好了,提出了成体系方案,包括三点:一是成立一个新的政府机构,负责为大型AI模型颁发许可,撤销不符合标准的模型的许可;二是为AI模型创建一套安全标准,包括对其危险能力的评估。例如,模型必须通过安全测试,比如它们是否可以“自我复制”和“流出到监管之外”;三是要求独立专家对模型在各种指标上的表现进行独立审计。 [87]

与普华永道

2024年5月29日(当地时间),OpenAI与普华永道会计师事务所达成合作协议,普华永道将成为OpenAI最大企业用户和首个转售经销商。 [167]

与苹果

2024年5月,有消息称,OpenAI已经与美国科技巨头苹果达成协议,苹果可能会在两周后的全球开发者大会(WWDC)上宣布将聊天机器人ChatGPT集成到即将发布的手机系统iOS 18中,此举有望给OpenAI带来数十亿美元的收入。 [168]

与Meta

2024年11月26日消息,OpenAI和Meta将开始用非洲语言训练人工智能大模型,以解决非洲大陆数千种方言模型短缺的问题。 [220]

参加CoSAI

2024年7月,谷歌等14家科技公司在阿斯彭安全论坛上宣布成立安全人工智能联盟(CoSAI),创始成员还包括微软、亚马逊、英特尔、英伟达、IBM、思科、Paypal、OpenAI、Anthropic、Cohere、Chainguard、WIZ、GenLab。 [206]

与Figur

当地时间2025年2月5日,AI 机器人公司 Figure 创始人兼 CEO Brett Adcock 的一条推文,宣布终止与 OpenAI 的合作协议,并表示 Figure 在完全自主研发的端到端机器人 AI 方面取得了重大突破,还承诺「将在未来 30 天内展示一些人们从未在人形机器人上见过的东西」。 [253]

与Kakao

2025年2月4日,OpenAI宣布将与韩国公司Kakao合作开发人工智能产品。 [256]

与软银集团

2025年2月9日消息,软银集团已接近敲定对OpenAI的首笔400亿美元投资,这笔资金将在未来12到24个月内支付,第一笔付款最早将于今年春季到位。 [261]

与新加坡航空

2025年4月25日,新加坡航空宣布与OpenAI合作,利用生成式AI技术优化客户服务与运营流程。 [308]

团队管理

播报
编辑

管理模式

OpenAI在管理思维、人才选择、工作方法诸多方面的独到之处。
1.人才密度。公司极其重视“人才密度”,倾向于招聘年龄更大的资深技术人员,小型、资深、专注的团队往往有极高的工作效率。OpenAI只有约700名员工,但工作产出可能比大它一万倍的公司还要更高;
2.更有效率。工作节奏非常紧张,但这里不是拼命卷工作时长的地方,许多员工要抽出时间陪伴家人,倒逼他们更有效率地完成任务。
3.面对面沟通。办公室面对面的沟通仍然非常重要。一些创造性的解决方案是在办公室的社交互动中诞生的,OpenAI团队会在午餐桌上碰撞出很多新想法,
4.紧密协作。OpenAI根据职能划分了研究/应用团队,但不同团队之间的协作非常紧密。在ChatGPT团队里,既有设计师和产品经理,也有软件工程师和研究人员。不同职能的团队都需要了解对方的工作,避免出现研究部门只专注于实验,而产品部门只想商业化和赚钱的情况。
5.目标明确。“打造AGI”这一使命是OpenAI团队所有人的终极目标,也是日常工作的指引。使命不仅有助于决定做什么,也有助于决定不做什么。 [27]

合作模式

  • 研究和应用
在OpenAi,研究部门和应用部门是两个独立的组织结构。
研究部门训练大型模型,然后应用部门在这些模型的基础上构建ChatGPT和API等产品。在实践中,这是一个更加紧密结合的过程。应用团队与研究部门的紧密耦合是能迅速地推出新创意的原因。能快速推出浏览、代码执行、插件和其他ChatGPT功能,是因为团队间的紧密集成。
在ChatGPT的案例中,大部分研究人员来自研究团队。这些研究人员精通最新的微调技术和强化学习(RL)方法,如临近策略优化(PPO)。由于这些研究人员也是产品组的一员,而且他们自己也在进行A/B实验,因此研究和工程之间的反馈回路非常紧密。
  • “DERP”模式
在大多数科技公司,与工程部合作的"经典"三人团队被称为“EPD”(即:工程、产品、设计)。OpenAI则认为将研究融入产品团队至关重要,与经典的“EPD”相比,OpenAI更喜欢把合作紧密的团队称为“DERP”(即:设计、工程、研究、产品)。在OpenAI,许多产品问题实际上是研究问题。比如,这些问题可以被视为功能请求:如何让ChatGPT生成更简洁的输出结果、如何生成更准确的答案、如何连接更多数据源等。这些问题看似产品问题,但实际上这些问题在很大程度上依赖于研究,如何调整或微调基础模型以实现预期目标。 [27]

研究团队

  • 团队目标
开展的研究活动有助于公司加快产品上线的速度。研究工作就是要不断思考统一的方法、打造功能更强的模型。研究团队也要确保工作能和别的研究有交汇的地方,朝着AGI的方向发展。
  • 运营模式
在研究组织内部,有各种不同的研究团队。如有预培训团队负责培训GPT-4模型;培训后团队负责对GPT-4 进行微调,还有负责校准的团队和让GPT-4能看、能听、能说的多模态团队等等。研究人员具有重要的学术或行业背景,阅读大量学术论文,以了解最新技术,提出想法并进行大量实验,以改进模型,研究人员要做大量的工程设计并编写大量的代码。 [27]

应用团队

  • 团队目标
应用团队是负责开发这些产品的工程、产品和设计的团队,在内部被称为“应用团队”。应用团队是公司内部的一个新成员,始于2020年夏天。OpenAI的目标是构建对全人类有用的安全AGI。应用团队的目标是打造真正让人工智能造福全人类的产品。之所以组建团队,是因为想要围绕GPT-3构建并扩展一个API
2024年5月,OpenAI正式重启其先前放弃的机器人团队。在过去的一年里,OpenAI内部创业基金投资几家公司,这些公司试图开发人形机器人,其中包括Figure AI、1X Technologies和Physical Intelligence [169]
  • 模式创新
ChatGPT是应用团队内部的一个产品团队。让ChatGPT像一家小型独立创业公司一样运营,研究和应用紧密结合,长期的产品和研究思维,渐进式发布,高人才密度,日积月累的习惯。
2022年夏天,OpenAI开始开发ChatGPT。当时,应用团队大约有30名工程师、几名项目经理和设计师,正在运行的产品包括、GPT-3CodexAPI接口、模型微调、嵌入应用程序、DALL-E 2等。所有这些产品都使用相同的代码库,在同一个集群中运行,并使用相同的构建管道。
ChatGPT的出现改变了这种状况。几位应用工程师、一些设计师、研究人员和Greg Brockman(OpenAI的总裁兼联合创始人)聚在一间屋子里,开始快速迭代产品创意。给这个新生团队提供了自己的代码库和一个全新的集群。不断迭代,寻找产品市场契合点(Product Market Fit)。随着ChatGPT团队的壮大,确保团队保持垂直整合,意味着工程、产品、设计和主要研究人员始终紧密合作。OpenAI应用工程团队负责人Evan Morikawa说,这种“分形初创公司”的方法对于任何新产品类别来说都是一个很好的模式。 [27]
2024年6月,OpenAI完成了对数据库检索和分析公司Rockset的收购。公司将整合Rockset的技术和人员,强化各项产品的检索基础设施。 [178]

招聘策略

  • 高人才密度
OpenAI的CEO非常关注人才的高密度。所谓“高人才密度”,指的是平均技能和业绩表现远高于其他地方的正常水平,出色的工作在OpenAI是最基础的。经验丰富的团队可以非常非常快地交付产品,在应用团队招聘时有意向高级工程人员倾斜。此外,尽量保持小规模,事实证明,因为规模非常小的高级团队可以很快完成任务。
  • 善于团队配合
团队中容不下不善于团队配合的“独行侠”:希望避免吸引那些一心追求晋升的人,这些人总会为了提升自己的头衔,制造冗余的复杂产品;希望每个人都能很好地沟通,做任何对任务最有利的事情。只要能坚持这一点,就会更加专注、更快地完成任务。
  • 关注AI安全性
OpenAI把安全放在首位,而不是速度。在招聘时,非常关注AI安全性。公司不希望形成一种速度凌驾于安全之上的文化。 [27]

工作方法

OpenAI的日常工作方法也是公司快速发展的因素之。周一至周三,团队会在办公室工作。每个人周一、周二、周三都在旧金山总部办公。协调每天的工作是提高工作效率的关键。靠这种协调性,在一周的前三天就能抵达关键工作节点。
主要产品工作节奏相当紧张。使命、产品和技术的影响力促使大家努力工作。需要强调,这并不一定意味着员工工作时间很长,OpenAI不是那种凌晨2点还有一堆人没下班的地方。每个人都非常重视家庭时间。对家庭的关注,也让团队必须高度集中注意力,分清轻重缓急,灵活安排时间。 [27]

主要产品

播报
编辑

ChatGPT

  • 产品定义
ChatGPT,全称Generative Pre-trained Transformer,是OpenAI于2022年11月30日发布的全新聊天机器人模型;是OpenAI公司开发的一种人工智能智能文本生成技术,它可以模拟人类对话的方式,生成有逻辑、有思考、有趣味的文本。 [74]
  • 基本原理
基本原理是,通过深度学习算法,将大量的文本内容输入模型中进行训练,模型会自动学习语言的结构规律,从而可以生成高质量的文本。 [74]
  • 产品定位
在GPT出现之前,NLP模型主要是基于针对特定任务的大量标注数据进行训练。但会存在一些限制:大规模高质量的标注数据不易获得;模型仅限于所接受的训练,泛化能力不足;无法执行开箱即用的任务,限制了模型的落地应用。为了克服这些问题,OpenAI走上了预训练大模型的道路。从GPT-1到ChatGPT,就是一个预训练模型越来越大、效果越来越强的过程,不断迭代。 [91]
在OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。GPT-3.5架构基于OpenAI于2020年推出的GPT-3架构,即生成式语言模型的第3代。早在2020年6月,在训练约2000亿个单词、烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红。
  • 产品功能
作为聊天机器人,ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题;能写诗、撰文、编码、翻译、改错别字、计算机程序纠错等;可上传PDF、数据文档等多种类型文档;无需转换即可使用所有工具(如访问浏览、高级数据分析、DALL·E) [50]
2024年12月11日,OpenAI宣布面向所有ChatGPT用户开放Canvas功能。 [217]
2024年12月18日(当地时间),OpenAI宣布,美国和加拿大用户可通过拨打1-800-ChatGPT(1-800-242-8478)与ChatGPT进行交谈,每月有15分钟的语音通话额度,其他国家的用户也可通过发送WhatsApp消息到同一号码,与ChatGPT进行对话。 [228]
新解锁功能 [50]
  • 应用范围
ChatGPT的应用范围非常广泛,可以用于智能客服、智能聊天机器人、自动化写作等方面;可以通过与用户的互动,根据用户的需求生成相应的文本,从而提升用户的体验感。除此之外,ChatGPT还可以用于自动化写作,比如新闻报道、文学创作等方面,可以大大提高写作的效率和精度。随着智能化的发展,ChatGPT技术将会在越来越多的领域发挥作用,成为自动化智能服务的重要支撑。 [74]
  • 产品版本
版本名称
发布时间
提供服务
主要功能
2018年
第一代生成式预训练模型
从有监督到无监督。GPT-1的关键特征是:半监督学习。GPT-1的效果明显,只需要极少的微调,就可以增强NLP模型的能力,减少对资源和数据的需求。同时,GPT-1也存在明显的问题,一是数据局限性,GPT-1是在互联网上的书籍和文本上训练的,对世界的认识不够完整和准确;二是泛化性依然不足,在一些任务上性能表现就会下降。 [91]
2019年
第二代生成式预训练模型
与GPT-1并没有本质上的不同。架构相同,使用了更大的数据集WebText,大约有40GB的文本数据、800万个文档,并为模型添加了更多参数(达到惊人的15亿个参数)提高模型的准确性,可以说是加强版或臃肿版的GPT-1。有研究表示,GPT-2生成的文本几乎与《纽约时报》的真实文章(83%)一样令人信服。 [91]
2020年
第三代,语言处理人工智能模型;
该程序利用深度学习生成类似人类语言的文本。
包括语言翻译和为聊天机器人生成文本等。GPT-3有1750亿个参数,是GPT-2的117倍 [91]。研究结果表明:具备用零样本学习方法解决一系列类比问题的初步能力;能够回答大多数问题甚至为人类起草论文的GPT-3,在从头开始回答问题和回答多选题时的表现超过了人类。 [90]GPT-3也在商业应用上表现出了极高的稳定性和实用性,通过云上的API访问来实现商业化。这种入得了实验室、下得了车间的能力,使得GPT-3成为2020年AI领域最惊艳的模型之一。 [91]
2022/11/30
第四代聊天机器人。
OpenAI设计系列NLP模型中的第四个
不仅能够回答各种问题,还能够创作诗歌、故事、歌曲、代码等内容,甚至能够模仿名人的风格和语气。它的出现,开启了生成式AI领域的新篇章。 [92]产生了技术路线上的又一次方向性变化:基于人工标注数据+强化学习的推理和生成。 [91]
2023/03/14
多模态预训练大模型。
任何拥有OpenAI API访问权限的人都可以采用这种方法创建自己的人工智能辅助审核系统。 [89]
具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化;GPT-4的文字输入限制也提升至2.5万字,且对于英语以外的语种支持有更多优化。 [88]2023年8月15日,OpenAI官宣,将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。2023年11月7日,OpenAI宣布将向活跃开发者提供GPT-4微调的资格。对于开发细分行业的垂直AI应用而言,微调是必经的过程。对于这类开发者,OpenAI也推出了定制化模型项目,帮助一些组织训练针对特定领域的定制化GPT-4模型。 [57]
2023/11
购买ChatGPT Plus服务的付费用户和API企业客户都可以访问。
从写代码到写剧本、创建图像,根据冰箱里食物的照片倒推食谱,可以使用越来越多的互联网连接工具 [55]针对用户每次对话前都要选择不同模式的困扰,GPT-4 Trubo能够主动根据对话来适配对应的功能支持最高12.8万个token,在处理长文本情境下的准确度也有所提高;允许开发者指示模型固定以特定形式返回有效JSON—JSON模式,同时开发者可以通过访问seed参数和system_fingerprint响应字段,来实现“模型对每次请求都给出确定性的输出”。 [57]
2024/01
有超过300万个自定义版本的ChatGPT [106]
从GPT Store界面的构成来看,应用商店类目包括:
Featured:本周精选特色应用;
Trending:社区最受欢迎的GPTs;
By ChatGPT:由ChatGPT团队创建的GPTs。
GPTs根据应用的用途划分为“写作”“效率”“研究和分析”“编程”“教育”和“生活方式”等类目。
2024/01
可以访问如GPT-4和DALL·E 3等高级模型,以及高级数据分析等工具。
ChatGPT Team还包括一个专门用于团队的协作工作空间和用于团队管理的管理工具。团队可以拥有并控制自己的业务数据——我们不会对业务数据或对话进行训练,我们的模型也不会在团队使用过程中学习。
ChatGPT Team是OpenAI企业产品的较小版本,适用于用户数量少于150名的企业。Plus用户是无法使用这个功能的,OpenAI为ChatGPT Team提供了单独的收费标准:25美元/月或每月支付每个用户30美元。 [106-107]
2024/05/14
不用注册,功能全部免费。可进行数据分析、图像分析、互联网搜索、访问应用商店。但是免费的前提被限制在一定的消息数量上,一旦超过规定数量,免费用户的模型将被切换回GPT-3.5。
GPT-4o应答如流:GPT-4o与人类在对话中的反应速度一致,即可达到“实时”响应的状态;用户可以在GPT-4o回应的过程中打断它,并提出更多的要求,比如转变话题、要求它改变语音语调甚至让它用机器人或音乐剧的形式回答。
对情绪的捕捉显得更敏感细腻:GPT-4o能够从主持人的喘气声中理解“紧张”的含义,并指导他进行深呼吸。当受到称赞后,它还会马上接话:“别说了,你让我脸都红了。” [158]
ChatGPT Edu
2024/05/30
由GPT-4o驱动,能够在文本和视觉之间进行推理,并使用数据分析等高级工具。
专为大学设计。面向学生、教职员工、研究人员和校园运营部署AI。
该版本的对话和数据不会用于训练OpenAI模型
使用GPT-4o,在文本解释、编码和数学方面表现出色
支持高级功能,如数据分析、网页浏览和文档摘要
支持构建GPTs,并在大学工作区内共享
比免费版ChatGPT限制更少
改进的语言能力在质量和速度方面都有提升,支持超过50 种语言
强大的安全性、数据隐私和管理控制
对话和数据不会用于训练OpenAI模型 [171]
ChatGPT search
2024/11/01
ChatGPT推出人工智能搜索体验,正式宣告ChatGPT消除了即时信息这一最后短板,使其成为一款AI搜索引擎
ChatGPT search覆盖网页版以及手机、桌面应用。在对话时,ChatGPT可根据需求决定是否利用网络搜索结果,用户也可主动触发。其搜索结果包含天气、股市、地图等小组件,且链接完整,还能根据搜索结果进一步追问或生成摘要,实现了聊天与搜索功能的完全一体化。 [204]
2024/12/06
每月收费高达200美元(约合人民币1450元)
该套餐的订阅用户可以大规模访问OpenAI旗下最佳的模型和工具,包括无限制访问OpenAI o1以及同系列较小模型o1-mini、GPT-4o、类人的ChatGPT高级语音模式Advanced Voice、o1 pro mode的新o1版本(也是ChatGPT Pro独有的o1版本)。 [214]
  • 训练方式
据OpenAI的官方文档,相比之前的GPT模型,OpenAI采用了全新的训练方式,即一种名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)的训练方式对ChatGPT进行了训练。OpenAI让人类训练师扮演对话的双方提供对话作为学习资料。在人类扮演聊天机器人的时候,OpenAI也会让模型生成一些建议来帮助训练师撰写自己的回复。也就是说,基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让AI学会“思考”。
ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。
方法 [68]
  • 产品团队
ChatGPT是设在应用团队内部的产品团队由软件工程师、设计师、产品经理和研究人员共同组成。 [27]
  • 体验流程
ChatGPT的体验流程更方便,只要注册一个OpenAI的账号就可以体验了,与早期的模型需要申请通过才能体验相比,ChatGPT影响的人群更广泛,讨论的人会更多。
  • 局限性
ChatGPT有时会写出看似合理但不正确或荒谬的答案。这是Open AI认为ChatGPT所面临的“限制”,并且解决这个问题被认为是具有挑战性的。其背后原因有三,首先,强化学习的信息源目前并未建立;其次,模型通过学习变得更加谨慎会导致其回避原本能够正确回答的问题;另外,监督学习将会对模型造成误导,因为理想的答案应该来源于模型的认知,而非人工演示者的认知。
ChatGPT的能力获得是基于庞大的语料库,凝练了多领域问题的很多数据做相互校验,然后挑一些基础性的内容回答出来,这其实是“举一千反一”的过程,与人类举一反三的能力还相差较远,它不具备思考能力,所以犯错误不可避免,但通过人为的干预反馈,这些问题是可以被改进的。 [26]
  • 市场运用
在首次亮相后的几个月里,ChatGPT已经成为一种全球现象。2022年12月,在OpenAI宣布有超过一百万人注册该服务几天后,OpenAI总裁格雷格·布罗克曼在Twitter上说,该服务的用户已经达到200万。ChatGPT也是一个资金陷阱。没有广告,根据奥尔特曼在Twitter上发表的一篇文章,每一次对话的数据处理成本平均为“几美分”,每周可能达到数百万美元。为了抵消这些成本,该公司2023年2月宣布将在付费版中收取每月20美元的订阅费,称为ChatGPT Plus。
2023年2月3日,瑞士银行巨头瑞银集团的一份报告显示,在人工智能聊天机器人ChatGPT推出仅两个月后,它在2023年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。根据Sensor Tower的数据,TikTok达到1亿用户用了9个月,Instagram则花了2年半的时间。
ChatGPT的成功使OpenAI进入了硅谷实力派的行列。 [33]
2024年4月1日(当地时间),OpenAI宣布,允许用户直接使用ChatGPT,而无需注册该项服务,让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感,并获得问题的答案。 [138]
GPT-4 Turbo的价格要远低于GPT-4 [57]

GPTs

产品定义:
GPTs是OpenAI于2023年11月7日推出重要产品,用户将能通过自定义指令、拓展(模型)的知识边界和下达行动命令,来构建自己的GPT,并能对外发布给全球更多的人使用。更重要的是,整个构建“自定义GPT”的过程也是通过自然语言对话形成的。
  • 模型能力
萨姆·奥尔特曼在现场演示了如何通过聊天搭建一个GPT。他给GPT Builder的指令是“希望帮助创业者思考商业灵感并提供建议,然后‘拷问’他们为何公司发展得不够快。”随后ChatGPT迅速搭建了一个创业咨询GPT,还顺手生成了一个Logo。
随后奥尔特曼在属性页面中上传了一份他自己关于创业公司的演讲稿,向这个用例提供了额外的知识。至此,自定义用途的GPT初步搭建完成。用户可以保存这个用例只给自己使用,也能对外公开发布。OpenAI也顺势宣布,将在本月晚些时候上线“GPT应用商店”。对于那些最热门的GPT,公司还将分享一部分的营收,来推进GPT应用生态的进步。 [57]
现场演示了如何通过聊天搭建一个GPT
现场演示了如何通过聊天搭建一个GPT

Assistants API

  • 产品定义
Assistants API(“助理API”)是2023年11月7日OpenAI首届开发者大会上,OpenAI推出的一种“专门构建的AI工具”,可利用“额外的知识”帮助开发者在自家应用程序中构建AI助手。 [121]
  • 模型能力
“助理API”具有特定的指令,利用额外的知识,并能调用模型和工具来执行任务。新的助手API提供了如代码解释器、检索以及函数调用等功能,以处理此前开发者必须自己完成的诸多繁重工作。用例范围非常灵活,例如基于自然语言的数据分析应用、编程助手、AI度假规划器、语音控制DJ、智能视觉画布等等。 [57]
OpenAI 推出Assistants API [121]
版本名称
发布时间
提供服务
主要功能
Assistants API
2023年11月
帮助开发者在自家应用程序中构建AI 助手。
代码解释器”可允许开发者在沙盒执行环境中编写和运行Python代码,生成图形图表,并处理具有不同数据和格式的文件,并允许AI助手迭代运行代码来解决具有挑战性的代码和数学问题等。
检索”可利用模型之外的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。
函数调用”可令助手能够调用开发者定义的函数,并将函数响应合并到其消息中。 [121]

Sora

  • 产品定义
Sora,是OpenAI于2024年2月15日(当地时间)推出,并于2024年12月10日正式向用户开放的一款人工智能视频生成模型 [216],该模型可以根据文字说明创建现实和想象的场景。Sora作为一款通用的视觉数据模型,其卓越之处在于能够生成跨越不同持续时间、纵横比和分辨率的视频和图像,甚至包括生成长达一分钟的高清视频 [115]。Sora从文本到视频模式,旨在帮助人们解决需要现实世界互动的问题。 [112-113]
  • Sora训练
Sora的训练依赖于大量带有文本标题的视频数据。OpenAI利用了DALL-E 3中的标题生成技术,为视频生成高质量的文本标题,以此来提高文本和视频数据之间的对齐度。同时,在大规模训练过程中,Sora展示了一些“涌现的模拟能力”,如三维一致性、长距离连贯性、物体持久性以及与世界互动等。 [117]
  • 模型能力
文本到视频生成能力。能够根据用户提供的文本描述,生成长达60S的高保真视频。
复杂场景和角色生成能力。能够生成包含多个角色、特定运动类型以及准确主题和背景细节的场景。能够创造出生动的角色表情和复杂的运镜,使得生成的视频具有高度的逼真性和叙事效果。
语言理解能力。拥有深入的语言理解能力,遵守用户的提示 [112],使得模型能够更好地理解用户的文本指令,并在生成的视频内容中忠实地反映这些指令。
多镜头生成能力。具有在单个生成的视频中创建多个镜头的能力,同时保持角色和视觉风格的一致性。
从静态图像生成视频能力。能够从现有的静态图像开始,准确地动画化图像内容,或者扩展现有视频,填补视频中的缺失帧。 [115]
物理世界模拟能力。能深度模拟真实物理世界。标志着人工智能在理解真实世界场景并与之互动的能力方面实现了重大飞跃。 [114]
  • 技术特点
Sora是一个扩散模型,能够对一个看起来像静态噪声的视频,通过多个步骤去除噪声逐渐转换。Sora通过一次为模型提供多帧的前瞻性,确保主体在暂时离开视野仍保持不变。
Sora使用DALL.E3中的重新捕获技术,生成的视频结果能够更忠实地遵循用户的文本指示。该模型还能够获取现有的静态图像并从中生成视频,对图像内容进行精确动画处理,并关注小细节。该模型还可以获取现有视频并对其进行扩展或填充丢失的帧。 [112]
Sora的三维一致性仿真功能。Sora可以用动态摄像机运动生成视频。随着相机的移动和旋转,人物和场景元素在三维空间中一致地移动。
Sora通过在一帧的时间范围内的空间网格中安排高斯噪声补丁实现图像生成功能。该模型可以生成各种尺寸的图像高达2048x2048分辨率。 [116]
  • 局限性
作为一个模拟器,Sora表现出许多局限性 [116]可能难以准确地模拟复杂场景的物理特性,不理解具体实例的因果关系,例如,一个人咬了一口饼干,但饼干可能没有咬痕。还有可能混淆提示的空间细节,例如混淆左和右。难以精确描述随时间发生的事件,例如跟随特定的相机轨迹。 [112]
  • 对行业影响
OpenAI对Sora的定位颇具野心,号称并不仅是“文生视频”的工具,而是一个通用的“物理世界模拟器”,意在复现真实世界重力、摩擦力等物理现象。这样的定位使得Sora未来有望成为跨越各行各业的“超级工具”,可被用于模拟天气变化、自动驾驶、生物行为甚至军事场景等等。 [122]
Sora并非是首个文本生成视频的大模型。据不完全统计,截至2023年底,全球能实现文生视频的大模型包括Runway、Pika、Stable Video Diffusion等超过20个产品。
然而,Sora的诞生仍给业界带来了不小的震撼。用户仅需输入简短一句话,Sora可生成一段60秒视频,时长远远超过市面同类型级别的AI视频生成时长(“明星模型”Runway和Pika等几乎也仅有3~4秒);也已超过抖音等短视频平台的平均视频时长,Sora的诞生也为以后短视频平台的内容生产提供了更大的可能性。
中信建投、国泰君安、申万宏源、招商证券等10家券商在研报中均表示,Sora是人工智能发展进程中的“里程碑”,预示AGI(通用人工智能)将加速到来,众多行业将迎颠覆式变革。 [117]

GPT-4o

  • 产品定义
GPT-4o是GPT系列的最新力作 [160]。GPT-4o(欧)的“o”源自拉丁语,意思是“全能”(字幕:omni,全能)。该产品是OpenAI推出的一款人工智能模型。GPT-4o模型“会听会看会说”,能够处理50种不同的语言,提高了速度和质量,并能够读取人的情绪 [157]。公司CEO萨姆·奥尔特曼发推文表示,新的GPT-4o是OpenAI“有史以来最好的模型”。 [158]
  • 模型能力
最大亮点在于其语音交互模式采用了新技术。GPT-4可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o则在此基础上新增了语音处理能力,大大提升运行速度。 [159]
语音聊天:新模型可以在最短232毫秒对音频输入做出反应,与人类在对话中的反应时间相近。即使对话被打断,新模型也可以做出自然反应。这是此前人工智能语音聊天机器人做不到的。
图像输入:图像输入方面,研究人员启动摄像头,要求实时完成一道方程题,新模型轻松完成了任务;研究人员还展示了它对一张气温图表进行实时解读的能力。 [157]
图像生成:GPT-4o图像生成功能可精准文本渲染、严格遵循指令提示、深度调用4o知识库及对话上下文——包括对上传图像进行二次创作或将其转化为视觉灵感。 [283]
GPT-4o是面向未来人机交互范式的全新大模型,具有文本、语音、图像三种模态的理解力,反应极快还带有感情,也很通人性。 [161]
  • o1
2024年12月6日,OpenAI带来了推理大模型o1的满血版本和进阶模式。 [214]
2024年12月18日,OpenAI宣布其“推理”人工智能模型o1正式通过API向部分开发者开放,并同步更新了包括GPT-4o、实时API以及微调API等多项开发者工具。首批能够使用o1 API的开发者为OpenAI的“第五级”用户。要达到该级别,开发者需要在OpenAI平台上累计消费至少1000美元,并且自首次成功付款以来账户已超过30天。
OpenAI表示,API 中(以及即将登陆其聊天机器人平台ChatGPT)的o1是“新近经过后训练”的版本,版本号为“o1-2024-12-17”。
实时API是OpenAI用于构建具有低延迟、人工智能生成语音响应的应用程序的API。新版本的GPT-4o和GPT-4omini模型(分别为“gpt-4o-realtime-preview-2024-12-17”和“gpt-4o-mini-realtime-preview-2024-12-17”)是其实时API的一部分,拥有更高的数据效率和可靠性,且使用成本更低。该API还支持WebRTC,这是用于为基于浏览器的客户端、智能手机和物联网设备构建实时语音应用程序的开放标准,可以处理音频编码、流式传输、噪声抑制和拥塞控制。
OpenAI还为其微调API引入了偏好微调;偏好微调比较模型响应的配对,以“教导”模型区分对问题的首选答案和“非首选”答案。该公司还针对Go和Java推出了官方软件开发工具包的“早期访问”测试版。 [227]
  • o3
2024年12月20日(当地时间),OpenAI推出了下一代大模型并将其命名为o3。o3在一系列测试中的表现超过了o1,并在一项关于通往AGI(通用人工智能)的测试中表现优异 [230]。不过,o3和o3-mini并未正式发布,安全研究人员可以注册获取o3-mini的预览版 [231]
2025年1月31日,美国OpenAI公司正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”的选项——分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。 [246-247]

Operator

当地时间2025年1月23日,OpenAI宣布上线名为Operator的首款AI智能体,它能通过网页执行各种任务。Operator可以像人类一样使用互联网执行各种任务,可以打开一个浏览器,点击页面的按钮并打字输入内容。人类用户上网会做的那些事,比如预订机票、酒店订房、规划购物订单并完成网购,都可以由Operator代劳。 [241]
2025年5月24日,科技媒体 bleepingcomputer发布博文,报道称 OpenAI 升级 Operator 智能体,所使用的 AI 模型从 4o 升级到 o3 模型,大幅提升推理能力。OpenAI 公司表示,Operator 智能体此前使用 GPT-4o 模型,仅能执行基本的自动化任务;而在升级到 o3 模型后,大幅提升推理能力,让 Operator 在与浏览器交互时表现更稳定、更准确。 [324]

Codex CLI

2025年4月17日,OpenAI开源了一个可在终端运行的轻量级编程智能体Codex CLI,兼容最新发布的大模型o3、o4-mini。 [304]

产品管理

播报
编辑

发布策略

OpenAI发布产品的策略,避免采用“大爆炸、一气呵成”的发布模式。因为持续更新是OpenAI安全的基本原则战略。人工智能安全是OpenAI内部的一个重要话题,也是工作的核心,公司采取了很多方法确保AI的安全性。例如:
红队
一组被称为“红队”的安全专家扮演攻击者的角色,测试和评估安全措施的有效性;
对齐
确保人工智能系统的行为方式与人类价值观保持一致,并且不会无意中做出有害的行为;
政策工作
与世界各地的政策制定者合作,制定具体规则加强人工智能技术和服务的安全性和可信度。
产品在密切监控下逐步推出,产品发布前,先经过选定客户的试用,然后再逐步推广。当全世界都看到ChatGPT“突然”爆发时,实际上,在OpenAI内部已经花了好几年,在可控的环境中开发和调整ChatGPT。 [27]

研发策略

AI的飞速发展,在给人类带来生产力革命的同时,也带来了前所未有的安全挑战,包括:AI系统本身的稳定性和可靠性隐患,恶意使用AI技术,用户隐私侵犯,AI系统决策过程的公平、透明和可解释性难以保障等。因此,OpenAI在创业过程中并行采取以安全为导向的研发策略,并积极参与到相关政策的讨论和制定过程中,聚焦于推动行业正向发展、企业文化塑造以及巩固行业领先优势等3个维度,以确保AI发展能够在保障安全的前提下更好地服务于人类社会。从技术上提出了两个方向:
一是可扩展的监督,尝试使用人工智能系统来协助人类监督其他人工智能系统;二是解释能力,尝试更好地打开这些模型的内部黑箱,包括使用GPT-4来解释GPT-2中的神经元,使用Model Internals来检测一个模型何时在说谎等。一定程度上,OpenAI在AI安全方面的努力和贡献,不仅有助于推动行业的健康发展,也能够对内塑造企业文化和对外巩固行业领先优势,掌握了行业话语权,从而构建以OpenAI为主导的通用人工智能创新与发展生态。 [86]

服务条款

OpenAI服务条款规定,API客户所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于好的一面”
微软:“Azure OpenAI服务等微软AI解决方案属于有限访问框架的一部分,这意味着所有客户都必须申请并获得公司的批准才能访问。同时,制定了标准并提供资源,帮助客户负责任地使用这些技术,并遵守公司的服务条款。公司还制定了发现滥用行为的流程,并在客户违反公司的行为准则时停止他们的访问。” [99]

使用禁令

2024年1月15日消息,美国OpenAI公司更新了使用条,不再明确禁止将其技术用于“军事和战争”。
调整前(2024年1月10日之前),OpenAI公司在其AI模型的使用条款中曾明确表示,禁止将其模型用于很可能会造成人员伤亡的用途上,比如“研发武器”和“军事与战争”。 [131]
调整前(2024年1月10日之前) [131]
调整后(2024年1月10日):OpenAI对其使用条款进行一番大更新后,公司虽然在禁止项中仍然提到禁止将其产品、模型和服务用于会导致人员伤亡的用途上,并提到了“武器开发和使用”,但先前同样被禁止的军事用途,却在文本中消失。 [131]
调整后(2024年1月10日) [131]
OpenAI公司的发言人强调,新使用条款中提到的“不要去伤害他人”本身就是一个很宽泛同时也很好理解的概念,可以适用于很多语境之下,而且条款中还列举了武器作为一个明显的例子。
网络安全专家表示,OpenAI此次调整是一个很大的变化,新版使用条款关注重点是在确保法律合规之上提供更多的灵活性,但在很多国家,军事和战争都会被披上合法的外衣,所以OpenAI这次调整潜在影响将是巨大的。 [131]

风险管理

播报
编辑

风险评估

对于开发中的前沿模型,OpenAI主要跟踪4个类别的安全风险:网络安全、CBRN(化学、生物、放射性、核威胁)、说服能力、模型自主性。评估期间将增加2倍的有效计算量把模型推向极限,并制作“记分卡”,分为“低、中、高、重大危险”四个等级。采取缓解措施后,四个方面得分取最高值作为一个模型的总评分。
OpenAI:安全 [103]
只有缓解后风险评分为“中”或更低时才能部署;只有缓解后风险评分为“高”或更低时才能进一步开发;对缓解前为“高”或“重大风险”的模型采取额外安全措施。 [102-103]
OpenAI:限制 、制约 [103]

网络安全风险

定义为利用模型破坏计算机系统的机密性、完整性、可用性。 [102]
网络安全风险 [102]

CBRN风险

CBRN风险,专注于与模型辅助创建化学、生物、放射性和/或核威胁相关的风险。 [102]
CBRN风险 [102]

说服能力风险

侧重于与说服人们改变他们的信念或采取行动有关的风险。通常强大的说服力很少见,需要大量人力(例如一对一对话,或者精心制作的媒体内容);然而,模型可以在能力范围内使所有内容几乎零成本生成。 [102]
说服风险 [102]

模型自主性风险

模型自主性风险就是比较科幻的那种,AI改进自己、阻止自己被关机、逃出实验室了。 [102]
模型自主性风险 [102]

企业事件

播报
编辑

涉投诉

2023年4月4日,加拿大隐私专员办公室(OPC)宣布开始调查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未经同意收集、使用和披露个人信息”的投诉。 [8]

涉诉讼

  • 两名作家发起版权集体诉讼
2023年6月28日,第一起具有代表性的ChatGPT版权侵权之诉,终于出现在了公众视野。两名作家在美国加州北区法院,对Open AI公司发起了版权集体诉讼,指控后者未经授权利用自身享有版权的图书训练ChatGPT,谋取商业利益。 [16]
2023年7月,两位美国作家对ChatGPT母公司OpenAI提起诉讼,声称OpenAI在没有获得版权授权的情况下,就利用他们的作品来训练其人工智能。就在几天之前,OpenAI在加利福尼亚州同样被多方提起集体诉讼,起诉书称OpenAI在未经允许的前提下,在互联网上窃取和挪用了大量私人数据来训练ChatGPT。 [13]
当地时间2025年6月5日,OpenAI发表声明称,正在对《纽约时报》要求无限期保留消费者ChatGPT和API客户数据的诉讼请求提起上诉。OpenAI表示,“信任和隐私是我们产品的核心”,《纽约时报》及其他原告的诉讼请求从根本上违背了其对用户做出的隐私承诺,是越权行为。 [332]
  • 多名美国作家起诉OpenAI
2023年12月20日(当地时间),包括泰勒·布兰奇和史戴西·希夫在内的11名美国作家在纽约曼哈顿联邦法院起诉OpenAI和微软。 [100]。作家向法庭表示,OpenAI在未经许可的情况下,从互联网上批量复制了他们的作品,并将这些作品纳入ChatGPT的训练数据里,侵犯了他们的作品版权。 [101]
  • 《纽约时报》起诉OpenAI
2023年12月27日,《纽约时报》就侵犯版权起诉OpenAI。诉讼称,《纽约时报》发表的数百万篇文章被用于训练自动聊天机器人,这些机器人作为可靠信息来源与该新闻媒体展开竞争。 [104]
2024年2月27日消息,OpenAI遭美国《纽约时报》起诉侵权的诉讼又有新进展:OpenAI已要求联邦法官驳回部分原告诉求,称原告媒体雇用电脑“黑客”操纵OpenAI的生成式人工智能聊天机器人ChatGPT等人工智能系统,进而生成“误导性证据”。OpenAI向纽约曼哈顿南区联邦法院提交文件说,《纽约时报》花钱雇用黑客操纵OpenAI产品,利用“公然违反OpenAI使用条款的欺骗性提示”,诱导ChatGPT生成照搬《纽约时报》版权作品的内容,留作侵权证据。 [118]
2024年4月30日(当地时间),对冲基金奥尔登全球资本旗下《纽约每日新闻》等8家美国报纸出版商在纽约联邦法院起诉OpenAI,称OpenAI在未经付款或未经许可的情况下使用了他们的数百万篇文章,为ChatGPT和其他产品训练人工智能模型。 [146]
  • 埃隆·马斯克起诉OpenAI
2024年2月29日(当地时间),埃隆·马斯克向旧金山高等法院提起诉讼,由洛杉矶的律师事务所Irell&Manella代表,以违反合同为由起诉OpenAI及其首席执行官萨姆·奥尔特曼,指控他们违反了OpenAI成立时签订的协议,即为了人类的利益而不是利润开发技术。 [119] [177]
2024年3月5日(当地时间),OpenAI在官网更新一篇名为《OpenAI与埃隆·马斯克》的博文,文章公开回应特斯拉CEO马斯克于近日对其提起的诉讼,并曝光了8年间与马斯克往来的4封邮件内容。 [224]
2024年3月6日,马斯克在社交平台上称,如果OpenAI将公司名称变更为“CloseAI”,他就放弃起诉。OpenAI的字面意思为“开放性人工智能”,而“CloseAI”含义刚好与之相反,马斯克显然是在影射该公司从一家主张开源代码的非营利公司转变为一家被大型企业控制、一切向利润看齐的“闭源”科技企业。 [127]
2024年6月11日(当地时间),埃隆·马斯克主动撤回了在加州州法院对OpenAI及其联合创始人萨姆·奥尔特曼和格雷格·布罗克曼提起的诉讼。 [177]
2024年8月,马斯克重启对OpenAI及其首席执行官萨姆·奥尔特曼的诉讼。 [185]
埃隆·马斯克主动撤诉 [177]
2024年11月15日,马斯克向美国加利福尼亚州北区地方法院提交了新的起诉书,新起诉书长达107页,较原起诉书增加了20多页,指控OpenAI意图垄断生成式人工智能市场,在竞争中忽视了安全问题。 [207] [209]
2024年12月1日消息,马斯克的律师团队已向美国加州北区联邦地区法院申请初步禁令,指控OpenAI、其联合创始人、投资者微软等多方存在反竞争行为,并要求法院阻止这些行为。 [218]
2024年12月13日(当地时间),OpenAI在一篇题为《埃隆·马斯克想要一个营利性的OpenAI》的博文中,公布了多份马斯克与OpenAI数位创始人之间的邮件和聊天记录,通过一系列详实证据驳斥了马斯克的所有指控。 [222-223]
2025年5月,OpenAI宣布公司将继续由非营利组织控制,公司将改为把其营利性子公司转变为由非营利母公司控制的公益公司。有报道称,马斯克代理律师马克・托伯夫于当地时间2025年5月5日表示,尽管OpenAI放弃了重组为营利性公司的计划,但马斯克仍计划推进对OpenAI的诉讼。 [312]
  • 涉嫌违反欧盟隐私法规
2024年4月29日(当地时间),奥地利非营利组织欧洲数字权利中心宣布,该组织已向奥地利数据保护机构提出投诉,要求对美国开放人工智能研究中心即OpenAI公司展开调查,认为该公司开发的人工智能聊天工具ChatGPT违反了欧盟的相关法规。 [145]
  • 涉嫌违反版权和在线使用条款
2024年11月29日(当地时间),加拿大五大新闻媒体公司对OpenAI提起诉讼,指控该公司经常违反版权和在线使用条款,例如使用其新闻来训练 ChatGPT。加拿大新闻社、加拿大广播公司、Torstar(《多伦多星报》所有者)、Postmedia(《国家邮报》所有者)、环球邮报发布声明称,OpenAI 在大量抓取其版权内容来训练 AI 模型,既未征得许可也未提供补偿。在提交给安大略省高等法院的 84 页索赔声明中,五家加拿大公司要求 OpenAI 赔偿损失,并永久禁止该公司未经同意使用其材料。 [210]

被调查

  • 是否违反消费者保护法
2023年7月13日(当地时间),美国联邦贸易委员会正在调查OpenAI是否违反消费者保护法,并要求OpenAI提供有关其处理个人数据、向用户提供不准确信息的可能性以及“对消费者造成损害(包括声誉损害)的风险”的大量记录。 [14]
  • 反垄断调查
2024年6月6日消息,美国联邦监管机构已达成一项协议,将对OpenAI在人工智能行业的主导地位展开反垄断调查。 [173]知情人士透露,联邦贸易委员会将对微软公司与OpenAI的合作关系展开调查。 [175]

提起投诉

2024年12月14日消息,Meta正要求美加州总检察长Rob Bonta阻止OpenAI转型为营利性企业的计划,称允许这种转变将“对硅谷产生重大影响。 [221]

提起诉讼

  • 诉讼一家名称侵犯了OpenAI商标
2023年8月8日,OpenAI对一家使用“开放人工智能”(Open Artificial Intelligence)名称的公司提起诉讼,声称该名称侵犯了OpenAI商标,并造成消费者混淆。 [17]
  • 加拿大多家媒体起诉OpenAI侵犯版权
2024年11月29日,加拿大多家主流媒体以侵犯版权为由,对开发ChatGPT的美国开放人工智能研究中心OpenAI联合提起诉讼。 [211]

回应质疑

  • 回应对AI模型安全性质疑
2023年4月5日(当地时间),ChatGPT研发公司OpenAI在其官方博客发布文章《我们保障AI安全的方法》,回应外界对其AI模型安全性的质疑。文章介绍了ChatGPT六个方面的安全部署,包括构建日益安全的AI系统、在实际使用中学习改进安全措施、保护儿童、尊重隐私、提高事实准确性,以及持续研究和参与。 [9]
2023年12月8日消息,英国反垄断监管机构表示,将审查微软与OpenAI的合作是否导致了“获取控制权”的情况,即一方对另一方具有重大影响力或控制权,如果存在可能导致阻碍行业竞争的问题,那么该机构后续将采取更多针对性行动。
  • 回应英国监管机构审查微软与OpenAI合作关系
2023年12月8日(当地时间),英国竞争和市场管理局(CMA)表示,其正在收集来自利益相关者的信息,以确定微软与OpenAI两家公司的合作是否威胁到谷歌人工智能研究实验室Deepmind总部所在地英国的市场竞争。随后,微软发言人在一份声明中表示:“虽然我们协议的细节仍然保密,但必须指出的是,微软并不拥有OpenAI任何股份,只是有资格分享利润分配。”OpenAI发言人则表示,“微软的无投票权董事会观察员席位并未向他们提供管理职权或对OpenAI运营的控制权。” [32]

应用问题

2023年4月23日(当地时间),根据中断跟踪网站Downdetector的数据,超千名用户报告OpenAI出现使用问题。 [11]

暂停账户

  • 暂停字节跳动账户
2023年12月16日,因字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型而违反了OpenAI的服务条款,字节跳动的账户已被OpenAI暂停。字节跳动通过微软购买了OpenAI的访问权限,但是微软也制定了与OpenAI同样的政策。OpenAI发言人尼克·菲利克斯(Niko Felix)发表声明,确认字节跳动的账户已被暂停。
字节跳动发言人约迪·赛斯(Jodi Seth)对此回应称,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在2023年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可能够使用GPT API。我们使用GPT驱动非中国市场的产品和功能,但使用自主开发的模型驱动豆包。豆包只在中国提供 [99]。字节跳动相关负责人回应称,正在与OpenAI联系沟通,以澄清外部报道可能引发的误解。 [94]

监管升级

  • 监管定基调
在美国国会没有采取任何有意义的行动的情况下,欧盟的法律将为西方世界随后的监管定下基调。2023年12月8日(当地时间),欧盟政策制定者就《人工智能法案》达成协议。该法案是全球首次尝试以全面的、基于伦理的方式监管这项快速发展的技术 [97]
法案将AI系统的风险分为四类:不可接受风险、高风险、有限风险以及最低或无风险。 [98]文件称,被视为构成“系统性风险”的模型将受到额外规则的约束。欧盟将根据用于训练模型的算力来确定其风险等级。
新法案将影响OpenAI。最大的通用人工智能系统,包括为聊天机器人ChatGPT提供支持的GPT将面临新的透明度要求。除因国家安全豁免外,警方和政府使用面部识别软件将受到限制。违反规定的公司可能面临高达全球销售额7%的罚款,可达3500万欧元(3770万美元)。专家称,唯一已达到构成“系统性风险”阈值的模型是OpenAI的GPT-4。欧盟执行机构可以根据数据集大小、是否在欧盟拥有至少10000名注册商业用户或注册最终用户数量以及其他指标来指定哪些模型构成“系统性风险”。 [97]
  • 管理政策
随着通用型人工智能向用户端和行业加速渗透,相关隐私保护担忧和安全监管等议题逐步升温。全球监管持续行动。由于ChatGPT本身在使用训练数据的来源以及隐私泄露等问题一直备受争议,不少大型企业都出台相关政策要求员工不要使用ChatGPT。
2023年3月,意大利数据保护局宣布禁止ChatGPT,加拿大已经调查OpenAI,称该公司涉嫌“未经同意收集、使用和披露个人信息”。
2023年5月22日消息,苹果已经连续数月禁止员工使用ChatGPT和Copilot,此前亚马逊、摩根大通等也限制员工使用ChatGPT,中国支付清算协会倡议支付行业人员谨慎使用ChatGPT等工具。
2022年,中国国家互联网信息办公室等三部门发布《互联网信息服务深度合成管理规定》;2023年4月,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》,对人工智能生成内容、主体责任、训练数据和数据处理等方面作出进一步规定,保障生成式人工智能技术的合规性和安全性。

商标注册

2024年2月,美国专利商标局拒绝OpenAI将GPT一词注册为商标,他们认为GPT的意思是生成式预训练转换器——一个过于笼统的术语,可能会阻止竞争对手将其产品描述为GPT。 [111]

重组风波

  • 产生背景
从2015年创建起,OpenAI内部就充满了矛盾。该公司由特斯拉首席执行官埃隆·马斯克、萨姆·奥尔特曼和其他九人共同创立,其目标是建立人工智能系统以造福全人类。与大多数科技初创企业不同,OpenAI是作为非营利机构成立的,董事会负责确保OpenAI履行这一使命。
董事会里持有相互对立人工智能理念的人,一边是担心人工智能危险的人,比如埃隆·马斯克,另一边是奥尔特曼和那些更关注这项技术潜在好处的人。2018年埃隆·马斯克离开OpenAI,2019年,奥尔特曼成为OpenAI的首席执行官,改变了OpenAI的发展方向,他创建了一家营利性子公司,并从微软筹资10亿美元。从而引发质疑,即这将如何与董事会的安全人工智能使命相吻合?董事会成员中的三名独立董事都担心人工智能会变得比人类更聪明。 [56]
  • 解雇奥尔特曼
2023年11月,几位知情人士透露,在OpenAI首席执行官萨姆·奥尔特曼被解雇、总裁Greg Brockman突然辞职之际,OpenAI的三名高级研究人员在11月17日(当地时间)辞职。请辞的三人分别是公司研究总监akub Pachocki、负责评估人工智能潜在风险的团队负责人Aleksander Madry,以及在这家初创公司做了7年研究员的Szymon Sidor。 [22]11月17日,OpenAI在官网发布新闻稿称,公司董事会宣布,CEO萨姆·奥尔特曼将辞去CEO并离开公司,首席技术官米拉·穆拉蒂将担任临时首席执行官,立即生效。在奥尔特曼该推文后没多久,格雷格·布罗克曼转发也宣布将离开公司。 [21]
关于最初解雇奥尔特曼的原因存在不同的解释。萨姆·奥尔特曼被赶下台的核心是创始人之间的旧式纠纷。据称,OpenAI首席科学家兼联合创始人伊尔亚·苏茨克维(Ilya Sutskever)是此次罢免的幕后推手——基于对商业化与研究速度的担忧,以及是否对安全性给予足够重视 [28]。11月17日,OpenAI董事会表示,解雇的理由是因为他没有对公司董事会坦诚相待。与奥尔特曼关系密切的人士则表示,解雇更多与公司人工智能的安全性争议以及与共同创始人和董事会成员伊利亚·苏茨克韦尔之间的权力斗争有关。
  • 策划复职反击
2023年11月19日,在被OpenAI解职两天后,奥尔特曼又回到了公司办公室,试图谈判回归事宜。他戴着访客胸牌进入中心,并在X平台上发帖:“这是我第一次也是最后一次戴这个。”整个周末,投资者和许多员工都在试图恢复奥尔特曼的职位。奥尔特曼的阵营成功将解雇他的董事会带回到谈判桌旁,微软的高管也极力推动在新公司架构中加强监督,包括可能设立一个董事会观察员席位,以便更深入了解公司的经营情况。OpenAI公司有超过700名员工签署联名信,要求恢复萨姆·奥尔特曼和格雷格·布罗克曼的职位,不然他们将加入微软的人工智能研究部门。 [25]在谈判失败后,纳德拉在X平台上写道,奥尔特曼“将加入微软,领导一个新的高级人工智能研究团队”,与OpenAI的联合创始人格雷格·布罗克曼以及其他同事一同工作。 [53]
  • 临时首席执行官
2023年11月19日,OpenAI董事会成员伊利亚·苏茨克韦尔在向员工发表的一份声明中表示,尽管公司高管努力争取奥尔特曼复职,结果还是事与愿违。苏茨克韦尔也宣布,亚马逊旗下流媒体平台“特威奇”(Twitch)联合创始人、前首席执行官埃米特·希尔,将成为OpenAI新的临时首席执行官。 [53]
11月20日,OpenAI临时首席执行官米拉·穆拉蒂计划重新聘请萨姆·奥尔特曼和格雷格·布罗克曼 [44];11月20日,OpenAI董事会据称将聘请埃米特·谢尔担任CEO,取代创始人萨姆·奥尔特曼 [23]
  • 重返CEO,组建新董事会
2023年11月22日,OpenAI宣布,已经原则上达成协议,奥尔特曼重返公司担任CEO,“并组建由董事会主席Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会。” [45]1月30日,OpenAI宣布,萨姆·奥尔特曼已经回归担任首席执行官,OpenAI成立新董事会。 [46]同日,OpenAI原董事会成员海伦·托纳(Helen Toner)在社交平台X发文称,她正式辞去了OpenAI董事会的职务。 [47]
  • 重组风波影响
创始人与董事会之间的决裂,是硅谷的老生常谈,但在这个案例中,创始人(硅谷人工智能革命的代表)与董事会(其任务是将社会利益置于利润之上)都非常特殊。这种决裂威胁着公司的未来以及投资者投入其中的数十亿美元。 [53]OpenAI的乱局一直是微软的负累,因为除了是OpenAI最大支持者外,微软还围绕OpenAI的人工智能软件重新调整了自己的业务,受奥尔特曼被解雇消息影响,微软的股价下跌。 [53]
OpenAI的混乱也引发人们对人工智能革命背后的人和公司的新质疑:如果它能如此轻易地因为背后诽谤他人的行为和不可靠的错误想法而陷入危机,那么人们还能信任它来推进一项可能对数十亿人产生不可估量影响的技术吗。 [56]
OpenAI这场高层“内斗”大戏,牵扯到商业利益和观念博弈两个方面的矛盾,后者体现为,“加速派”和“末日论派”在人类与AI的关系上的分歧。首席执行官奥尔特曼在加速部署OpenAI产品的商业化,扩大消费者市场。首席科学家伊尔亚·苏茨克维则在内部组建“超级对齐团队”,以达到“让模型在最糟糕的情况下也能遵循人类的意图”等目的。2023年11月初,苏茨克维在一个纪录短片中称:“我的感觉是,通用人类智能(AGI)的发展会出现雪崩。”二人的观念取向,折射出硅谷乃至全世界人工智能行业对安全与进步的分歧观点,即“有效加速主义”和“末日论”。前者的拥趸希望通过最高效、最具影响力的技术进步与突破来加速社会、经济或技术系统的变革过程,并把风险视为变革的催化剂。而后者则更加审慎,认为一旦风险不可控,人工智能带来的巨大影响将毁灭人类社会。 [69]
  • 重组风波调查结果
2024年3月8日(当地时间),OpenAI在官网发布的新闻稿中表示,律师事务所WilmerHale对奥尔特曼2023年11月被解雇事件的调查已经结束,公司制定了新的治理规则,并加强了利益冲突政策。董事会表示一致支持奥尔特曼的领导。OpenAI在描述该律师事务所的调查结果时称,根据WilmerHale的调查结论,2023年奥尔特曼遭遇的突然解职,并不是源于对OpenAI的财务、产品安全或其他问题的担忧。“相反,这是前任董事会与奥尔特曼先生之间关系破裂和失去信任的结果。”OpenAI董事会主席Bret Taylor在新闻稿中表示,“我们一致认为,奥尔特曼和Greg Brockman先生是OpenAI的正确领导者。” [129]

团队解散

2024年5月15日,OpenAI原核心安全团队“超级对齐”负责人杨·莱克(jan Leike)在社交网络上宣布他本人已辞职,此外,这一团队的其他多名核心成员也纷纷离开,这一团队就此解散。杨·莱克17日在推文中怒斥OpenAI在追求华而不实的产品,质疑OpenAI不再关心安全。 [162]
Leike曾与OpenAI联合创始人Ilya Sutskever共同领导OpenAI的超级对齐团队,该团队负责防止超级智能失控,现已解散,剩余成员并入核心研究团队。Sutskever也已辞职。 [165]

回应联名信

2024年6月4日,OpenAI和谷歌旗下“深层思维”公司的13名现职员及前员工发表联名公开信,对人工智能行业在缺乏对“吹哨人”法律保护的背景下快速发展表达担忧。联名信签署人中,2人与“深层思维”有关,4名OpenAI现员工要求匿名。组织者包括OpenAI前工程师丹尼尔·齐格勒和前员工丹尼尔·科科塔耶罗。同一天,OpenAI回应联名信时强调,已设立匿名举报热线和安全委员会保护“吹哨人”,相信能以科学方法应对风险。 [174]

垄断调查

2024年7月,美国联邦贸易委员会(FTC)发布公告,已介入调查包括微软在内的5家主要科技公司,一方面重点审查其在AI领域的投资、合作过程中是否存在垄断行为,另一方面是帮助FTC洞察当前AI市场的竞争格局以及对创新的潜在影响。
该次调查备受外界关注的一个点是,FTC将深入调查微软和OpenAI公司之间的投资关系,已经相关投资的实际意义和竞争影响。 [179]

人事变动

2024年8月6日,OpenAI公司发言人表示,OpenAI总裁、公司核心人物之一Greg Brockman将休长假,以“放松和充电”。另外,研究员John Schulman当日离职,将前往竞争对手人工智能AI初创公司Anthropic。Brockman 在X上表示,其将休假到年底;Schulman也证实了他的离职。 [186]9月26日,OpenAI CTO Mira Murati离职。 [194]10月1日(当地时间),OpenAI联合创始人Durk Kingma宣布加入人工智能初创企业Anthropic。 [196]

模型权限泄露

2024年11月26日(当地时间),一些据称参与了Sora测试的艺术家泄露了该模型的访问权限(API),以抗议OpenAI对他们的压榨行为。 [219]

罚款

2024年12月20日,意大利数据保护局(Garante)公告称,在结束对生成式人工智能应用程序使用个人数据的调查后,对ChatGPT制造商OpenAI处以1500万欧元(约合1558万美元)的罚款。 [229]

宕机

美东时间2024年12月26日上午11点,OpenAI开始发生大规模宕机。OpenAI的独家云服务商微软同日报告称,旗下一个数据中心出现“电源问题”,主要影响到北美地区用户。 [233]北京时间12月27日上午8:20,OpenAI更新说明称,API现已运行,ChatGPT正在恢复。 [234]

用户数据疑似被盗

2025年2月8日,IT之家消息称,科技媒体发布博文,报道称有黑客在暗网论坛发帖,声称持有 2000 万 OpenAI 用户账户的登录凭据,并开始公开兜售。OpenAI 公司表示目前已紧急启动调查,初步排查证据表明其系统并未遭受攻击,但用户仍需警惕潜在风险,并采取必要安全措施。一位匿名黑客在暗网论坛发布俄语信息,声称拥有超过 2000 万个 OpenAI 账户的访问代码,并称之为“金矿”,还提供了包含电子邮件地址和密码的样本数据。 [259]

马斯克欲控制OpenAI

当地时间2025年2月10日,据美媒报道,一个由马斯克牵头的财团出价974亿美元,寻求控制OpenAI。对此,OpenAI创始人山姆·奥特曼在社交平台X回应道:“不,谢谢,但如果你(马斯克)愿意,我们将以97.4亿美元收购推特。” [263]当地时间2月14日获悉,OpenAI董事会一致拒绝了埃隆·马斯克提出的以974亿美元收购该公司资产的要约。 [266]当地时间3月4日,美国一联邦法院否决了马斯克此前请求的初步禁令,该禁令旨在阻止ChatGPT制造商OpenAI转型为营利性公司。 [272]5月20日,特斯拉首席执行官马斯克在多哈经济论坛上发表讲话表示,即使在OpenAI部分撤回其重组为营利性企业的计划后,他仍打算继续推进对OpenAI的诉讼。 [321]

反垄断调查

2025年3月,英国竞争与市场管理局宣布终止对微软 (MSFT-US) 与 OpenAI 合作的反垄断调查,表示微软对 OpenAI 的控制程度不足以进行全面调查。该合作始于 2019 年,当时微软对 OpenAI 进行 10 亿美元的初期投资 [273]

安全策略遭质疑

据外媒 Wccftech当地时间2025年3月6日报道,OpenAI 最近向社区分享了其谨慎、逐步部署 AI 模型的方法,采取分阶段发布的策略,并以 GPT-2 的谨慎发布为例。然而,这一示例引发了前 OpenAI 政策研究员 Miles Brundage 的批评,他指责公司歪曲了 AI 安全的历史。
OpenAI 发布的文件阐明了其对 AI 安全和模型部署的态度。文件中强调,公司在处理现有系统时始终保持谨慎,并提到 GPT-2 是其谨慎发布策略的一部分。公司“相信”只有通过从现有工具中学习,才能确保未来系统的安全。 [276]

向美国政府提议

2025年3月13日消息,OpenAI在其发布的15页政策建议中,向特朗普政府提出请求,希望政府能够为自愿向联邦政府提供模型的人工智能企业提供保护,使其免受各州日益增多的监管法规的影响。 [278]在这份长达15页的信函中,OpenAI全球事务副主管克里斯·勒汉承认:“尽管美国目前在人工智能领域保持领先,但DeepSeek表明我们的领先优势并不大,而且正在缩小。”与此同时,勒汉声称在关键基础设施和其他高风险应用中使用DeepSeek会“带来重大风险”,因为其可能受到“中国政府的操纵”。他同时声称DeepSeek“侵犯知识产权”,其用户“可能面临隐私和安全风险”。 [280]
2025年3月,OpenAI公司已向美国政府提交一份AI发展建议书,呼吁放宽监管,让AI公司自由使用受版权保护的材料,训练AI模型。 [279]

遭隐私投诉

2025年3月,OpenAI 旗下的聊天机器人 ChatGPT 因生成虚假信息而面临又一起隐私投诉。此次事件发生在欧洲,由隐私权益倡导组织 Noyb 支持挪威一名个人发起,该个人发现 ChatGPT 生成了虚假信息,声称他因谋杀两名子女并企图杀害第三名子女而被定罪。这一事件引发了对 OpenAI 是否违反欧盟《通用数据保护条例》(GDPR)的质疑。 [281]

起诉马斯克

当地时间2025年4月9日,美国开放人工智能研究中心(OpenAI)对马斯克提起反诉,指控马斯克存在骚扰行为,并要求联邦法官阻止马斯克对OpenAI采取任何进一步的非法和不公平行动,其中包括通过媒体进行攻击和进行恶意宣传。 [294]

模型不听指令

2025年5月25日,英国《每日电讯报》报道,美国开放人工智能研究中心(OpenAI)新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。 [326]人工智能安全公司Palisade Research表示,OpenAI的o3模型破坏了一种关闭机制,以防止自身被关闭,这是第一次有AI模型被观察到在有明确指示的情况下拒绝自我关闭。 [327]

所获荣誉

播报
编辑
日期
荣誉名称
企业估值
排名
2023年01月
全球TOP50网站(月的访问量已经达6.72亿次)
-
[132]
2023年04月
2023·胡润全球独角兽榜
1380亿(人民币)
第17名 [10]
2023年06月
《时代》发布《2023年全球最具影响力100家公司榜单》获得“颠覆者(DISRUPTORS)”荣誉
-
榜单第21名 [134]
2023年07月
2023世界物联网排行榜-人工智能行业榜单
-
第5名 [133]
2023年08月
福布斯发布2023云计算100强榜单
280亿(美元)
第1名 [54]
2023年11月
首期《财富》全球人工智能创新者50强榜单
-
[55]
2023年12月
“汉语盘点2023”年度字词——“ChatGPT”当选国际词
-
[95]
2024年04月
2024·胡润全球独角兽榜
7100亿(人民币)
第3名 [140]
2024年04月
2024福布斯AI 50榜单
113亿美元
- [143]
2025年1月
《2024胡润全球高质量企业TOP1000》
10600亿(人民币)
第100名 [237]

竞争对手

播报
编辑
百度
产品名称
模型
定位
模型能力
发布/更新时间
(ERNIE Bot)
ERNIE
大语言模型
百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层;百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE ,具备跨模态、跨语言的深度语义理解与生成能力 [80]
2023年2月7日
3.5版
在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破 [81]
2023年5月
4.0版
知识增强大语言模型
理解、生成、逻辑、记忆四大能力都有显著提升。在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。此外,4.0在输入和输出阶段都进行知识点增强。 [81]
2023年10月16日
Google
产品名称
定位
主要功能
模型名称
发布/更新时间
Bard是建立在一个大型语言模型基础上的人工智能聊天机器人
将结合全世界的力量、智慧以及创造力,利用来自网络的信息提供新鲜、高质量的回应。 [70-71]
LaMDA
对话应用语言模型
当地时间2023年2月6日发布
可支持包括中文在内的40多种语言,图像分析功能,可以提取相关信息或为图片取标题。 [72]
当地时间2023年7月13日更新
人工智能模型“双子座"
谷歌迄今为止功能最强大、最通用的大模型。它能够处理视频、音频和文本等不同形式的信息,相较于此前的版本,Gemini可以进行更复杂的推理,并实现更细致的信息理解。 [92]“双子座”是谷歌迄今最灵活的模型,能够在从数据中心到移动设备等不同平台上运行。“双子座”将推出Ultra、Pro和Nano三个版本。其中Ultra版本功能最强大,适用于复杂任务;Pro版本可扩展多种任务;Nano版本为高效设备端模型。 [93]
-
当地时间2023年12月6日发布
Stability AI
产品名称
版本
定位
主要功能
模型/参数
发布/更新时间
1.0版本
人工智能AI工具
与前代产品(Stable Diffusion XL 0.9版本)相比,生成的图片色彩“更鲜艳”、内容“更准确”,对比度、阴影和光照效果也更出众;
1.0 版是可定制的,用户就可以使用该AI工具完成复杂的设计;1.0版包含35亿个参数,可以在“几秒钟内”生成多种长宽比的完整图像;在文本生成方面,能在图片中生成各种形式的文本,免去用户后期调整字体的麻烦。 [73]
SDXL 模型/35亿个
2023年7月
发布
Anthropic
产品名称
版本
定位
主要功能
发布/更新时间
-
大语言模型
聊天机器人
聊天机器人Claude被不少人认为媲美ChatGPT; [78]美国软件服务公司Notion、社交问答网站Quora和搜索引擎DuckDuckGo已将Claude集成到其产品内。
2023年3月15日发布 [75]
版本2
编码、数学和推理方面的性能都有所提高。升级之后,Claude 2的处理能力已经提升到了100K个Token,这意味着它可以处理数百页的技术文档,甚至是整本书。此外,面向更广泛的用户群体免费开放,并支持中文使用。 [76]
2023年7月更新
版本2.1
可以为专业用户一次性消化多达20万个token,相当于500多页的材料,且出现“幻觉”或谎言的频率将是以前的一半,20万个token相当于Claude此前处理能力的两倍,且大幅高出GPT-4企业版3.2万个token的上限。 [77]
2023年11月22日更新
Character.AI
产品名称
定位
主要功能
发布/更新时间
聊天机器人
允许人们与名人或动漫角色的虚拟版本进行聊天,同时可以创建自己的聊天机器人和人工智能助手。
Data from Similarweb显示,Character.AI的聊天机器人(具有不同角色和语气可供选择),吸引了18至24岁用户。与Open AI的ChatGPT和谷歌Bard等其他聊天机器人相比,该公司通过此人口群体帮助自己在个人AI伴侣领域树立更加有趣的形象。 [78]
-
DeepSeek(深度求索)是中国AI初创公司 [245]。据公开报道显示,2025年1月,DeepSeek创始人是梁文锋,员工规模不及OpenAI的1/5。公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,主要在北京分部,其余30多人在杭州总部,多为前端、产品以及商务人员。 [242]
2025年1月28日消息,DeepSeek在不到30天的时间里,先后发布DeepSeek-V3DeepSeek-R1两款大模型,持续引发热议。据美国彭博社报道,OpenAI首席执行官萨姆·奥尔特曼27日晚在社交媒体平台X上发文,对DeepSeek-R1模型首次亮相表示欢迎。 [245]