宗教文化网-看了今天OpenAI的新品发布直播,我嗅觉被奥特曼耍了

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

宗教新闻 /

你的位置:宗教文化网 > 宗教新闻 > 看了今天OpenAI的新品发布直播,我嗅觉被奥特曼耍了
看了今天OpenAI的新品发布直播,我嗅觉被奥特曼耍了
发布日期:2024-12-06 04:26    点击次数:74

  开首:知危

  各人好,这里是知危剪辑部,看完刚刚终了的 OpenAI 新品发布直播,咱们的心里产生了庞杂的狐疑:

  就这?就这?就这???

  昨天,OpenAI 的 CEO 奥特曼高调文牍了 OpenAI 将会从今天运转开启一个为期 12 天的通达日行径,声称接下来每个职责日皆会有一次直播,实质会包括新品发布或演示、一些大型行径和一些 “ 圣诞礼物 ”。

  自打 9 月份发布了 o1 模子之后, OpenAI 憋了快一个季度莫得新的大手脚了,原来以为是要 “ 连开七天春晚 ” 的节拍,剪辑部照旧作念好 “ 蚁合熬夜 12 天挑战 ” 的准备。

  戒指,刚刚终了的本轮行径第一场直播,15 分钟就草草罢了了,不错说是OpenAI 过往直播发布会里最败兴的一集,有一种被奥特曼耍了的嗅觉。。。

  这等于 12 天超长行径的强度吗?也太低了吧???

  好了,发完诉苦,照旧跟各人先容一下这场发布会的实质,天然短,但也照旧有一定有用信息。

  最初,o1 澈底体模子郑再版上线,同期还推出了一个 o1 Pro 模子而且相应推出了 ChatGPT Pro 订阅以及高等语音功能,相较于之前 Plus 订阅 20 好意思元每月的价钱,Pro 订阅高达 200 好意思元每月,不外不错不限次使用 o1 Pro 模子和高等语音功能,也算是量大管饱了。

  而在模子效用上,官方纸面数据其实并莫得颠倒大的飞跃性栽植。。。

  为什么这样说呢,因为凭证官方给出的跑分数据,o1 郑再版模子的智商仅在数学和编程方面有较大的栽植,但在博士级别问题的栽植上颠倒小,新推出的 o1 Pro 版块也仅在各方面比 o1 郑再版模子提高了少许点。

  要知说念,o1 模子发布时主打的等于能在博士级别的回复中有出色深切,戒指郑再版和 Pro 版在这方面比较预览版基本莫得什么栽植,亦然有些让东说念主祈望破损的。

  知危剪辑部之前找过清华、北大、南京大学的三个博士测试评价过 o1 预览版模子,三位博士默示 o1 如实在念念维和学问储备上达到了博士的水准,但无法对课题进行探索和提供更深的筹商念念路,是以并莫得委果达到 “ 作念学术 ” 的水平。

  目下是深夜咱们没见解干系之前的博士进行测试,不外从官方公布的只是 5 分的提高上来看,揣测效用体感应该不会有什么较大辞别,数据是骗不了东说念主的。

  不外,天然模子的回复智商栽植未几,然则模子的体验照旧栽植很大的,o1 郑再版模子的要紧演叨犯错率比 o1 预览模板少了约 34%,同期回复速率提高了约 50% 。

  直播现场对比发问了 “ 列出二世纪的罗马天子,包括他们的技巧和建设 ” 这个问题,o1 郑再版给出回复用时仅有 14 秒,比 o1 预览版的 33 秒快了近 20 秒,体感差距照旧很大的。

  而在回复的可靠性上,为了更彰着的对比,OpenAI 招揽了 “ 4/4 可靠性 ” 测试,具体来讲等于:仅当模子在四次问答中四次皆省略正确回复问题,才被觉得是惩处了该问题。

  在 “ 4/4 可靠性 ” 测试的评分上来看,o1 郑再版在各个边界皆比预览版有权臣的可靠性提高,同期 Pro 版比郑再版也有较大提高。

  除了体验上的栽植,还有交互上的栽植,o1 郑再版模子目下复旧多模态输入了,你不错通过图+翰墨的模式向模子进行发问。

  在直播现场,OpenAI 团队画了一张 “ 天外数据中心 ” 草图,并让 o1 模子回复图中尺度给 GPU 散热的散热器面积表面上应该需要多大,而且回复是时要琢磨到 “ 若何处理太阳和深空的影响?” 以及 “ 热力学第一定律在其中若何深切作用?” 这两个问题。

测试草图测试草图

  o1 仅用 10 秒就回复了这个问题,他颠倒贤达的捕捉到了图中的 1GW 的输入功率元素,这是一个关节信息,同期指出了系统只可通过热辐照散热。

  与此同期,职责主说念主员在发问时专诚回避了一个信息,那等于总共系统的往常职责温度应该是若干,但 o1 模子我方贤达的界说了系统应该在 300K 也等于 27 摄氏度的环境下职责,进而运转估算散热板所需要的面积。

  图中回复的梗概翻译:所需的散热器面积对散热器的均衡温度高度敏锐。较低的散热器温度意味着每单元面积的辐照量减少,因此需要更大的面积。而较高的散热器温度则不错减少所需面积,但可能加多工程复杂性(因为需要使用省略承受更高温度且仍保捏高辐照率的材料)。

  为了诠释问题,咱们给与一个相对适中的散热器温度,举例 T = 300 K(约27°C),这是电子开采或冷却轮回系统温度的一个合理上限。这将为咱们提供一个基准值。在接洽面积下限时,咱们假定莫得寄生热负荷,而且系统处于梦想条款。

  (注:若是允许系统运行在更高温度,所需面积会减少。咱们将在 300 K 下进行一个示例接洽,并诠释温度变化若何影响面积需求。)

  合座来说,此次发布的东西天然莫得各人祈望中的那么好,各人祈望的 Sora 郑再版、GPT-5、AI 搜索浏览器等居品皆莫得出现,但好在郑再版 o1 和 o1 Pro 也凑合说得昔时。

  不知皆背面剩下的 11 场直播实质会不会隐敝到各人祈望的东西,搞不好 OpenAI 想压轴在把握圣诞节的时分给各人来个圣诞惊喜也没准~

  哦,对了还有一件事情漏掉了,那等于因为 o1 Pro 模子的念念考深度比 o1 要高,耗时会更长,是以为了用户体验,OpenAI 给模子加入了一个回复程度条,这样作念可致使极有用的缓解用户在恭候回复时分的狂躁。

毕竟程度条是接洽机史上最伟大的操办之一了,是以 OpenAI 这波啊,不错说是 《 战抖!炸裂!OpenAI 史诗级更新 》 了! 撰文:二筒剪辑:大饼

  (转自:知危)

海量资讯、精确解读,尽在新浪财经APP

包袱剪辑:李桐