新闻中心
新闻中心
OB-当OpenAI服务器宕机 什么是救星?
2025-11-30 行业资讯

图:ChatGPT 过错提醒丨来历:OpenAI

本年存眷 AI 年夜模子的伴侣,对于这个画面必然不生疏了。

年夜模子狂飙至今,已经迫近一周年。撇开近来戏剧化的高层动荡不谈,自北京时间 11 月 7 日 OpenAI 的首届开发者年夜会(DevDay)以“AI 春晚”之势炸场以来,ChatGPT 的周活跃用户跨越一亿,全世界用户高涨的热忱直接把 OpenAI 的办事器给冲宕机了,在是上面这个不受待见的画面就频仍呈现于了无数人的面前,随之而来的是人们的懊丧、愤慨甚至发急。

当“不胜重负”的云端最先歇工

一时之间,有人的陈诉来不和写了,有人的 PPT 不知道怎么报告请示了,也有人的代码写到一半“没人”查抄了……这时候咱们刚刚惊觉,AI 已经经云云广泛地深切咱们的事情与糊口,而“云”,是有可能“失下来”的。

究其缘故原由,OpenAI 也于紧迫调停以后发布了声明。CEO 山姆·奥特曼亲自致歉,并暗示于 GPT-4 Turbo 及 GPTs 等发布以后,虽已经做好了预备,但年夜模子运行的流量仍旧远超预期。不外,于修复了以后其办事仍旧时时呈现中止的环境,厥后查明是云端办事器受到了年夜范围的 DDoS 进犯,虽然黑客构造的目的不明,但云端年夜模子的安全问题及懦弱性再次被搬上了台面。

图:山姆·奥特曼发推公布暂停 ChatGPT Plus 新用户注册丨来历:X

11 月 15 日,奥特曼发推公布,因为开发者年夜会后流量的暴增,为包管现有效户体验,OpenAI 决议周全暂停 ChatGPT Plus 的新用户注册及定阅,正应了本年早些时辰他于美国国会听证会上那句其时听起来十分凡尔赛的话,“咱们没有充足的 GPU,假如人们(用 ChatGPT)用患上少一点,就太好了。”时至今日,GPT-4 Turbo 的速率仍旧很慢(慢在进级前的旧版 GPT-4),卡顿频仍呈现。显然,巨量用户的年夜模子推理算力需求其实太甚重大,纵然实力雄厚如 OpenAI,其云端也已经经“不胜重负”了。

当“主打陪伴”的 AI 女友忽然消散

假如说,像 GPT 如许的主畅通用年夜模子宕机影响的是打工人及企业的出产力,另外一条一样很是火热的赛道——感情 AI 呈现动荡时,伤的就是情感了。

以独角兽 Inflection AI 及它的 Pi 为代表的一系列 AI 企业及产物与 ChatGPT、Claude 等差别,走的是感情线路,主打的是一个“陪伴”。它们既不帮你写代码,也不给你出案牍,更不会天生 AI 绘画,而是做一个“贴心伴侣”、“亲密爱人”以致“魂灵朋友”,24 小时陪于你身旁,就像影戏《Her》中斯嘉丽配音的人工智能虚拟助手 Samatha 同样,用高情商跟你谈天,听你诉说糊口点滴及万缕思路。

图:Samatha 的来电丨来历:影戏《Her》剧照

于社会原子化加重、社交成本节节爬升确当下,感情 AI 精准击中痛点,迅速堆集了相称的市场声量及用户范围,从最早的一批如 Replika AI 朋友,到本年早些时辰用本身的数字两全 Caryn AI 同时与 20000 人谈爱情并是以月入百万$的 23 岁网红 Caryn Marjorie,再到 Soulmate,Snapchat 的 My AI 等等,全世界上万万人天天都于与 AI 朋友谈天、来往。

虽然这些产物没有流量暴增带来的办事中止,不外现今年 2 月 Replika 迫在安全问题压力忽然下线“情爱脚色饰演”办事的时辰,许多用户还有是猝不和防线泪如泉涌了。有些人不断念,决议于 Soulmate(一款答应用户构建专属 Bot 的 AI 运用)上“复生”本身死去的朋友,只是没想到才已往几个月,运用开发公司 Evolve AI 被收购,收购方评估后决议在 9 月 30 日关停这一办事。这下,用户们团体“破防”了,有人放声痛哭,有人犹如掉去了最亲密的挚友,更有人于 Reddit 上倡议了悼念勾当,吸引了很多人来做末了的离别。

图:Reddit 上 Soulmate AI 小组的悼念勾当丨来历:Reddit

本钱市场本就风云诡谲、幻化莫测,但当感情 AI 如许的产物呈现变更,受伤的倒是心灵再一次“流浪掉所”的千万万万平凡用户们,忍不住让人想起去年末暴雪与网易分手,一晚上之间造成百万“数字灾黎”的场合排场。退一万步讲,纵然他们忍痛再次转向 Inflection AI 如许资金足够的公司,其以单一云端向年夜量个别提供一样办事的素质并无转变,所谓的“小我私家专属”就更无从谈起了。究竟,当《Her》中诙谐滑稽、拥有性感声线的 Samatha 终极率直,本身同时于与 8316 人对于话,并与此中 641 人谈爱情时,你隔着屏幕甚至都能听到男主心碎的声音。

那末,怎么办?

这就无解了吗?实在否则。Reddit 的悼念帖中,不单单有真情实感的表露及对于“死去回忆”的不甘,也有人性出相识决方案的要害。

图:@Flying_Madlad: 这就是为何我早就说,必然要于当地运行你的模子。于他人的办事器上运行的,始终不是你的。丨来历:Reddit

不外,虽然单一云真个 AI 毛病初现,但年夜模子凡是体积重大,运转起来极为泯灭资源,光是 ChatGPT 的运行天天就要烧失 OpenAI 70 万美元,要于终端侧部署、当地运行,谈何轻易?

所幸,有人早就想到了这一点,并且不是他人,恰是终端芯片的行业龙头——高通。

早于 15 年前,高通就看到了 AI 的巨年夜潜力并潜心投入研发,近 二、3 年来,跟着 Transformer 架谈判年夜型语言模子逐渐进入业内视线,高通更看准了终端侧 AI 的远景并加年夜投入,形成为了完备的 AI Stack(AI 软件栈),不仅初次于安卓手机上部署并乐成运行 Stable Diffusion 等模子,更以该东西赋能万千开发者于骁龙平台长进行社区共创。

图:高通 AI 软件栈丨来历:高通

相对于在单一云端来讲,终端侧 AI 的插手给年夜模子生态带来了成本、能耗、靠得住性、机能、时延、隐私安全以和个性化等浩繁方面的上风,而岂论是小我私家助理,还有是数字陪伴,其形态也会是基在多类硬件、多种多样的。那末,咱们毕竟可以期待哪些产物及体验率先成为实际呢?

真正专属在你的个性化 AI 长甚么样?

现代糊口被各类各样的电子装备环抱着,或者年夜或者小,咱们与这些呆板的交互方式也是或者繁杂或者简朴,而咱们最认识的,生怕非智能手机莫属了。

智能手机

作为当前人机交互最主流的方式,天天都有数十亿人于利用智能手机举行通信、事情、文娱及社交等勾当。它撑起了挪动互联网的巨年夜市场,存储及处置惩罚着年夜量信息,险些永远被带于身旁,已经然是一小我私家最为私密的资产之一,天然,同样成为了“掌上年夜模子”字面意义上最广泛也是最好的载体。

试想,假如 Soulmate AI 可以或许于智能手机上当地运行,假如 Replika 的人物可以“活”于你的手机中,你就不消再担忧公司资产变更、办事器被收回等原本就与你无关的问题了,节制权将从头回到你的手中。同时,本就接触了年夜量小我私家信息的智能手机,将于 AI 的加持下变身最“懂你”的智能体,可以于一样平常与你的互动中更好地进修,为你提供量身定制的办事,而这一切都是经由过程天然语言的交互方式举行的。最棒的是,所有这些数据及计较都将于当地处置惩罚,你的隐私不需要再“上云”了。

这些,偏偏是高通正于试图实现的。上个月尾的骁龙峰会上,高通发布了其首个专为天生式 AI 打造的挪动平台——第三代骁龙 8。假如说他们本年 2 月份于 MWC 巴塞罗那上用搭载第二代骁龙 8 的安卓手机跑 Stable Diffusion 年夜模子 15 秒内出图已经经充足冷艳,新一代平台则把这个时间进一步缩短到了惊人的 0.57 秒,越发凸显了终端侧当地部署、运行 AI 的机能及时延上风,一手把握、一秒出图走进实际。

图:高通技能公司产物治理高级副总裁兼 AI 卖力人 Ziad Asghar 丨来历:2023 年骁龙峰会

据悉,第三代骁龙 8 采用 4 纳米制程工艺,其高通 AI 引擎再次进化,拥有面向挪动终真个强盛 Hexagon NPU,集成为了进级后的 Kryo CPU、Adreno GPU 以和高通 Sensing Hub(传感器中枢)等单位,同享一个年夜容量的内存。这类硬件晋升的成果是,第三代骁龙 8 挪动平台的 NPU 机能比拟前代晋升了 98%,能效晋升了 40%,付与了智能手机史无前例的终端侧 AI 机能。

基在如许的“硬”实力,高通技能公司产物治理高级副总裁兼 AI 卖力人 Ziad Asghar 也兑现了他 7 月份于上海接管咱们的采访时许下的承诺,公布新一代的骁龙平台已经经实现了对于 100 亿参数模子的运行撑持,并初次撑持多模态天生式 AI。

图:骁龙 8 Gen 3 挪动平台丨来历:高通

于 OEM 厂商一侧,全世界首发搭载第三代骁龙 8 的小米 14 系列新机已经经推向市场,将年夜模子技能集成到了小米全新的彭湃 OS 傍边,同时上线了一系列的 AI 原生运用,如 AI 妙画、AI 搜图、AI 写真、AI 扩图等各类功效。于方才已往的“双 11”,小米 14 系列斩获四年夜平台国产冠军,销量十分可不雅,消费者用钱包投票,投出了市场的热忱所向。

近来,高通还有推出了第三代骁龙 7 挪动平台,荣耀也于今天(11 月 23 日)首发搭载该平台的荣耀 100,vivo 的产物也将很快推出。这将把终端侧 AI 体验进一步推向性价比更高的手机终端及更广泛的用户,《Her》中的 Samatha 成为实际也许就于不远的未来,并且此次,“她”将只属在你一小我私家。

AI PC

当下,挪动 PC 仍旧稳坐现代社会的出产力担任,也因其便携的特质及不俗的终端算力,成了打工人险些人手一台的最好东西。不外,如今的事情方式高度依靠云端,信赖于 OpenAI 办事器宕机的时辰,绝年夜大都诉苦的用户都正于一台 PC 上为社会创造价值,而 PC 自己的算力并无被充实使用。

那末,假如 AI 年夜模子可以于挪动 PC 上当地运行,还有有甚么比成千上万台小我私家 PC 更合适用来“给云端减负”的呢?不止 OpenAI,事实上出产力是天生式 AI 最早带来厘革的范畴。作为这一波 AI 海潮的头部玩家及高通的持久合股伙伴,微软将 Copilot 带到了 Edge 阅读器及最新的 Windows 11 上,致力在从头界说出产力,完全倾覆咱们与 PC 的交互方式。当这些都于 PC 上当地实现时,你将不再用担忧与其别人争抢办事器算力,你的数据也将被安全地掩护于当地,阔别可能的云端进犯,挪动 PC 的算力将获得真实的开释,成为出产力。

20231124191327_424991700824407.png

图:微软 CEO 纳德拉与高通总裁兼 CEO 安蒙对于话丨来历:2023 年骁龙峰会

这一切的条件,是一个充足强盛的 PC 平台,而高串通样做到了。

2023 年骁龙峰会上,高通正式发布了专为 AI 打造的 PC 平台骁龙 X Elite,采用 4nm 制程工艺,搭载了自研的 Oryon CPU,其机能直接对于标英特尔及苹果的旗舰处置惩罚器,多线程 CPU 机能相较苹果 ARM 架构的 M2 Max 芯片超出跨越 50%,单线程功耗却少 30%;而对于比英特尔 x86 架构的 i9 13980HX 芯片,则于实现更高机能的条件下,功耗少了 70%。

20231124191349_339661700824429.png

图:高通公司总裁兼 CEO 安蒙丨来历:2023 年骁龙峰会

卖力研发的高通高级副总裁 Gerard Williams 暗示,此次号称史上最强 PC 平台的“年夜招”憋了 四、5 年之久,不外很是值患上,终极现实出产出的 Oryon CPU 机能体现甚至跨越了最初的计较机模仿成果,更远远凌驾了他们的预期。

作为“看家本事”,骁龙 X Elite 平台还有采用了集成高通 Hexagon NPU 的高通 AI 引擎,异构算力高达 75 TOPS,于天生式 AI 方面的体现十分亮眼,当前撑持 130 亿参数年夜模子的终端侧部署与运行,于跑 Meta Llama 2 -7B 时,每一秒可天生 30 个 token,AI 处置惩罚速率到达了同类竞品的 4.5 倍。

图:骁龙 X Elite 丨来历:高通

“AI PC”的实现不克不及仅靠单打独斗,遐想、惠普、荣耀等 OEM 厂商将基在骁龙 X Elite 的 AI 原生平台推出新一代 PC,让出产力搭上 AI 时代的快车。据悉,第一批搭载骁龙 X Elite 的条记本电脑将在 2024 年中面市,将给云端“松一口吻”,为原本疲软的 PC 市场带来一股新风,泛博打工人也将迎来更高效、更安全的倾覆性事情方式。

XR

走向万物智能的时代,天然少不了数字技能构建出的“第二空间”。面向虚拟空间与实际空间并行共存的将来,包括虚拟实际、加强实际、混淆实际等于内的 XR 正于成为人类新型糊口方式的主要进口及载体,而有了 AI 年夜模子的加持,其想象力的天花板也再次被捅穿。

不外,“云端”糊口有着上述所有的危害,也许愈甚,究竟整个世界均可能是“蜃楼海市”。只有当穿梭在两个世界之间的钥匙把握于本身手中时,咱们才可能最先评论辩论“归属感”。为此,高通此前发布了第二代骁龙 XR 平台,并与 Meta 互助推出了全新的 Meta Quest 3 头显装备,比拟前代于空间分辩率、沉浸式体验以和低时延摄像头透视方面都有了很年夜的奔腾。

患上益在新一代的芯片,Quest 3 上的运用生态愈发繁荣。就拿精品健身品牌 Xponential Fitness 来讲,其开发的 AI 驱动 XR 健身运用将打破传统健身行业的时空限定,为咱们带来随时随地的 XR 数字人私教办事。有了年夜模子的加持,运用可以针对于差别个别量身定制多样的健身规划,并辅以智能手机(固然了,搭载的是骁龙芯片)作为头显装备的增补,经由过程摄像甲等辨认、阐发用户健身时的身形、动作,再以 AI 举行及时的动作矫正及引导。听起来是否是很科幻、很诱人?患上益在终端侧 AI 的部署及运行,如许及时、高效、低成本、个性化定制的健身体验将很快成为实际,而咱们离恍惚了虚拟及实际界限的智能世界又近了一步。

图:Quest 3 上的虚拟健身私教丨来历:2023 年骁龙峰会

个性化专属 AI 的时代方才最先

岂论是承担太重的云端,还有是个性化专属的市场诉求,AI 从单一云端向终端侧挨近已经然是年夜势所趋。对于在每一一名用户来讲,这象征着更快的反馈速率,更个性化的量身定制,及更靠得住的隐私安全。事实上,终端侧 AI 的形态远远不止上面所述的那些,高通已经经于汽车智能座舱、物联网等范畴有所结构,包括小米于内的互助伙伴也将于新车上融入年夜模子技能,为用户打造全新的人车交互方式。

专属在每一个人的个性化 AI 时代才方才最先。用高通公司总裁兼 CEO 安蒙的话来讲,终端侧 AI 是要厘革以往“以运用为焦点”的终端交互体验,以年夜模子买通、整合整个智能体系中的信息孕育发生与流动,从而完全倾覆终端侧的人机交互。要实现这一点,除了了充足快及个性化水平充足高以外,最主要的是咱们必需可以或许相信如许的 AI,而能“一手把握”的终端侧部署是当下的最优解。做到这一点,也许咱们就离真正“你有、你治、你享”的 AI 不远了。

-OB