随着人工智能(AI)竞赛加剧,最近两年极少公开露面的李志飞,这次也要加入到国内 AI 大模型浪潮中。
钛媒体 App 获悉,4 月 20 日出门问问举行的 2023 AIGC(生成式人工智能)战略发布会上,前 Google(谷歌)科学家、出门问问创始人兼 CEO 李志飞宣布推出出门问问版 GPT、AI 大模型 " 序列猴子 ",并开启内测探索。
(相关资料图)
同时,出门问问还介绍多款面向创作者的 CoPilot(创作助理)产品—— AI 写作平台 " 奇妙文 "、AI 绘画平台 " 言之画 "、AI 配音平台 " 魔音工坊 "、数字人视频与直播平台 " 奇妙元 "、升级版语音助手魔法小问,以及企业(To B)端专属大模型,不仅提供通用能力支持服务和数字人形象定制服务,还将开放自身角色能力,持续迭代数据接口。
李志飞对钛媒体 App 表示,相比 OpenAI 研发的 GPT-3 大约 1750 亿个参数," 序列猴子 " 模型参数量约为几百亿个。尽管 GPT-4 的 100 分满分相比," 序列猴子 " 分数是 50 分,但李志飞认为目前该模型效果确实超出了他的预期,他十分满意。
李志飞强调,中国 OpenAI 不是出门问问的目标。同时,出门问问近期不考虑融资,不需要外部融资也能支撑研发投入。
" 目前公司商业化做得不错,除大模型外,公司其他业务并不太烧钱。此外,出门问问之前的融资也较充足,我们过去还是融了不少钱,所以账上还有不少钱。"李志飞对钛媒体 App 表示," 可能就是我最后一次 All in 干的一件事情 "。
据悉,成立于 2012 年的出门问问,是一家以语音交互和软硬结合为核心的 AI 公司,为全球 40 多个国家和地区的消费者、企业提供 AI 产品和服务。其中包括智能手表 TicWatch 系列、AI 真无线智能耳机 TicPods 系列等,以及物联网、金融、车载等场景提供服务,推出的 " 魔音工坊配音助手 " 用户近 200 万。创立出门问问之前,李志飞博士毕业于美国约翰霍普金斯大学计算机系,曾任谷歌总部科学家。
截至 2017 年 4 月,出门问问共完成六轮融资,总额超 2.55 亿美元,投资方包括红杉资本、真格基金、谷歌、大众汽车等。
2021 年 6 月,出门问问推出大模型 UCLAI,效果不佳。2022 年 10 月,出门问问重拾大模型的研发。李志飞坦陈,研发过程压力很大,因为研发很烧钱,而且不知道最终结果如何,直到两三周前的一天才发现 " 序列猴子 " 的表现不错。
据李志飞介绍," 序列猴子 " 这个名字的灵感,来源于数学家埃米尔 · 波雷尔在 20 世纪初提出了 " 无限猴子 " 定理,即只要给予无限时间,一只猴子几乎必然能够打出任何文字,比如莎士比亚的《哈姆雷特》,而如果喂给机器猴子海量的文本序列,通过大规模算力去训练它,就能练就有智能的 " 序列猴子 ",而大模型是一个序列模型。目前," 序列猴子 " 大模型主要是文本形式,未来则会向多模态的方向发展。
C 端方面,在发布会现场,出门问问团队进行了多轮 Demo 演示,比如,回答 " 湖南和湖北哪一个省会的人口更多?广东和新疆呢?" 等问题,也从一众菜品中为不吃辣、喜欢吃虾的客人推荐了合理的菜品;而回答 " 天猫背后的公司的创始人本科毕业于嘟个学校?" 问题时,也能轻松输出马云本科毕业于浙江师范学院(现浙江师范大学)。
出门问问大模型现场 Demo 演示(图片来源:钛媒体 App 编辑拍摄)不过,有些问题依然会出现和其他 GPT 大模型一样的反复胡诌、文生图对不上等情况,比如现场让 " 画一只赛博朋克风格的猫 ",结果生成的是一位打扮好的二次元人物。李志飞提到," 序列猴子 " 大模型的语料也来自于互联网中," 我们需要不断调整它(大模型)的一些对话策略,各种各样的能力输出。"
李志飞指出,在中国做大模型的公司,不论是 33 分,还是 50 分以上,都不要焦虑,应该意识到现在的大模型不再像上一代的 AI 能力有限,它已具备基本的逻辑推理能力,每次都能给人惊喜, " 序列猴子 " 大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力。他强调,大模型的训练要循序渐进,不要一上来就搞 " 应试教育 ",大模型的能力可能很快能提升到 80 分,但是要从 80 分做到 90 分以上,仍然会是非常难的事情。
而在 B 端,李志飞现场透露," 序列猴子 " 企业专属大模型已在首批汽车、教育、律所、金融、运营商、旅行、传媒、设计、智能硬件、医疗十大行业内测探索伙伴,企业方包括中国移动、中国工商银行、中国一汽红旗、春秋航空、VIPKID 等。
李志飞强调,大模型商业化落地首先是创作者,然后是 B 端,然后才是 C 端。他透露,在创作者方面,出门问问提供付费服务,B 端主要提供定制大模型服务,提供个性化答案,例如把功能嵌入至企业微信里面等。
当被问及中国大模型和美国距离多远时,李志飞认为是 16 个月。他解释称,2022 年 1 月谷歌发布指令学习大模型 FLAN,之后的 2022 年 10 月 ChatGPT 发布,2023 年 3 月 GPT-4 发布。中国企业目前发布的一批大模型与 FLAN 水平相近,如此推算,中美大模型的差距为 16 个月——这与百度 CEO 李彦宏和搜狗创始人王小川说法都不一致,此前李彦宏认为文心一言和 ChatGPT 差距只有两个月,王小川认为国内和 GPT-4 有两、三年的差距。
李志飞称,目前大模型烧钱很厉害,算力是当前重要挑战之一。他提到,现在 " 序列猴子 " 模型比较大,没有做太多优化,所以显卡要求比较高,因此算力对于出门问问来说是一个现实的问题,他认为后面应该会慢慢的解决算力需求挑战。
李志飞向钛媒体 App 透露,现阶段出门问问不需要融资。据悉,自 2017 年至今的过去七年,出门问问没有公开过最新融资消息。
" 我们 2012 年创业,其实我觉得出门问问已经到了一个阶段,我不需要靠去融资,然后又去烧钱,烧完钱以后又开始亏损,然后亏损了又进入了一个裁员优化,这是过去我们看到确实是无数个行业、无数公司经历的这么一个循环。现在对我来说,肯定不愿意去参与融资这种竞赛,我还是想理解模型本身变成一个可用的产品。目前这个阶段,我们是不融资的,我不需要外面的资本也能支撑这方面的投入。"
" 钱从哪里来?我觉得是能用 1/10 的钱,干出比别人 10 倍好的事情,这个对我来说最有成就感。我早期认识 OpenAI 内部的人,人家根本就不优化成本了,因为现在他们要探索天花板了。所以对我来说,我更加 care 是我能不能够发挥我的才智,能跟别人做的不一样,真的就用 1/10 的钱能做出别人 10 倍、或者差不多 10 倍好的东西。"
李志飞强调,中国不会有下一个 OpenAI,主要原因是中美创业环境不太一样,不太可能是去重复 OpenAI 这样的发展道路,国内大部分人还是在思考中国竞争太激烈、商业化如何竞争。
" 中国版 OpenAI 不是我们的目标。我的初心就是要‘造大模型’,理解大模型,再把大模型用起来。" 李志飞告诉钛媒体 App。(本文首发钛媒体 App,作者|林志佳)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App
Copyright @ 2015-2022 世界金属报网版权所有 备案号: 豫ICP备2021032478号-36 联系邮箱:897 18 09@qq.com