美国当地时间12月6日,谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini“双子座”。
谷歌旗下人工智能公司“深层思维”(DeepMind)首席执行官兼联合创始人德米斯·哈萨比斯(Demis Hassabis)代表“双子座”研发团队介绍表示,“双子座”是谷歌迄今最灵活的模型,能够在从数据中心到移动设备等不同平台上运行。
据了解,此次谷歌发布的Gemini模型可实现多模态,性能大幅提升,Gemini是基于Transformer decoder构建的多模态模型,这种技术能够处理视频、音频和文本等不同内容形式的信息。最新的Gemini模型对比之前的技术,能够进行更复杂的推理,理解更加细微的信息。它通过阅读、过滤和理解信息,可以从数十万份文件中提取要点,将有助于在从科学到金融的许多领域实现新的突破。
“Gemini是谷歌多个团队共同协作的成果,包括我们在Google Research的同事。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在本周三的一篇博客文章中写道。“Gemini是从零开始构建的多模态模型,这意味着它可以推广和无缝理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。”
图片来源:谷歌
谷歌方面称,Gemini将推出Ultra、Pro和Nano三个版本。其中Ultra版本功能最强大,适用于复杂任务;Pro版本可扩展多种任务;Nano版本为高效设备端模型。值得注意的是,尽管谷歌方面认为目前Gemini Pro的表现优于GPT-3.5,但回避了与GPT-4相比如何的问题。由此可见,虽然在当下AIGC市场竞争日趋且新品不断推出,但今年3月OpenAI推出的GPT-4很有可能仍是当前最为先进的大语言模型。
此外,据美国消费者新闻与商业频道(CNBC)报道,谷歌方面还表示,Gemini将从周三开始整合到谷歌的AI聊天机器人Bard中,并以英语为基础语言在包括美国、亚洲与非洲等全球超过170个国家和地区开展应用。然而受限于海外监控审查制度影响,暂时无法在欧盟及英国地区使用。
英国广播公司(BBC)认为,随着技术的迅速发展及Gemini的技术落地,在未来一年人工智能产业的竞争将会更加激烈。其中,OpenAI也将于明年发布一款更强大的迭代产品,该公司首席执行官Sam Altman信誓旦旦表示,新产品的性能将使当前的产品线看起来像“过时的老前辈”。而美国企业家Elon Musk的人工智能初创公司xAI也已申请进行最多10亿美元的股权融资,并于上个月发布了首个AI大模型产品Grok。此外,来自中国的百度也在竞相推出自己的人工智能产品。
值得注意的是,谷歌在发布多模态大模型Gemini的同时,还推出了全新的面向云端AI加速的TPU v5p,这也是谷歌迄今为止功能最强大且最具成本效益的TPU(云张量处理单元)。据介绍,每个TPU v5p Pod由多达8,960个芯片组成,使用最高带宽的芯片间连接(每芯片4,800Gbps)进行互连,确保快速传输速度和最佳性能。
这也意味着谷歌TPU v5p凭借其强大的计算能力将加速AI模型的训练和推理,提高AI应用的性能和响应速度;其次,其高带宽的芯片间连接可以满足大规模并行计算的需求,进一步扩大AI应用的规模和复杂度。
此外,谷歌在人工智能技术领域的进一步拓展,对国内二级市场也产生了影响,人工智能概念股涨幅居前。截至12月7日收盘,众诚科技大涨29.08%,当虹科技涨幅达20%;此外新媒股份、路桥信息、格灵深瞳、国子软件等多家人工智能企业涨幅均超过10%。
来源:同花顺
对此,中信证券表示,谷歌宣布发布新一代大模型Gemini,将再次引发市场对人工智能产业的持续关注,以及进一步带动市场对多模态模型的更多期待。Gemini模型作为全球范围内最先发布的多模态模型,在性能上是第一个在MMLU(大规模多任务语言理解基准)上超越人类专家的模型,横向对比多个任务性能超过GPT-4。