» 4、谷歌也推出新AI模型,仅靠提示就掌握一门语言

Google继上周官宣Gemini 1.0 Ultra 后,火速推出下一代人工智能模型Gemini 1.5。

它在跨模态超长文本理解能力上的大幅突破。Gemini 1.5能够稳定处理的信息量高达100万个tokens。这相当于1小时的视频、11小时的音频、超过3万行代码或70万个单词。

Gemini 1.5 Pro可以无缝分析、分类和总结给定的长篇复杂文档。例如,上传阿波罗 11 号登月任务的 402 页pdf记录,让它根据要求列出3个有意思的瞬间,并引用原始对话细节。

Gemini 1.5 Pro在超长视频理解上同样出色,能够快速准确地分析各种事件和情节点。比如给定一部相当于68.4万tokens、时长为44分钟的无声电影Sherlock Jr.,可以要求一句话总结电影情节。

另一项让人耳目一新的是Gemini 1.5 Pro的“上下文学习”技能,意味着它能从一个长提示中给出的信息里学习新技能,而无需额外微调。

在测试中, 工作人员向Gemini 1.5 Pro提供了500页参考语法、2000条双语词条和400个额外的平行句子——总计约25万tokens信息作为其输入上下文,要求从中学习并完成Kalamang语和英语的互译。

从测试结果可见,Gemini 1.5 Pro对整本书的翻译得分接近人类学习者,在半本书的表现中远超GPT-4 Turbo与Claude 2.1。
 
 
Back to Top