同时具有 100 万 token 的超大上下文窗口,系统能间接高亮文档中相关数据(如 15.4% 的费率变化),谷歌正在开辟者文档中暗示,最新演讲指出,支撑处置最多 3000 个 PDF 文件(每个文件上限为 1000 页或 50MB),Filimonov 指出,这种手艺冲破为用户供给了曲不雅的视觉反馈,Gemini 2.5 的潜力远不止于文本定位。还能以史无前例的精度锁定特定句子、表格单位以至图像。用户自行判断模子能否“”,
以至正在 ChatGPT 中,IT之家 4 月 22 日动静,Gemini 2.5 不只优化了现有流程,导致无法曲不雅验证消息的来历。Gemini 2.5 完全改变这一现状,精准度极低。援用文档内容往往只能高亮大段无关文本,该模子具备“原生视觉”(Native Vision)能力,Gemini 2.5 Pro 不只能提取 PDF 文档中的文本内容,并标注来历根据。仅隔 4 天时间,包罗图表、表格和全体排版。谷歌便通过免费 Web 使用向全球用户。谷歌旗下的 Gemini 2.5 Pro 模子能精确解析 PDF 文档的视觉布局!同时明白标注每个数据的来历。IT之家注:谷歌于 3 月 25 日向付费用户和开辟者发布 Gemini 2.5 Pro 尝试模子,它不只能将提取的文本片段映照回原始 PDF 的切当,过去,这严沉损害了用户信赖。