谷歌测试 Nano Banana2Flash 图像模型 在推出高端图像模型NanoBananaPro之后,谷歌正悄然推进GeminiFlash系列的最新迭代——NanoBanana2Flash,并已进入内部秘密测试阶段。这一消息由科技领域知名博主MarsF... 奈飞网 2026-01-05 9 #测试模型 #人工智能 #谷歌 #科技新闻
AI 模型高压测试:Gemini 2.5 Pro 失败率从18.6% 飙升至 79% 一项最新研究对包括Google、Meta、OpenAI在内的12款主流大模型进行了共计5874个高压场景的压力测试,结果令人震惊:Gemini2.5Pro的失败率从常规状态下的18.6%飙升至79%,... 奈飞网 2025-12-01 2 #测试模型 #人工智能
谷歌发布新一代 AI 模型 Gemini 3:在推理、多模态、编程等主流测试中全面领先 谷歌正式推出全新一代人工智能模型Gemini3,并迅速将其集成到谷歌搜索、Gemini应用程序以及企业级解决方案中。公司CEO桑达尔・皮查伊表示,这是迄今为止“最强大的AI模型”。根据官方说明,Gem... 奈飞网 2025-11-19 2 #谷歌 #测试模型 #人工智能 #推理
对长文档「大海捞针」提问,大模型们能力对比如何? 需求一年多的发展下来,现在很多大语言模型都支持了更长的上下文,有的甚至可以处理数以百万计的输入输出。为什么我们需要这么长的上下文呢?其实说白...,科学网... 奈飞网 2024-08-19 14 #测试模型