谷歌搜索AI升级后频现拼写问题
AI虽有用却有不少黑历史,像算不准Strawberry中r的数量、知道马嘉祺却叫不出名字,还有AI幻觉问题也一直困扰着用户。如今,谷歌搜索又出了新问题。有用户发现,近日升级了AI能力的谷歌搜索,面对“google里面有几个P”这样简单的问题竟答错了!此事引发广泛关注和测试热潮。实际上,不只是google这个词,谷歌搜索在处理很多其他词时,也会出现字母计数和拼写问题,甚至纯汉语提问也可能遇到此类问题。
问题根源:LLM结构性缺陷
要理解这次的问题,得先了解谷歌最近的动作。今年5月的Google I/O 2026大会上,谷歌宣布了一次被称为“搜索框25年来最大升级”的搜索改版。新版谷歌搜索以重新设计的“智能搜索框”为核心,将AI Overview与AI Mode整合为统一的搜索流程。但问题也随之而来,数周前就有用户发现谷歌搜索框输入“disregard”时AI将其当成指令,虽该bug已修复,但拼写错误问题仍存在。谷歌相关人士称词内数字母是大语言模型已知难题。真正原因是AI其实“看”不见字母,这是所有LLM共同面临的结构性缺陷。LLM处理文字基本单位是token,而非字母,这导致它在数字母时表现不佳。
老问题与特殊影响
“Strawberry里有几个r”早在大模型兴起之初就是测试AI的经典梗,主流模型不加提示大多答错。不过若提问时加上特定提示,模型通常能答对。大模型存在“Jagged Intelligence”现象,能力分布不均是普遍特征。这次谷歌搜索问题引发更大讨论,是因为谷歌搜索一直是很多人获取准确信息的默认入口,用户容错预期低,且这次翻车的是“Google”本身。此外,Google AI Overviews此前也出现过离谱错误,说明大模型存在系统性缺陷。
修复方向与代价
从技术角度,解决字母感知缺陷有方向但代价大。一是抛弃现有分词机制,如Meta AI团队的Byte Latent Transformer(BLT)架构,虽在字符级任务测试中表现优异,但抛弃分词会使序列长度剧增,计算量大幅上升,且目前实验规模与生产级模型有差距,重新训练成本高昂。另一个方向是让模型“知道自己不擅长什么”,如Meta在Llama 3训练中针对此做了系统性工程,这类训练层面的修补成本低,但治的是症状不是病根。谷歌也在针对“词内字母计数”做优化,但修复周期长且涉及成本问题。