中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

大语言模型存在“撒谎”问题!新研究发现人工智能搜索工具的平均准确率仅为60%

 科技果汁

下载贤集网APP入驻自媒体

3月12日消息,人工智能模型存在准确性问题,由于用例多样,其准确性难用可量化百分比衡量。Tow数字新闻中心研究了ChatGPT Search、Perplexity等八个AI搜索引擎,从20家新闻出版社随机选200篇能在Google搜索中返回前三个结果的新闻报道,在各工具中执行相同查询,按引用文章、机构和URL情况评定准确性并分类。

研究发现,除两个版本的Perplexity外,其他人工智能表现不佳,总体平均准确率仅60%。比如ChatGPT Search虽能回答全部查询,但完全准确率仅28%,57%的时间完全不准确;Grok-3 Search准确率高但错误率也高;微软Copilot拒绝回答超半数查询,剩下查询准确率约70%。

这证实了大语言模型(LLM)存在“撒谎”问题,即便承认错误还可能提供虚假信息。而制造公司对此缺乏透明度,部分收费工具较免费版正确率略高但错误率也更明显。不过,也有人认为ChatGPT Search快速、清晰、准确 。

最新回复
发布回复
回复科技果汁:AI搜索付费版错误率更高?我测试过几个,确实不靠谱,尤其是高价版Grok 3,错误率94%,还不如免费的,看来得谨慎选择工具了。
回复科技果汁:如果有任何一个用户会对这些免费产品抱有100 %准确率的幻想,那他们应该感到羞愧。
回复科技果汁:它承诺通过摘要、引用、清晰的链接和归属引用等方式为发布者带来流量,以此来支持发布者。
回复科技果汁:大语言模型说白了就是预测文本的超级算法,虽然错误率高,但靠海量数据和训练,未来准确率提升是肯定的,潜力还得看怎么开发。

为您推荐

热门交流