回复科技果汁:AI搜索付费版错误率更高?我测试过几个,确实不靠谱,尤其是高价版Grok 3,错误率94%,还不如免费的,看来得谨慎选择工具了。
下载贤集网APP入驻自媒体
3月12日消息,人工智能模型存在准确性问题,由于用例多样,其准确性难用可量化百分比衡量。Tow数字新闻中心研究了ChatGPT Search、Perplexity等八个AI搜索引擎,从20家新闻出版社随机选200篇能在Google搜索中返回前三个结果的新闻报道,在各工具中执行相同查询,按引用文章、机构和URL情况评定准确性并分类。 研究发现,除两个版本的Perplexity外,其他人工智能表现不佳,总体平均准确率仅60%。比如ChatGPT Search虽能回答全部查询,但完全准确率仅28%,57%的时间完全不准确;Grok-3 Search准确率高但错误率也高;微软Copilot拒绝回答超半数查询,剩下查询准确率约70%。 这证实了大语言模型(LLM)存在“撒谎”问题,即便承认错误还可能提供虚假信息。而制造公司对此缺乏透明度,部分收费工具较免费版正确率略高但错误率也更明显。不过,也有人认为ChatGPT Search快速、清晰、准确 。