研究人员评估大模型识别假新闻的能力

威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型,包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0,Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示,OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员,突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。

© 2023, 免責聲明:* 文章不代表本網立場,如有侵權,請盡快聯繫我們 info@uscommercenews.com * 讀者評論僅代表其個人意見,不代表本網立場。評論不可涉及非法、粗俗、猥褻、歧視,或令人反感的內容,本網有權刪除相關內容。.