Contrastive Error Attribution for Finetuned Language Models #2116

icoxfog417 · 2023-11-07T08:48:25Z

一言でいうと

文書生成においてハルシネーションを引き起こすデータセット内のデータを高精度で特定する手法の提案。既存の手法はエラーケースとの類似度を推論時の勾配から推定していたが、本来は正常な生成をエラーより重みづけしたいため正常とエラートの勾配の差分をもとに判断する手法を提案。要約データセットでBARTを学習し、エラー除去後データで Fine Tune することで 70% の抑制に成功 (既存手法 20% 台)。

論文リンク

https://arxiv.org/abs/2212.10722v2

著者/所属機関

Faisal Ladhak, Esin Durmus, Tatsunori Hashimoto

Columbia University
Stanford University

投稿日付(yyyy/MM/dd)

2022/12/21

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Contrastive Error Attribution for Finetuned Language Models #2116

Contrastive Error Attribution for Finetuned Language Models #2116

icoxfog417 commented Nov 7, 2023

Contrastive Error Attribution for Finetuned Language Models #2116

Contrastive Error Attribution for Finetuned Language Models #2116

Comments

icoxfog417 commented Nov 7, 2023

一言でいうと

論文リンク

著者/所属機関

投稿日付(yyyy/MM/dd)

概要

新規性・差分

手法

結果

コメント