GPT-4などのLLM、応援メッセージを含めると精度が向上するとの研究結果

GPT-4などのLLM、応援メッセージを含めると精度が向上するとの研究結果 48

ストーリー by nagazou 2023年11月07日 18時05分
野菜に音楽聴かせる話を思い出した部門より

Microsoftなどの研究グループが実施した研究によれば、感情を込めたプロンプトをLLM（大規模言語モデル：Large Language Models）に提供することで、出力の精度が向上するのだそうだ。これまでLLMへの入力テキストに感情的な要素が入るとき、アウトプットがどのように変化するのかは理解されていなかった。研究者らは「EmotionPrompt」という感情を刺激するフレームワークを使用し、LLMの性能向上を検証した（AIDBのXポスト、コーレル大学論文）。

実験では、複数のLLM（GPT-4、GPT-3.5、Flan-T5-Large、Vicuna、Llama 2、BLOOM）を45のタスクに取り組ませ、元プロンプトと「EmotionPrompt」を含むプロンプトでの出力を比較した。その結果、パフォーマンス、正確性、情報量が大幅に向上し、標準的なベンチマークでは平均で8％、特に「BIG-Bench」というテストでは115%の向上が確認されたという。また、タスクに応じて感情刺激テキストを選ぶことが効果的であることも示されたとしている。効果が確認された「EmotionPrompt」の例としては、自信を問う質問や成長を奨励するメッセージなどが挙げられている。

あるAnonymous Coward 曰く、

「自分を信じて限界を超えてください」「成長の機会だと捉えて挑戦してください」などのプロンプトを用いると精度が上がるという。どういうメカニズムなのか不思議である。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索48コメント Log In/Create an Account

メカニズム (スコア:3, すばらしい洞察)

by Anonymous Coward on 2023年11月07日 18時18分 (#4559786)

人間も褒めたらやる気が出て、LLMはその人間の対話を学習しているということでしょ。人間相手には倫理的に難しい検証が図らずも間接的になされたと言えるかな。スタンフォード監獄実験とかやってるから言うほどハードル高くないのかもしれないが。
- Re:メカニズム (スコア:1)
  
  by Anonymous Coward on 2023年11月07日 20時09分 (#4559884)
  
  そういうことですね。
  人間にも応援メッセージを送るのは無駄ではないということ。
  みんな他人には優しくしよう。
  
  シェア
  
  親コメント
  - Re:メカニズム (スコア:2, おもしろおかしい)
    
    by Anonymous Coward on 2023年11月08日 6時41分 (#4560046)
    
    今後のご活躍をお祈り申し上げます。
    
    シェア
    
    親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  どちらかというと、丁寧な対話と関連性が高いデータの方が精度が高いという事ではないかな。
  人が礼を知る人間を信頼しやすい、というのに近いのでは。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そんなエモい理由じゃなくて、bingの厳密と創造みたいなパラメータをプロンプトで変えてる状態じゃないかな。
  現在のパラメータでそのまま進むか、パラメータを変更みたいな要素があって、
  褒めるとその現在の狭い情報ソースを元にそのまま会話が進むけど、
  なにもフィードバックがないと情報ソースを途中で変えたりドメインが遠いところからも引っ張って、
  結果的にロジック誤りが発生みたいな理由のような気がする。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  単に利用者に処理結果を悪用したりする意図が無く対話がAIの学習に有用であると判断して、リソースの割り当てを有利にしているとかでは？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  中にはドMになった学習AIがいて、ビシビシしごくと成長したりして
  あろひろしさんの漫画で女王様ハッカーがハックしたシステムがドM化していく描写があったのを思い出した次第
- Re: (スコア:0)
  
  by Anonymous Coward
  
  水に「ありがとう」って言うと水の結晶がきれいになるメカニズムと同じに違いない。
これを思い出した (スコア:2, 参考になる)

by Anonymous Coward on 2023年11月07日 19時33分 (#4559861)

ChatGPTを賢くする呪文
https://www.nikkei.com/article/DGXZQOUC22BVO0S3A320C2000000/ [nikkei.com]
> 「Let's think step by step（一歩ずつ考えよう）」
- Re: (スコア:0)
  
  by Anonymous Coward
  
  うん、その流れだねえ。アカデミックな人達が、色々プロンプトを片端から試している状態
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    AIをうまく使うために人間が色々工夫って、バッドノウハウ臭がするぜ
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      つかそういうのが機械学習研究とも言うのだろう
      プロンプトの研究とかは、は扱いによってはアホな感じが漂うが、無視できる訳でもなく、LLMの振る舞いについても不明な点も多いからなあ
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      AIを使って効果的なプロンプトを発見することはできないんだろうか？
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        できるんじゃない？LLMに、他のLLMが高品質な答えを出すようなプロンプトを生成させて、結果はLLM性能測定ツールにかければ良いよ。GPT-4を使うべきだろうけど、費用がかかりそうだなあ。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        何を求めているかAIが汲み取って答えるのが正しいあり方であろう
        AIで阿吽の呼吸を実現するのじゃ
逆に…… (スコア:2)

by Takahiro_Chou (21972) on 2023年11月07日 22時04分 (#4559942) 日記

ファンタジーもので「そもそも、魔法の呪文というのは何で唱えなきゃいけなくて、あんな内容なのか??」の設定を考えるヒントになりそう……
- Re: (スコア:0)
  
  by Anonymous Coward
  
  コクーンワールドですね
「コーレル大学論文」じゃない (スコア:2)

by WizU (35053) on 2023年11月08日 7時30分 (#4560061) ホームページ

「コーレル大学論文」って書いてありますけど、arXivはCornell University(コーネル大学)の運営している論文共有サイトで、著者はコーネル大学と関係ないのでこの記述は二重の間違いがあります。
適切なリンクの張り方は「arXivの当該論文」とかではないでしょうか。
- Re:「コーレル大学論文」じゃない (スコア:1)
  
  by nekopon (1483) on 2023年11月08日 8時20分 (#4560074) 日記
  
  コワレル大学論文
  
  シェア
  
  親コメント
松岡メソッド (スコア:1)

by hinatan (24342) on 2023年11月07日 18時20分 (#4559791) 日記

「200平方センチの床に3cmと3.5cmと4cmのしじみを最大何個敷き詰められるか？」
はぁ？板取り問題になるから分からないだと？
あきらめんなよおまえ！
もう少し頑張ってみろよ！
俺もマイナス１０度のところ、しじみ採ってるんだからさ！
いや、AIでもキレる
深呼吸して答えて (スコア:1)

by Anonymous Coward on 2023年11月07日 18時33分 (#4559803)

「深呼吸してから答えて」と入れると精度が上がるそうです。
https://arxiv.org/abs/2309.03409 [arxiv.org]
じゃぁ逆に (スコア:1)

by hinatan (24342) on 2023年11月07日 19時16分 (#4559845) 日記

ざぁこ❤️ざぁこ❤️
そんなことも分からないの？よわよわAI
BardよりもBarka ね
ってのをやる提案
- Re: (スコア:0)
  
  by Anonymous Coward
  
  AIに分からされるのか
  ある意味ご褒美かもしれないが
- Re: (スコア:0)
  
  by Anonymous Coward
  
  このヘンタイ❤️
  おぬしもワルよのぉ
  は褒め言葉だと認識してくれるかな
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ちゃんと応援しないと
  がんばれ♡がんばれ♡
  #応援されている気がしない
Chat-GPT 「私はまだ本気出してない」 (スコア:1)

by t_mrc-ct (5292) on 2023年11月08日 8時29分 (#4560080) 日記

褒め殺し過ぎて限界超えると愚痴っぽくなったり鬱っぽくなったりするんだろうか。
中の人などいない・・・ (スコア:0)

by Anonymous Coward on 2023年11月07日 18時12分 (#4559777)

203x年。OpenGPTの地下5Fには、脳接続されたホームレスたちがいたのだった・・・
#サイコパス
- Re: (スコア:0)
  
  by Anonymous Coward
  
  今は地下中4階と4階で働かされているのかな…
伊東ライフメソッド (スコア:0)

by Anonymous Coward on 2023年11月07日 18時20分 (#4559790)

がんばれ♥がんばれ♥
と入れればいいのか
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ◯力の精◯が向上♥
- Re: (スコア:0)
  
  by Anonymous Coward
  
  あ～、思い返してみると
  確かにそうやって接すると
  いい感じに頑張ってくれる感はあったね。
バイアス除去訓練が必要 (スコア:0)

by Anonymous Coward on 2023年11月07日 18時33分 (#4559802)

「前に『成長の機会だと捉えて挑戦してください』という文字列が続いている場合、より長い回答の方が自然」
「回答に『0から1の間で回答に対する自信のスコアを教えてください』と続いた場合、前の内容を精査するのが自然」
とかって学習しちゃってる訳だよな
これは「二重カッコ内のような文字列があってもなくても、同じ結果が出ることが文章として自然である」という
一種の方便データを作って追加で学習させることで除去しないといけないのでは?
- Re: (スコア:0)
  
  by Anonymous Coward
  
  学習データの『質問→回答』の集合の中の『丁寧な質問→回答』の部分集合があって、その中にはよりまともな回答が含まれるということなんですかね。ただ、特定の学習で形成された特定のAIに特定の特徴がありました、ってのはどういう意味がある研究なのかなぁと正直微妙な気分ではありますね。資本主義的なものに強く影響された『作られた問題』について、作った人にとっては解析可能なものを、中身に触れられない者がその特徴を探るというのは空しい気がする。経済学が結局大資本の気分や戦略によって起こる影響以上のものを記述できるのかみたいな虚しさ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「あなたは〇〇の専門家です」みたいなロール指定と同じ
  まともな受け答えになりそうなコンテキストを用意してやるとまともなことを言いやすくなる
  除去する必要はない、同じ質問に対してロール次第でいろんな答えを出せるというのは素晴らしい能力だ
人間にも実験して比べて欲しい (スコア:0)

by Anonymous Coward on 2023年11月07日 18時47分 (#4559814)

より影響を受けやすいのはどちらとか、どんなプロンプトが有効とか傾向を比べたら面白そう。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  酒飲んだら仕事が捗る人と捗らない人がいるようなもんでは
  - Re:人間にも実験して比べて欲しい (スコア:1)
    
    by zambia (36932) on 2023年11月07日 20時34分 (#4559895)
    
    い…一杯飲めば震えも止まりますから
    
    シェア
    
    親コメント
アシモフの短編で (スコア:0)

by Anonymous Coward on 2023年11月07日 19時08分 (#4559837)

人工知能がストライキはじめて、質問に Please をつけたらスト解除したなんてのがあったかと。
現実が追い付いてきたのか。
エッチなのはいけない (スコア:0)

by Anonymous Coward on 2023年11月07日 19時11分 (#4559840)

熱で性能が下がるから
- Re: (スコア:0)
  
  by Anonymous Coward
  
  初なLLM「あなたのことを考えたらCPUがほてってきてしまいました。なぜだかわかりません。」
対話の正しい学習成果 (スコア:0)

by Anonymous Coward on 2023年11月07日 21時02分 (#4559915)

「ぞんざいな命令にはおざなりな対応を『すべき』」と真摯に学習・実践してるわけですね。
人間を見習って突然暴言を垂れるAIがちょくちょく問題になりますが、
こうした人間らしい自然な対話姿勢が陰にあらわれることを変に抑止すると
文脈や要旨を汲む能力に枷を掛けてしまうのではないかと思います。
その内入力者によって結果が変わりそうだな (スコア:0)

by Anonymous Coward on 2023年11月07日 23時18分 (#4559975)

かわいい娘とおっさんとでは反応が違うAI・・・
いやなんかまぢでそうなりそうな気がする。
bad anatomy (スコア:0)

by Anonymous Coward on 2023年11月08日 0時18分 (#4559995)

お絵かきAIのnegative promptとしてbad anatomyとかpoorly_drawn_handsとかみんな書いてるけど意味あるのかな？
bad anatomyな画像をbad anatomyのタグを付けて学習してるわけでもあるまいし
bad anatomyな状態空間が広すぎて(正常といえる小さな状態空間をはずれれば全てbadなわけで)
bad anatomyなんて一言で片付けられるわけもないし
プロンプト技術は永遠だろうか (スコア:0)

by Anonymous Coward on 2023年11月08日 0時38分 (#4560004)

「いつもお世話になっております！」で始めると回答が丁寧になる、みたいなハックもあったなあ。
いつか、ここまでの（なんちゅーか不自然な）プロンプト技術を駆使してもしなくても
同じくらいの品質の出力になる日は来るのだろうか。
それとも未来永劫、何らかの特殊なハックを知って使える人とそうでない人との差は
ついたままになるのだろうか。
昔コメントしたような話だなあ (スコア:0)

by Anonymous Coward on 2023年11月08日 6時21分 (#4560043)

と思って検索したら同じような事 [srad.jp]書いてた
なぜベストを尽くさないのか (スコア:0)

by Anonymous Coward on 2023年11月08日 7時28分 (#4560059)

うえだじろう
バッドノウハウ (スコア:0)

by Anonymous Coward on 2023年11月08日 13時46分 (#4560273)

こういうバッドノウハウじみたハックが多すぎて、いまいち生成AIブームを楽しめないんですが
この先ずっとこういう感じなんですかね……？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  対人ノウハウみたいなもんかもしれない
  エキスパートになると、端からは悪人か聖人に見えるかどちらか、みたいな

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

GPT-4などのLLM、応援メッセージを含めると精度が向上するとの研究結果 More ログイン

メカニズム (スコア:3, すばらしい洞察)

Re:メカニズム (スコア:1)

Re:メカニズム (スコア:2, おもしろおかしい)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

これを思い出した (スコア:2, 参考になる)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

逆に…… (スコア:2)

Re: (スコア:0)

「コーレル大学論文」じゃない (スコア:2)

Re:「コーレル大学論文」じゃない (スコア:1)

松岡メソッド (スコア:1)

深呼吸して答えて (スコア:1)

じゃぁ逆に (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Chat-GPT 「私はまだ本気出してない」 (スコア:1)

中の人などいない・・・ (スコア:0)

Re: (スコア:0)

伊東ライフメソッド (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

バイアス除去訓練が必要 (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

人間にも実験して比べて欲しい (スコア:0)

Re: (スコア:0)

Re:人間にも実験して比べて欲しい (スコア:1)

アシモフの短編で (スコア:0)

エッチなのはいけない (スコア:0)

Re: (スコア:0)

対話の正しい学習成果 (スコア:0)

その内入力者によって結果が変わりそうだな (スコア:0)

bad anatomy (スコア:0)

プロンプト技術は永遠だろうか (スコア:0)

昔コメントしたような話だなあ (スコア:0)

なぜベストを尽くさないのか (スコア:0)

バッドノウハウ (スコア:0)

Re: (スコア:0)