パスワードを忘れた? アカウント作成
16699627 journal
人工知能

strangerの日記: 大規模言語モデル「Llama-2」を試した

日記 by stranger

Metaとマイクロソフトがオープンソースとして無償提供を始めた大規模言語モデル「Llama 2」をローカルで試してみた。

準備として、WindowsのHyper-V上にAlmaLinux9.2の仮想環境を作った。
あとはこのnote「Llama.cpp で Llama 2 を試す」を参照させていただき、下記を除いて基本そのままの手順でAlmaLinux上に環境構築すれば問題なく動作した。

・AlmaLinux9.2に自前でpipとgccをインストールした
・提示されているサンプルコード「hello_ggml.py」のbinファイル指定がq8でなくq4になっていたのでコードを修正した

気になったのは日本語でも質問できるけど、回答が一律英語であること。
何かパラメータを変える必要があるのだろうか。

・What kind of website is "https://srad.jp/"?
・What kind of website is https://srad.jp/?
上記の「url(スラド)ってどんなサイト?」という質問は、ダブルクォーテーション有無で回答が変わるのは当然だろううけど、上の方の回答が
"Hello! Based on my research, "https://srad.jp" appears to be a website for a Japanese company called SRA Radian Corporation."
「SRA Radian Corporationという会社のサイト」と、いうわけがわからないものだった。

ざっと試した感じ、言語の分析精度が高いけど回答はおかしな感じ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

クラックを法規制強化で止められると思ってる奴は頭がおかしい -- あるアレゲ人

読み込み中...