アカウント名:
パスワード:
Wikipedia使うのはGPTでもやってるし、他の和製LLMでもやってる。でもせっかくだから出版社を巻き込んで各種百科事典他各種辞典を突っ込みたいところ。あと青空文庫と論文。ホントはあらゆる出版物を学習させるくらいして欲しいが、著者の承諾なしは著作権的にセーフでも問題になりそう。ウェブの文書じゃやってることなんだが…。Wikipedia使うのって手軽な幅広い知識と量の確保、重複の回避(GPTも英語版Wikipediaのみで各国語Wikipedia突っ込まないのは単なる翻訳項目が混ざると良くないという理由がある)という意味もあってその点普通の出版辞書じゃ及ばない(特に分量)とかそういうのはあるけど、とりあえず「辞書形式で」と指定したらがっちり辞書形式にしてくれるだけでも強いし、まともな辞書なのはそこそこ良い。
電子書籍も今年から国会図書館に納本義務ができたので、国会図書館と提携すれば大量に入力可能だと思うけどね。著作権的にセーフでも問題って、絵みたいに分かりやすいものじゃないんだから問題にならんよ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲを呼ぶ -- ある傍観者
Wikipediaは普通 (スコア:1)
Wikipedia使うのはGPTでもやってるし、他の和製LLMでもやってる。
でもせっかくだから出版社を巻き込んで各種百科事典他各種辞典を突っ込みたいところ。
あと青空文庫と論文。
ホントはあらゆる出版物を学習させるくらいして欲しいが、著者の承諾なしは著作権的にセーフでも問題になりそう。ウェブの文書じゃやってることなんだが…。
Wikipedia使うのって手軽な幅広い知識と量の確保、重複の回避(GPTも英語版Wikipediaのみで各国語Wikipedia突っ込まないのは単なる翻訳項目が混ざると良くないという理由がある)という意味もあってその点普通の出版辞書じゃ及ばない(特に分量)とかそういうのはあるけど、とりあえず「辞書形式で」と指定したらがっちり辞書形式にしてくれるだけでも強いし、まともな辞書なのはそこそこ良い。
Re:Wikipediaは普通 (スコア:0)
電子書籍も今年から国会図書館に納本義務ができたので、国会図書館と提携すれば大量に入力可能だと思うけどね。
著作権的にセーフでも問題って、絵みたいに分かりやすいものじゃないんだから問題にならんよ。