アカウント名:
パスワード:
アピールしているのも開発に時間を掛けたと言ってるのも倫理性や正確性の部分だそうな。と考えたらおそらく数百TBのテキストデータぶち込めば似たような成果は比較的容易に再現できるような雰囲気だ。一生懸命調整したパラメーターやら学習のコツやらは割とコピーできそうだし、学習データ自体にGPTの出力を使える。しかも一々「倫理で答えられない」とか「そういう質問に答えるべきではない」とか言わなくなる。一方で差別やら自殺教唆やら原作の引用やら好き放題になるけどそれで良いなら後追いは容易そう。
OpenAIが今時のIT企業としては全然オープンではないからオープンソースの倫理ガン無視類似AIが出て来るのに期待。とはいえ学習データは基本デカいSNS系企業のものや著作権保護されてる書籍とかだから「オープンソース」ってのもおかしいが、少なくともローカルで動くものはどっかが出してくるだろう。手元のPDFデータや漫画を読ませてみたいところ。お高いGPUが必要になりそうだけども。
多分日本勢もやろうと思えば後追いできるだろうけど、GPT-3以降が日本語でもあんだけ強いならどっかがオプソでも出してくるならやる必要ない。GPT-4は知らんがChatGPTはIT企業にありがちな西洋思想のリベラル君だから中国は中国思想系AIを出してきて、おそらく日本語もそこそこ通じるだろうからそれはそれでちょっと期待。
画像読み込みを再現できるかは知らん。ミーム画像とそれのどこが面白いかのデータなんてそこらへんに転がってる気はしないが、試験系なら何とかなるかも。何の根拠もないけど、OpenAIだけ使える特別な学習データやコピーできないノウハウがあるという雰囲気ではないような気がする。
>一方で差別やら自殺教唆やら原作の引用やら好き放題になるけど
「AIのべりすと」がコンテントフィルター機能をOFFにするとまさにそうなんだよなあ
最後の二行について言えば、基本的にはその通りだろう
むしろ、デフォでヘイトスピーチ垂れ流したりしないとか、何か変なこと言わせようと思ったら、少し頭を捻ってプロンプトを考えなければならないそこら辺がOpenAIのノウハウではあるだろう。仕事で使うときには重要な機能だよな
オープンなGPT-3相当品とか、学習済みなら1台のPCに載るモデルとか、Gigazineとか読めば沢山書いてるよ?もうリンク貼るの疲れた
画像は、ざっくり言うと画像を一次元配列にして、自然言語の単語のようにして学習させる。まあ調べてみれば良いよ
AIのいいところは頼まれてもいないのにあなたのように喋り出さないし頼まれてもいないのに勝手に喋りだした挙げ句勝手に疲れて文句言い出したりしないところ。今のところは…
それはそうでもない気がする。ChatGPTでも質問によっては毎度注意書きされたりする。ネットのコメントを学習させたら似たようなコメントするだろうし。
あのコメントに対して勝手にコメントして文句を言ってとか、ChatGPTですら言わないだろうなw
消費税(AI税)1%上げていいから、次世代富岳みたいなのでGPT-5相当ぐらい動かして使わせてくんないかな。
面白い案ですね。
#以前、どこかで国家が開発したAIがあまりにも優秀すぎると、国家間のAI開発競争が激化して国家予算の大半をAIに投資することになり、一部の国民の仕事が無くなり最終的には国が衰退するという話を読んだけれど。
ただし日本の一部の分野では、特定の思想に偏向しているから、某国のテレビみたいに危険思考の垂れ流しになる懸念もある。
あと最悪W*nnyみたいに犯罪ほう助で、開発者の逮捕もあり得るから、その様な危険は冒さないかと思います。
#テレビがオレオレ詐欺の手口を公開しているが、真似をした人の犯罪ほう助でテレビの人たちが警察に捕るというニュース聞いたことないけれど。
あと一部の政治家たちは、政治資金収支報告書や身内のNPOや一般社団法人の金の流れなどが、追跡される可能性があるので積極的に法案賛成をしないはず。
『非営利団体がマネーロンダリングの隠れみのに 2022/05/30』
妄想+AIか。興味深いとも、ツマラネとも、なんでこうトホホな方向なんだろうとも
中国は中国思想系AIを出してきて、おそらく日本語もそこそこ通じるだろうからそれはそれでちょっと期待。
無理でしょ。AIってのは古今東西の人類の自由かつ膨大な表現活動の蓄積あってこそのものなわけで。表現活動に微塵の自由もない国が主導するAIなんて中国スゴイスゴイ・アメリカ死ね死ねとわめくだけの人工無能でしかない。
お高いGPUなんてレベルじゃないよ。こないだ話題になったデータが少ないllama 65Bですら121GB程度ある。単純計算でグラボのメモリ121GB必要なんだよ?ChatGPTやGPT4など下手したらもう一桁多いレベルのメモリを要するだろうし、とてもじゃないけど買えない。
だからローカル勢はCPUで動かすことになるし、そうすると糞遅い。llamaでも寝る前に質問しこんで朝にまだ回答終わってないぐらいの速度よ。
#llama 7Bならそこそこ早いけど馬鹿すぎて・・・
そのうちクラウドにかけて数日で学習できるようになるかもしれない、そうなると企業なら十分可能、とか誰かが書いてた
どうやったかは知らない
https://twitter.com/umiyuki_ai [twitter.com]
うみゆき@AI研究@umiyuki_aiよしゃあ!DalaiでインスコしたLLaMA. cppの一番でかい65Bモデルが手元のWindowsPCで動いたぞ!1トークンあたり1.2秒かかってる。M1Macだと1トークン0.5秒だから2倍遅いのが気に食わんけど、やっぱ手元のPCで650億パラメータモデルがボチボチの速度で動作してくれるのは嬉しいね!!CPUはRyzen3950X
いわゆる知性を持ったAIが世に出る前から、既に人類の努力のかけどころがAIの暴走を抑えるためのリミッター設定に当てらてるのは熱いな。
だってこれまでにも暴言を学習させられてヘイトスピーチ吐くようになったチャットボットがあるからな。MSが数年前に公開した奴とか
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
倫理性を無視すれば (スコア:0)
アピールしているのも開発に時間を掛けたと言ってるのも倫理性や正確性の部分だそうな。
と考えたらおそらく数百TBのテキストデータぶち込めば似たような成果は比較的容易に再現できるような雰囲気だ。
一生懸命調整したパラメーターやら学習のコツやらは割とコピーできそうだし、学習データ自体にGPTの出力を使える。
しかも一々「倫理で答えられない」とか「そういう質問に答えるべきではない」とか言わなくなる。
一方で差別やら自殺教唆やら原作の引用やら好き放題になるけどそれで良いなら後追いは容易そう。
OpenAIが今時のIT企業としては全然オープンではないからオープンソースの倫理ガン無視類似AIが出て来るのに期待。
とはいえ学習データは基本デカいSNS系企業のものや著作権保護されてる書籍とかだから「オープンソース」ってのもおかしいが、少なくともローカルで動くものはどっかが出してくるだろう。
手元のPDFデータや漫画を読ませてみたいところ。
お高いGPUが必要になりそうだけども。
多分日本勢もやろうと思えば後追いできるだろうけど、GPT-3以降が日本語でもあんだけ強いならどっかがオプソでも出してくるならやる必要ない。
GPT-4は知らんがChatGPTはIT企業にありがちな西洋思想のリベラル君だから中国は中国思想系AIを出してきて、おそらく日本語もそこそこ通じるだろうからそれはそれでちょっと期待。
画像読み込みを再現できるかは知らん。
ミーム画像とそれのどこが面白いかのデータなんてそこらへんに転がってる気はしないが、試験系なら何とかなるかも。
何の根拠もないけど、OpenAIだけ使える特別な学習データやコピーできないノウハウがあるという雰囲気ではないような気がする。
Re:倫理性を無視すれば (スコア:1)
>一方で差別やら自殺教唆やら原作の引用やら好き放題になるけど
「AIのべりすと」がコンテントフィルター機能をOFFにするとまさにそうなんだよなあ
Re: (スコア:0)
最後の二行について言えば、基本的にはその通りだろう
むしろ、デフォでヘイトスピーチ垂れ流したりしないとか、
何か変なこと言わせようと思ったら、少し頭を捻ってプロンプトを考えなければならない
そこら辺がOpenAIのノウハウではあるだろう。仕事で使うときには重要な機能だよな
オープンなGPT-3相当品とか、学習済みなら1台のPCに載るモデルとか、Gigazineとか読めば沢山書いてるよ?もうリンク貼るの疲れた
画像は、ざっくり言うと画像を一次元配列にして、自然言語の単語のようにして学習させる。まあ調べてみれば良いよ
Re: (スコア:0)
AIのいいところは頼まれてもいないのにあなたのように喋り出さないし頼まれてもいないのに勝手に喋りだした挙げ句勝手に疲れて文句言い出したりしないところ。
今のところは…
Re: (スコア:0)
それはそうでもない気がする。
ChatGPTでも質問によっては毎度注意書きされたりする。
ネットのコメントを学習させたら似たようなコメントするだろうし。
Re: (スコア:0)
あのコメントに対して勝手にコメントして文句を言ってとか、ChatGPTですら言わないだろうなw
Re: (スコア:0)
消費税(AI税)1%上げていいから、次世代富岳みたいなのでGPT-5相当ぐらい動かして使わせてくんないかな。
Re: (スコア:0)
面白い案ですね。
#以前、どこかで国家が開発したAIがあまりにも優秀すぎると、国家間のAI開発競争が激化して国家予算の大半をAIに投資することになり、一部の国民の仕事が無くなり最終的には国が衰退するという話を読んだけれど。
ただし日本の一部の分野では、特定の思想に偏向しているから、某国のテレビみたいに危険思考の垂れ流しになる懸念もある。
あと最悪W*nnyみたいに犯罪ほう助で、開発者の逮捕もあり得るから、その様な危険は冒さないかと思います。
#テレビがオレオレ詐欺の手口を公開しているが、真似をした人の犯罪ほう助でテレビの人たちが警察に捕るというニュース聞いたことないけれど。
あと一部の政治家たちは、政治資金収支報告書や身内のNPOや一般社団法人の金の流れなどが、追跡される可能性があるので積極的に法案賛成をしないはず。
『非営利団体がマネーロンダリングの隠れみのに 2022/05/30』
Re: (スコア:0)
妄想+AIか。興味深いとも、ツマラネとも、なんでこうトホホな方向なんだろうとも
Re: (スコア:0)
中国は中国思想系AIを出してきて、おそらく日本語もそこそこ通じるだろうからそれはそれでちょっと期待。
無理でしょ。
AIってのは古今東西の人類の自由かつ膨大な表現活動の蓄積あってこそのものなわけで。
表現活動に微塵の自由もない国が主導するAIなんて中国スゴイスゴイ・アメリカ死ね死ねとわめくだけの人工無能でしかない。
Re: (スコア:0)
お高いGPUなんてレベルじゃないよ。
こないだ話題になったデータが少ないllama 65Bですら121GB程度ある。単純計算でグラボのメモリ121GB必要なんだよ?
ChatGPTやGPT4など下手したらもう一桁多いレベルのメモリを要するだろうし、とてもじゃないけど買えない。
だからローカル勢はCPUで動かすことになるし、そうすると糞遅い。
llamaでも寝る前に質問しこんで朝にまだ回答終わってないぐらいの速度よ。
#llama 7Bならそこそこ早いけど馬鹿すぎて・・・
Re: (スコア:0)
そのうちクラウドにかけて数日で学習できるようになるかもしれない、そうなると企業なら十分可能、とか誰かが書いてた
Re: (スコア:0)
どうやったかは知らない
https://twitter.com/umiyuki_ai [twitter.com]
うみゆき@AI研究
@umiyuki_ai
よしゃあ!DalaiでインスコしたLLaMA. cppの一番でかい65Bモデルが手元のWindowsPCで動いたぞ!1トークンあたり1.2秒かかってる。M1Macだと1トークン0.5秒だから2倍遅いのが気に食わんけど、やっぱ手元のPCで650億パラメータモデルがボチボチの速度で動作してくれるのは嬉しいね!!CPUはRyzen3950X
Re: (スコア:0)
いわゆる知性を持ったAIが世に出る前から、既に人類の努力のかけどころがAIの暴走を抑えるためのリミッター設定に当てらてるのは熱いな。
Re: (スコア:0)
だってこれまでにも暴言を学習させられてヘイトスピーチ吐くようになったチャットボットがあるからな。MSが数年前に公開した奴とか