パスワードを忘れた? アカウント作成
15803799 journal
日記

yumeの日記: ゼロから始める機械学習・画像生成 黎明編

日記 by yume

備忘録的に。
前提知識は完全にゼロ。「Stable Diffusionとかいうやつで画像が作れるらしいじゃん」くらい。

deforumというStable Diffusionを利用した動画生成サービスがある。これをやりたい。
・webでやれる。価格は生成時間1分あたり0.012ドル~0.138ドル(借りるグラボの強さによるっぽい)。
・価格に不満は無いけど、どうせなら自分のPCでやってみたい。

--

公式によると、Cogを使って自分のPCでやれるらしい。
Cogを使うには、Dockerとかいうやつを使わなきゃならんらしい。Dockerってなんだ?

さくらのナレッジ 横山氏曰く、
Dockerとは、コンテナ型の仮想環境を作成、配布、実行するためのプラットフォームだそうだ。なんのこっちゃ。

>Dockerは、Linuxのコンテナ技術を使ったもので、よく仮想マシンと比較されます。
仮想マシンといえば、パラレルとかいうmac内でwindowsを動かしたことがあった。つまり今のOSの中で別のOSを動かすことができるというのに近い話のようだ。

>ホストマシンのカーネルを利用し、プロセスやユーザなどを隔離することで、あたかも別のマシンが動いているかのように動かすことができます。

たしかカーネルとは、OSが物理的な部分の情報を扱ってるところだったかな。コンテナとしてLinuxめいたものを俺のPC内に組み上げて、物理的な部分を利用可能にしてあげるといった感じだろうか。
そうすることで、実質的に何かに特化したOS的なものをWindows内に構築できるという話かな。

まとめると:
・コンテナはOSのようにPCの物理部分を利用できる。
・コンテナさえ構築すれば、どんなPCでも大体みんな同じように扱えるので便利。
・コンテナを扱うにはDockerが必要。
・Cogは機械学習系に特化したコンテナの一種。
・Cogを実行すれば、Stable Diffusionで画像生成的なことができる
・Cogを活用してdeforumで動画生成もできる。

準備のための準備のための準備がいるぐらいの段階だな。さっそくやっていこう。

--

幸い、windows11でcogを実行してみるまでの詳細な手順が全部まとまっている。
初心者に優しい世界だ。

概ねターミナルを使って作業できるようだ。ターミナルに入れるコマンドの意味はさっぱりわからない。でも動く。

WSL2という単語が頻出するが、これはなんだろう。

カゴヤのサーバー研究室曰く、
WSLとは、Windows上でLinuxを動作させるための実行環境であり、WSL2はそれの新しいバージョンで、完全なLinuxを動かせるらしい。

ざっと記事を読む限りでは……やっぱり仮想マシンのようなものらしい。
仮想マシン的なもの(コンテナ)を動かすためにまず仮想マシンを入れるとは……。鉄を鍛えるために鉄のハンマーがいるみたいな話だ。

WSL2を無事使える状況にもっていったら、次はUbuntu 18.04をインストール。これはたしかLinuxの一種……というかLinuxはいくつものパーツの集合的な概念で、それの使いやすいセットのひとつがUbuntuだったと思う。それの仮想版なのだから、仮想ビッグマックセットみたいなもんだろう。

Windowsの中でUbuntuを起動して(これもターミナルみたいなやつだ)、Ubuntu経由でDockerを実行できるという寸法らしい。DockerはDocker Desktop for Windowsとかいうのをインストールした。

最後の呪文はコレ。
cog predict 'r8.im/afiaka87/glid-3-xl' -i prompt="a fresh avocado floating in the water" -o prediction.json
なかなかうまく詠唱できなかったが、どうやらDockerを起動していなかったからだった。再起動したので閉じたままだった。初歩的。

詠唱に成功すると、何かをダウンロード・インストールしはじめた。25GBくらい。完了すると、Docker Desktopに「r8.im/afiaka87/glid-3-xl」というコンテナが表示されたので、コンテナを構築していたらしい。

Ubuntuはそのままそのコンテナ(Cog)にプロンプトの命令を実行させたらしく、GPUが急速にうなりをあげ始め……そしてすぐ停止した。GeForce GTX 1660 SUPERのVRAMは6GBで、このサンプルに必要なVRAMは8GBだった。要するに性能が足りなかった。

そういうわけで、VRAMが24GBもあるGeForce RTX 3090を注文した。Amazonで15万円くらいした。自分のPCでやるからといって、安くすむとは限らない。

GPUが届いたら続きをやろう。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy

読み込み中...