kohya-ss/sd-scripts の 自動キャプショニング の項目を調べていて、 DeepDanbooru のほかに WD14Tagger というものがあることがわかっています。しかも WD14Tagger のほうが精度が良いかもしれない という記載もあります。
この記事では WD14Tagger を使う上で、
AUTOMATIC1111/stable-diffusion-webui を準備しなきゃいけないか?
などと色々調べたことを書いておきます。
ちなみに DeepDanbooru は以下の記事で試しています。
- WD14Tagger とは?
- ということは WebUI の環境を作らなきゃいけない?
- WebUI 無しで WD14Tagger 動かせないのかな?
- よくよく読んでみると kohya-ss さんもスクリプト作ってそう
- まとめ
WD14Tagger とは?
Tagger for Automatic1111's WebUI とされており、 Stable Diffusion WebUI の拡張機能として存在している模様。
ということは WebUI の環境を作らなきゃいけない?
と思いつつ、 WD14Tagger を使うのを諦めかけていました。
環境汚したくないし Docker あるかな?
WebUI 無しで WD14Tagger 動かせないのかな?
Stable Diffusion で LoRA を作成する際の定番プラグイン という記載もあり、
みんなこういうのでタグ付けしているのかー。っていうことがわかりました。
よくよく読んでみると kohya-ss さんもスクリプト作ってそう
Automatic1111氏のWebUIで使用しているtaggerを利用します。こちらのgithubページ(https://github.com/toriato/stable-diffusion-webui-wd14-tagger#mrsmilingwolfs-model-aka-waifu-diffusion-14-tagger )の情報を参考にさせていただきました。
と記載のある通り、初見では WebUI を使って Tagger を利用するものだと思ってましたが、あくまで参考にしただけのようです。
tag_images_by_wd14_tagger.py
を追ってみると finetune/
にいました。
もっとよくよく読んでみると・・・
docs/
の下に wd14_tagger_README
がありました。