404: 名無しのメタバースさん 2022/11/18(金) 22:57:44.18 ID:p7njBk5B0

AI画像プロンプトの学習者なら体感的に知っている
「前方優位の法則」と「色が混ざる現象」の
根拠を数値上で確認しました。CLIPというか
Transformerの仕様上そんな気はしていたんですが、

「各トークンは登場箇所から<以降すべて>に影響を及ぼし、
<前方に遡って影響を与えることは無い>」ようです。続く

https://ついったーr.com/ai_prompt_dev/status/1593590986797895680
https://i.imgur.com/jfMfymR.jpg
https://i.imgur.com/aLryEvR.jpg
はえー

411: 名無しのメタバースさん 2022/11/18(金) 23:05:45.70 ID:9fWxYh2G0

>>404

なるほどそう言う事だったんやな

414: 名無しのメタバースさん 2022/11/18(金) 23:10:37.32 ID:NYgeSz5k0

>>411

でも後半ほどプロンプトの効果弱いわけやん?
ほんで普通に無視されてたらそれはそれで意味ないやん
悩むなぁ

※: 本日のおすすめサイト記事一覧 0000/00/00(※) ID:metaversesoku



408: 名無しのメタバースさん 2022/11/18(金) 23:02:41.37 ID:EbuBfdvd0

>>404

後ろに置いた要素が
前にかかってくる気もしてたけど
気のせいやったんか……

410: 名無しのメタバースさん 2022/11/18(金) 23:05:20.39 ID:BvGVoO370

>>404

タグや単語によると思うけどなあ
画面全体に影響を与えるものは
後ろに配置してもちゃんと効いてるだろ
illustration とか nsfw とか

415: 名無しのメタバースさん 2022/11/18(金) 23:13:21.76 ID:p7njBk5B0

>>404

規制で貼れなかったんだけど
トークン間で混ざらないということらしい。
全体に効くのはそのまま影響出る
https://i.imgur.com/JAGb2nq.jpg
ワード離しておいてみたりして多少改善したけど
打率低かったプロンプトも
これ参考にすればマシになるのかなあ

419: 名無しのメタバースさん 2022/11/18(金) 23:14:49.55 ID:REJBi/Oy0

>>415

おーサンガツ。理解したわ

455: 名無しのメタバースさん 2022/11/19(土) 00:09:33.78 ID:ziDu/aYi0

>>415

わかったようなわからないような
可愛いみたいな形容詞は前方に置くと
後の呪文に混ざりやすいってことかな?
他の呪文に意味が掛からない
名詞動詞は混ざりにくいってことか?

604: 名無しのメタバースさん 2022/11/19(土) 08:48:19.04 ID:PsVMACLW0

>>404

limbの人か、何か検証足りてない感が

413: 名無しのメタバースさん 2022/11/18(金) 23:10:21.19 ID:x7JjPB510

という事は、髪の色と目の色が同じになる現象は、
髪→目で指定すれば目の色を固定しやすいという事かな

416: 名無しのメタバースさん 2022/11/18(金) 23:13:33.07 ID:REJBi/Oy0

前方に遡らないってんなら
マスピとかを最後尾に置くのも意味ないんか?

417: 名無しのメタバースさん 2022/11/18(金) 23:13:36.38 ID:fLQdGTqt0

結局ガチャやからあんま関係ないね

422: 名無しのメタバースさん 2022/11/18(金) 23:21:04.18 ID:O6Gp3upU0

色は汚染されたくない色と
部位合わせてUCに突っ込んでたが
意味あったのかなかったのか……
結局ガチャな気がしてならん

425: 名無しのメタバースさん 2022/11/18(金) 23:28:05.03 ID:p7njBk5B0

直後の数トークンに強く影響して
徐々に減衰するってのも
感覚的に分かってたけど腑に落ちた
頭の装飾を髪と一緒に先に色指定とか
やってたから無駄に混ざってたんやなあって

426: 名無しのメタバースさん 2022/11/18(金) 23:29:43.33 ID:EbuBfdvd0

後置修飾は効果なかったんやな……

427: 名無しのメタバースさん 2022/11/18(金) 23:32:12.52 ID:qc4f6pKyM

位置の近いもの同士で置いてたけど
アウトラインほど前半でディテールほど
後半のほうが良さそうな感じするなあこれだと

428: 名無しのメタバースさん 2022/11/18(金) 23:33:43.79 ID:s2Sf/bGT0

blue hair, red eyesなら目は青くなる可能性は
あるけど髪は赤くならないみたいな話なのかね
まあこのプロンプトなら実際は
それぞれが強いからまざらんやろうけど

432: 名無しのメタバースさん 2022/11/18(金) 23:39:10.98 ID:TtgXpFVJ0

>>428

見直してみたけど
こういうパターンで生成してるのに
目の色が髪に移ってるのもあるな
どういうことなんだろう

680: 名無しのメタバースさん 2022/11/19(土) 12:02:32.28 ID:liweJPv20

>>428

その場合は red が hair にはかからないけど
先に書いた hair の残り香が red と混ざって
結局赤い髪は出るという話

430: 名無しのメタバースさん 2022/11/18(金) 23:36:46.84 ID:O6Gp3upU0

後ろのやつほど混ざる色と部位を
それぞれUCに放り込んで阻止してたんやがあかんのかな
とっくに皆そうしてるかと思ったが
もちろん複数キャラやと通用せんのやが

433: 名無しのメタバースさん 2022/11/18(金) 23:39:37.91 ID:zaZDd+jwa

ぱっと見白猫のマールっぽいドミねえ 
マイナーってほどでもないから違いそうやけど

443: 名無しのメタバースさん 2022/11/18(金) 23:52:16.39 ID:QcH8P4y70

>>433

合ってるで データセット見直してまたやってみるわ

440: 名無しのメタバースさん 2022/11/18(金) 23:46:45.79 ID:C2/82SF2M

並び順でどうにかなる問題なら
とっくに解決されてるはずやろ
言葉の処理としてはこうなってるんやろうけど
NAIはhairが何でeyesが何なのか
わかってないからダメなんかな

442: 名無しのメタバースさん 2022/11/18(金) 23:49:37.66 ID:xT4ILdxU0

並び方の影響度はそうなんだろうけど
ノイズ消してく段階で混ざってる感じだわ

445: 名無しのメタバースさん 2022/11/18(金) 23:54:15.53 ID:P5Z2wPEG0

>>442

実際に描画されるものの
位置の影響が大きい気がするよね

450: 名無しのメタバースさん 2022/11/18(金) 23:57:15.30 ID:TQ/SW7hq0

なんにせよプロンプトの指定の甘さの問題は
そのうち抜本的に変えなきゃいけないし変わるやろ

SDのアルゴリズム自体につきまとう問題だと
大変やが、新しいMidjourneyは生成最初のほうと
後半でアルゴリズム変えることで成功してるらしいし

452: 名無しのメタバースさん 2022/11/19(土) 00:02:21.52 ID:ZdB7yU8eM

(効果の実感としては疑問だが)
waifuも独自のタグ記法は実装してるし、
一般論としては自然言語の形態素解析が良しでも、
二次絵的には融通なんて効かせず
タグ拾ってくれるほうがありがたいんだよね

454: 名無しのメタバースさん 2022/11/19(土) 00:07:38.80 ID:3XDM7s0D0

まあそう遠からず色が混ざるだの
キャラ描き分け出来ねえだのは
過去の話になるんじゃねえの

466: 名無しのメタバースさん 2022/11/19(土) 00:28:39.62 ID:PLtxN5AS0

赤いリンゴ、青い海って指定した時、
赤はリンゴと海両方にかかるけど
青は海にしかかからない
でもリンゴが青にかかるから結果として
リンゴに青が混じることがある

って理解であってる?

469: 名無しのメタバースさん 2022/11/19(土) 00:33:36.37 ID:KKKm328i0

>>466

そうなるやろな

……結局ガチャでは?

472: 名無しのメタバースさん 2022/11/19(土) 00:40:51.31 ID:PLtxN5AS0

>>469

一応当たりの確率は上げられるにしても
既に経験則的にやってたことではあるし
結局タグ自体が強いと前方への影響も強くなるしで
完全制御は遠そうやね

470: 名無しのメタバースさん 2022/11/19(土) 00:40:12.47 ID:oF9CmyHVp

うーん後ろの色が前に混ざるのは
しょっちゅうあると思うけどなあ…
まあ何かのタグが何かに引っ張られてそうなってる
可能性も否定は出来ないけども

475: 名無しのメタバースさん 2022/11/19(土) 00:46:48.62 ID:myobmX2i0

まあ色ならペイントソフトでいじるので
特に問題はないな問題はないな形への影響なんよ

500: 名無しのメタバースさん 2022/11/19(土) 01:38:05.11 ID:6BMbTCRHM

色は()や,を無視して前の要素に吸われやすいで
red eyes, (black hair)この場合は黒目になる事がある
だからeyes red,(black hair)こうするとredとblackが
反発して希望通りの要素に色が付きやすいぞ困った時はお試しあれ

506: 名無しのメタバースさん 2022/11/19(土) 01:48:26.78 ID:oVd6c991p

>>500

マ?試してみるわ

502: 名無しのメタバースさん 2022/11/19(土) 01:42:09.42 ID:q52yIVJUM

まだまだプロンプトはweb版でも改善の余地あるな
感覚でしかないのを数値にして
はっきりとできるようになると思うわ
分析したいけど手が間に合わん

504: 名無しのメタバースさん 2022/11/19(土) 01:47:01.80 ID:mkG57DLF0

このWEB版というのがwebuiを指すのか
本家NAIを指すのかがわからないマン

507: 名無しのメタバースさん 2022/11/19(土) 01:51:11.12 ID:dyf13MY5M

前後単語に色移りのはあるやろな
fusionも近くに並べた単語同士の結び付き強くなるのが
効いてるだけでfusionって単語自体は意味ないし

546: 名無しのメタバースさん 2022/11/19(土) 03:48:19.86 ID:lD6uzHkl0

縦長って人物描写的には最適なんやけど
16:9モニター的には相性よくないんよな
回転機能ありのモニターとかどんだけ普及してんやろか?
わいは持ってるゲーミングモニターが ピボット機能ありなんだけど
9:16くらいに縦長生成したやつ見るといいぞ~コレ

568: 名無しのメタバースさん 2022/11/19(土) 05:45:36.69 ID:bkq3cdkN0

後ろのワードは前のワードの影響を受ける
これ仕組みで聞くとややこしいけど
ようは同じ成分混ざった時に後ろの方が
効果小さくなるのと同じ意味だね
単純に同じ成分は比率で混ぜるんじゃなく
後ろの方が前の影響を比率分受けると言う仕組みなんだね

引用元:https://nozomi.2ch.sc/test/read.cgi/liveuranus/1668735603/
_________________________________________________________________________________