alfredplpl commited on
Commit
1e6cd66
1 Parent(s): 9b28342

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +208 -0
README.md CHANGED
@@ -1,3 +1,211 @@
1
  ---
 
2
  license: openrail++
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ extra_gated_prompt: このモデルをこのページからダウンロードするためにはHugging Faceに登録された情報を提供する必要があります。この提供された情報は画像生成AIを活用する情報を案内するために使われます。 To download this model from this page, you need to provide information registered with Hugging Face. The information provided will be used to guide you on how to utilize the image-generation AI.
3
  license: openrail++
4
+ tags:
5
+ - stable-diffusion
6
+ - text-to-image
7
+ inference: false
8
+ library_name: diffusers
9
  ---
10
+
11
+ # Emi Model Card
12
+
13
+ ![eyecatch.jpg](eyecatch.jpg)
14
+ [Original(PNG)](eyecatch.png)
15
+
16
+ English: [Click Here](README_en.md)
17
+
18
+ # はじめに
19
+ Emi 2 (Ethereal master of illustration 2) は、
20
+ 最先端の開発機材H100、RTX 4090と画像生成Stable Diffusion XL 1.0を用いて
21
+ AI Picasso社が開発したAIアートに特化した画像生成AIです。
22
+ このモデルの特徴として、Danbooruなどにある無断転載画像を学習していないことがあげられます。
23
+
24
+ # 使い方
25
+ [ここ](https://huggingface.co/spaces/aipicasso/emi-2-demo)からデモを利用することができます。
26
+ 本格的に利用する人は[ここ](emi-2.safetensors)からモデルをダウンロードできます。
27
+
28
+ # シンプルな作品例
29
+
30
+ ![example_1.jpg](example_1.jpg)
31
+
32
+ ```
33
+ positive prompt: anime artwork, anime style, (1girl), (black bob hair:1.5), brown eyes, red maples, sky, ((transparent))
34
+ negative prompt: (embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
35
+ ```
36
+
37
+ ![example_2.png](example_2.png)
38
+
39
+ ```
40
+ positive prompt: monochrome, black and white, (japanese manga), mount fuji
41
+ negative prompt: (embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
42
+ ```
43
+
44
+ ![example_3.jpg](example_3.jpg)
45
+ ```
46
+ positive prompt: (1man), focus, white wavy short hair, blue eyes, black shirt, white background, simple background
47
+ negative prompt: (embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
48
+ ```
49
+
50
+ # モデルの出力向上について
51
+ - 使えるプロンプトはWaifu Diffusionと同じです。また、Stable Diffusionのように使うこともできます。
52
+ - ネガティブプロンプトに[Textual Inversion](https://civitai.com/models/119032/unaestheticxl-or-negative-ti)を使用することをおすすめします。
53
+ - 手が不安定なため、[DreamShaper XL1.0](https://civitai.com/models/112902?modelVersionId=126688)などの実写系モデルとのマージをおすすめします。
54
+ - ChatGPTを用いてプロンプトを洗練すると、自分の枠を超えた作品に出会えます。
55
+ - 最新のComfyUIにあるFreeUノード、または[Web UIの拡張機能](https://github.com/ljleb/sd-webui-freeu)を次のパラメータで使うとさらに出力が上がる可能性があります。次の画像はFreeUを使った例です。
56
+ - s1=1.2, s2=0.7, b1=1.1, b2=1.3
57
+
58
+
59
+ # 法律について
60
+ 本モデルは日本にて作成されました。したがって、日本の法律が適用されます。
61
+ 本モデルの学習は、著作権法第30条の4に基づき、合法であると主張します。
62
+ また、本モデルの配布については、著作権法や刑法175条に照らしてみても、
63
+ 正犯や幇助犯にも該当しないと主張します。詳しくは柿沼弁護士の[見解](https://twitter.com/tka0120/status/1601483633436393473?s=20&t=yvM9EX0Em-_7lh8NJln3IQ)を御覧ください。
64
+ ただし、ライセンスにもある通り、本モデルの生成物は各種法令に従って取り扱って下さい。
65
+
66
+ # 連絡先
67
+ support@aipicasso.app
68
+
69
+ 以下、一般的なモデルカードの日本語訳です。
70
+
71
+ ## モデル詳細
72
+ - **モデルタイプ:** 拡散モデルベースの text-to-image 生成モデル
73
+ - **言語:** 日本語
74
+ - **ライセンス:** [CreativeML Open RAIL++-M License](LICENSE.md)
75
+ - **モデルの説明:** このモデルはプロンプトに応じて適切な画像を生成することができます。アルゴリズムは [Latent Diffusion Model](https://arxiv.org/abs/2307.01952) と [OpenCLIP-ViT/G](https://github.com/mlfoundations/open_clip)、[CLIP-L](https://github.com/openai/CLIP) です。
76
+ - **補足:**
77
+ - **参考文献:**
78
+ ```bibtex
79
+ @misc{podell2023sdxl,
80
+ title={SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis},
81
+ author={Dustin Podell and Zion English and Kyle Lacey and Andreas Blattmann and Tim Dockhorn and Jonas Müller and Joe Penna and Robin Rombach},
82
+ year={2023},
83
+ eprint={2307.01952},
84
+ archivePrefix={arXiv},
85
+ primaryClass={cs.CV}
86
+ }
87
+ ```
88
+
89
+ ## モデルの使用例
90
+
91
+ Stable Diffusion XL 1.0と同じ使い方です。
92
+ たくさんの方法がありますが、3つのパターンを提供します。
93
+ - ComfyUI
94
+ - Fooocus
95
+ - Diffusers
96
+
97
+ ### ComfyUIやFooocusの場合
98
+
99
+ Stable Diffusion XL 1.0 の使い方と同じく、safetensor形式のモデルファイルを使ってください。
100
+ 詳しいインストール方法は、[こちらの記事](https://note.com/it_navi/n/n723d93bedd64)を参照してください。
101
+
102
+ ### Diffusersの場合
103
+
104
+ [🤗's Diffusers library](https://github.com/huggingface/diffusers) を使ってください。
105
+
106
+ まずは、以下のスクリプトを実行し、ライブラリをいれてください。
107
+
108
+ ```bash
109
+ pip install invisible_watermark transformers accelerate safetensors diffusers
110
+ ```
111
+
112
+ 次のスクリプトを実行し、画像を生成してください。
113
+
114
+ ```python
115
+ from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
116
+ import torch
117
+
118
+ model_id = "aipicasso/emi-2"
119
+
120
+ scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id,subfolder="scheduler")
121
+ pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.bfloat16)
122
+ pipe = pipe.to("cuda")
123
+
124
+ prompt = "1girl, upper body, brown bob short hair, brown eyes, looking at viewer, cherry blossom"
125
+ images = pipe(prompt, num_inference_steps=20).images
126
+ images[0].save("girl.png")
127
+
128
+ ```
129
+
130
+ 複雑な操作は[デモのソースコード](https://huggingface.co/spaces/aipicasso/emi-2-demo/blob/main/app.py)を参考にしてください。
131
+
132
+ #### 想定される用途
133
+ - イラストや漫画、アニメの作画補助
134
+ - 商用・非商用は問わない
135
+ - 依頼の際のクリエイターとのコミュニケーション
136
+ - 画像生成サービスの商用提供
137
+ - 生成物の取り扱いには注意して使ってください。
138
+ - 自己表現
139
+ - このAIを使い、「あなた」らしさを発信すること
140
+ - 研究開発
141
+ - Discord上でのモデルの利用
142
+ - プロンプトエンジニアリング
143
+ - ファインチューニング(追加学習とも)
144
+ - DreamBooth など
145
+ - 他のモデルとのマージ
146
+ - 本モデルの性能をFIDなどで調べること
147
+ - 本モデルがStable Diffusion以外のモデルとは独立であることをチェックサムやハッシュ関数などで調べること
148
+ - 教育
149
+ - 美大生や専門学校生の卒業制作
150
+ - 大学生の卒業論文や課題制作
151
+ - 先生が画像生成AIの現状を伝えること
152
+ - Hugging Face の Community にかいてある用途
153
+ - 日本語か英語で質問してください
154
+
155
+ #### 想定されない用途
156
+ - 物事を事実として表現するようなこと
157
+ - 先生を困らせるようなこと
158
+ - その他、創作業界に悪影響を及ぼすこと
159
+
160
+ # 使用してはいけない用途や悪意のある用途
161
+ - マネー・ロンダリングに用いないでください
162
+ - デジタル贋作 ([Digital Forgery](https://arxiv.org/abs/2212.03860)) は公開しないでください(著作権法に違反するおそれ)
163
+ - 他人の作品を無断でImage-to-Imageしないでください(著作権法に違反するおそれ)
164
+ - わいせつ物を頒布しないでください (刑法175条に違反するおそれ)
165
+ - いわゆる業界のマナーを守らないようなこと
166
+ - 事実に基づかないことを事実のように語らないようにしてください(威力業務妨害罪が適用されるおそれ)
167
+ - フェイクニュース
168
+
169
+ ## モデルの限界やバイアス
170
+
171
+ ### モデルの限界
172
+
173
+ - 拡散モデルや大規模言語モデルは、いまだに未知の部分が多く、その限界は判明していない。
174
+
175
+ ### バイアス
176
+
177
+ - 拡散モデルや大規模言語モデルは、いまだに未知の部分が多く、バイアスは判明していない。
178
+
179
+ ## 学習
180
+
181
+ **学習データ**
182
+
183
+ - Stable Diffusionと同様のデータセットからDanbooruの無断転載画像を取り除いて手動で集めた約3000枚の画像
184
+ - Stable Diffusionと同様のデータセットからDanbooruの無断転載画像を取り除いて自動で集めた約50万枚の画像
185
+
186
+ **学習プロセス**
187
+
188
+ - **ハードウェア:** H100, RTX 4090
189
+
190
+ ## 評価結果
191
+
192
+ 第三者による評価を求めています。
193
+
194
+ ## 環境への影響
195
+
196
+ - **ハードウェアタイプ:** H100, RTX 4090
197
+ - **使用時間(単位は時間):** 1000
198
+ - **学習した場所:** 日本
199
+
200
+ ## 参考文献
201
+
202
+ ```bibtex
203
+ @misc{podell2023sdxl,
204
+ title={SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis},
205
+ author={Dustin Podell and Zion English and Kyle Lacey and Andreas Blattmann and Tim Dockhorn and Jonas Müller and Joe Penna and Robin Rombach},
206
+ year={2023},
207
+ eprint={2307.01952},
208
+ archivePrefix={arXiv},
209
+ primaryClass={cs.CV}
210
+ }
211
+ ```