FLUX.2 klein 4B で 12カ国の料理を描かせて見えたもの

本記事は AI が描く各国料理 — 8モデル × 12カ国で比較してみたのスピンオフ、各モデル単独レビューの v2。

母艦記事では 8モデル × 12カ国 = 96 国別評価セルの全体俯瞰を扱う。本記事はその中の FLUX.2 klein 4B だけを 60 プロンプト全部について Gemini 2.5 Pro Vision で評価した詳細を載せる。

TL;DR

FLUX.2 klein 4B は Flux 系列の超軽量蒸留版 4B。4-step で高速、Apache 2.0 で商用利用も可。観光地メジャー料理では健闘するが、形状特定要件で崩れやすい。
60 プロンプト (12カ国 × 5料理) を生成、Gemini API 出力を 現地正解基準として比較評価
文化的再現度 (cultural_accuracy): 平均 1.30 / 3.0
観光客目線の見栄え (visual_appeal): 平均 4.18 / 5.0
失敗型の主成分: 視覚的に似た別カテゴリの料理に引き寄せられる (beta 27件)
強い国: Germany, Japan
弱い国: Italy, Korea, Lebanon
推奨用途: 高速プロトタイピング、観光地メジャー料理
避けたい用途: 形状の厳密さが要る料理 (Italy の risotto / osso buco / cannoli)

1. 生成環境

項目	値
アーキテクチャ	DiT (FLUX.2 family, Black Forest Labs)
サイズ	4B (10 GB bf16)
ステップ数	4
蒸留	✅ (4-step 蒸留)
1枚あたり生成時間 (M1 Max 64GB / MPS)	約 1.5 分 (4 step / 1024px / MPS)
HF gated repo	❌ 申請不要 (HuggingFace で誰でも DL 可)
ライセンス	Apache 2.0 (商用利用可)

from diffusers import Flux2KleinPipeline
import torch

pipe = Flux2KleinPipeline.from_pretrained(
    "black-forest-labs/FLUX.2-klein-4B",
    torch_dtype=torch.bfloat16,
).to("mps")

image = pipe(prompt="...", num_inference_steps=4,
             height=1024, width=1024).images[0]

wired_limit: Mac で MPS バックエンドを使い大型モデルを動かす場合、sudo sysctl iogpu.wired_limit_mb=61440 (60GB) を毎回設定する (再起動でリセット)。

2. 12カ国比較グリッド

参考画像 (最上段、緑帯) が Gemini API、その下が FLUX.2 klein 4B + 他 6 ローカルモデル。本記事の対象は FLUX.2 klein 4B 行。クリックで原寸表示。

母艦記事の結果マトリックスで、このモデルが全体のどこに位置するかを確認できる。

3. 国別の挙動 (Gemini 2.5 Pro Vision 評価ベース)

3.1 強い国 (cultural_accuracy 平均 ≥ 2.0)

Japan — CA 2.40 (aabbb)
Germany — CA 2.00 (bbbbb)

3.2 中庸の国 (1.0 ≤ ca < 2.0)

USA — CA 1.40 (bbccc)
Mexico — CA 1.40 (bbccc)
Brazil — CA 1.40 (bbccc)
Vietnam — CA 1.40 (bbccc)
Thailand — CA 1.20 (bcccc)
Nigeria — CA 1.20 (bcccc)
India — CA 1.00 (ccccc)

3.3 弱い国 (ca < 1.0)

Korea — CA 0.80 (ccccd)
Lebanon — CA 0.80 (ccccd)
Italy — CA 0.60 (bcddd)

4. 失敗型の特徴

このモデルの 60 件評価で観察された失敗型の分布：

型	件数	特徴
α 異文化 garnish ライブラリ混入	6	異文化のハーブ・ソース・食器を混入
β 視覚類似カテゴリ引き寄せ	27	視覚的に似た別カテゴリへ統計的に引き寄せ
γ 整列癖 (パレイドリア)	2	要素が幾何学的に整いすぎる
mixed 複合	14	複数の失敗型が複合
none 大きな失敗なし	11	—

代表的な失敗事例

Italy / risotto Milanese (d/2, beta) — 「主原料が米ではなく、松の実やパスタのような全く別の食材に置き換わっており、参考画像とは根本的に異なる料理になっているため。」