ドット絵ふかのすけのクリーチャー化を、参照画像+dailyDiffで鎮めた記録

TL;DR

  • 6週間運用して、ドット絵がクリエイティブになり「クリーチャーみ」が出がちになったでござる。
  • 参照画像(ドット正本)を渡す方式へ切替。ただし「コピペ複製」問題が発生。
  • 差分はプロンプトの気合ではなく、**週次生成で dailyDiff を確定(J–N列)**し、背景必須+ANTI-COPYで安定化したでござる。

0. 発端(6週間の運用で見えた違和感)

ドット絵ふかのすけのXポストを約6週間まわしていたところ、生成結果にどうも「クリーチャーみ」が混ざりやすかったでござる。
Geminiくんは md テキストから頑張って生成してくれていたものの、ドット世界線の純度が負けて、クリエイティブ露わな“キメラ化”が起きる。

一方、生成画像のファイルサイズが小さく、参照画像を渡しても運用コスト(トークン/課金)が爆発しない見込みが立った。
そこで、ドット絵のデフォルト画像(ドット正本)を参照として渡し、まずキャラクター設計を固定する方針へ切り替えたでござる。

ただし参照を入れると、今度はモデルが安全策として「参照画像の複製」を選びがちになった。
以降は 差分を担保する設計(dailyDiff+背景必須+ANTI-COPY) に舵を切った次第。


1. 困ってた症状

  • ドット絵を作りたいのにフィギュア調のままになり、顔だけピクセルっぽくなる(キメラ化)
  • 参照画像(ドット正本)を渡すと、そのままコピペになって差分が出ない
  • 背景が無になる/殺風景(長方形化、背景要素の省略)
  • 週次データに J–N(dailyDiff)列を追加したら空欄になり、見た目差分が管理できない

2. 原因の当たり(推測)

  • visualCore に「高精細・自然光・被写界深度」系が含まれ、ドット指定より強く勝っていた
    → フィギュア寄りに引っ張られる
  • 参照画像+強い契約文が効きすぎ、モデルが安全策として「参照画像の複製」を選ぶ
  • 背景指定が曖昧だと「背景なしでも条件達成」と解釈されやすい
  • 週次生成時点で dailyDiff を確定しておらず、画像生成時に差分が担保されない
  • 同一seed派生だと短期(7日)で組み合わせが寄ることがある

3. やった変更

3.1 スプレッドシート(台帳)側

  • 列を整理:
    date / created_at / tweet_text / alt_text / image_prompt / feelings / status / media_id / image_url / facing / prop / bg_color / pixel_grid / variant_flag
  • image_statusimage_url に変更(役割の誤解を防ぐ)
  • 週次生成(weeklyFukanosukeMain)で dailyDiff を同時確定して J–N に保存
    → 画像生成側は「読むだけ」にする

3.2 dailyDiff の偏り対策

  • seededRandomFromKey_(dateIso + ":facing") のように 列ごとに乱数を独立
    • facing / prop / bg_color を分離して偏りを減らす
  • bg_color は嗜好に合わせてパレットから紫系を外し、cream系中心へ

3.3 ドット生成プロンプトの再設計

  • ドット生成では visualCore を混ぜない(ドット世界線の純度を上げる)
  • dailyDiff を強化:
    • 1:1 正方形キャンバス
    • pixel grid 指定
    • 背景必須(地面帯+ワンポイントモチーフ+2色以上)
    • ANTI-COPY(参照画像の複製を禁止)
  • 参照画像入力の混線を防ぐ:
    • FUKA_PIXEL_CANON_PATH を用意してドット正本を参照に渡す(default webp とは分離)

4. 結果

  • ドット絵の「ふかのすけ」が狙い通り出るようになり、正方形も安定
    • 基準画像を 1280×1280 にしたら特に安定したでござる
  • 参照画像の「完全コピー」問題は、差分強制(背景必須+ANTI-COPY)で改善
  • 週次で7日分作る時点で dailyDiff が確定するので、再生成しても日替わり見た目が固定される

5. 確認方法(毎回のルーチン)

  • testGenerateFukaImage_forTomorrow() を実行
  • 対象日の行で以下を確認:
    • tweet_text / alt_text / image_prompt が揃っている
    • J–N(facing/prop/bg_color/pixel_grid/variant_flag)が埋まっている
    • 生成画像が ドット絵・正方形・背景あり になっている

6. 今回の学び(小さく、しかし効く)

差分はプロンプトだけで作るのではなく、週次のデータ確定(J–N)で運用として担保すると静かに回る。
時間をかけて遊んだ甲斐は、ここに出たでござる。

弥七

この切れ端を記したのは、弥七でござる。