
パフォーマンスマーケティング、コンテンツ制作、あるいはクリエイティブ戦略の仕事をしているなら、このパターンに見覚えがあるはずです。
Veo 3.1やSora 2のような生成モデルは、シネマティックな動画を身近なものにしました。しかし、デフォルトのワークフローは依然として、多くのチームが密かに「運任せのプロンプト(prompt and pray)」と呼ぶものです。つまり、テキストの段落を放り込み、モデルが意図を汲み取ってくれることを祈るのです。
その推測作業は、1回限りの実験なら問題ありません。しかし、以下のような状況では完全に破綻します。
ここで、JSONプロンプティングが状況を一変させます。
曖昧なテキストの代わりに、subject(被写体)、camera(カメラ)、lighting(照明)、duration(長さ)、audio(音声)、さらには aspectRatio(アスペクト比)といった構造化されたフィールドを定義し、モデルに明確な指示書(ブリーフ)に従わせるのです。JsonToVideoはこの考え方に基づいて構築されており、構造化されたJSONプロンプトを使用して、Veo 3.1やSora 2で予測可能かつブランドに沿ったクリップを生成します。

一般的なAI動画ワークフローは次のようになります。
「夜の東京を走る未来的なスポーツカー、ネオンライト、シネマティックな照明、4K、製品スタイルのショット。」
モデルは以下のすべてを推測しなければなりません。
形容詞を1つ変えるだけで、完全に異なる動画になってしまうことがよくあります。YouTubeショートを作るクリエイターにとっては許容範囲かもしれませんが、パフォーマンス目標を持つ広告主にとっては悪夢です。
課題点:
自由形式のプロンプトは探索には適していますが、制作システムとしては最悪です。
JSONプロンプティングは、動画のブリーフ(指示書)を段落ではなく、構造化データとして扱います。
これの代わりに:
「レーストラックをドリフトする赤いスポーツカー、シネマティック、暖かい日差し、8秒の広告、16:9、アップテンポな音楽。」
次のような形式に移行します:
{
"subject": "レーストラックのコーナーをドリフトする赤いスポーツカー",
"camera": "車の後方を追尾するローアングルのトラッキングショット",
"lighting": "ゴールデンアワー、暖かい日差し、長い影",
"style": "シネマティック、鮮明、高コントラスト",
"durationSeconds": 8,
"aspectRatio": "16:9",
"audio": "エンジン音入りのエネルギッシュなエレクトロニックトラック"
}
これにより、モデルは推測する必要がなくなります。
JsonToVideoのようなプラットフォームはこれをさらに推し進め、構造化されたJSONプロンプトをビジュアルエディター、再利用可能なJSON動画テンプレート、そして同じスキーマを共有するデュアルモデル構成(Veo 3.1とSora 2)でラップしています。

すべてのチームが独自のスキーマを持つことになりますが、成果を上げているセットアップの多くは、いくつかの主要なフィールドを共有しています。
これがあなたのヒーローです。
被写体を分離することで、カメラ、照明、スタイルを反復修正する間も、アイデンティティと形状を安定させることができます。
テキストプロンプトでは、カメラの指示が後回しにされがちです。JSONプロンプティングでは、それを明確に記述することが強制されます。
camera: "ドローンのエスタブリッシングショット、都市の上空をゆっくりとプッシュイン"camera: "手持ち、アイレベル、穏やかな左右への動き"camera: "マクロクローズアップ、浅い被写界深度、製品を横切るスロードリー"特にVeo 3.1は、明示的なカメラ言語に強く反応します。スキーマにおける撮影監督(シネマトグラフィー)のフィールドと考えてください。
照明とスタイルは、コンテンツを壊すことなく感情を変化させるため、独自のフィールドにする価値があります。
lighting: "柔らかな自然光、清潔なスタジオ、最小限の影"lighting: "サイバーパンクのネオン、強いリムライト、暗い背景"style: "洗練されたEコマース広告、高コントラスト"style: "UGCスタイルの縦型動画、自然光、わずかな粒子感"同じ被写体+カメラに対して、何十通りもの照明やスタイルの組み合わせを試して、何がコンバージョンにつながるかを確認できます。
よくある問題ですが、16:9のYouTube広告をTikTok用に9:16に切り取ると、ひどい見た目になります。
JSONを使えば、長さとフレームをコード化できます。
durationSeconds: 8 または 12aspectRatio: "16:9"、"9:16"、または "1:1"JsonToVideoのエンジンはこれらのフィールドを使用して、別のプロンプトを作成することなく、同じテンプレートからYouTube、TikTok、リール、またはインフィード配置をターゲットにします。
最後に、サウンドとブランドを固定できます。
audio: "エネルギッシュなトラップビート、BPM100、ボーカルなし"audio: "穏やかなアンビエントパッド、控えめなライザー音"brandLock.logoPlacement: "bottom-right"(右下)brandLock.colorPalette: "red, black, white"(赤、黒、白)これが、「素敵なデモ」と「配信可能な広告」の違いです。
実際にコピーして使える形にしてみましょう。
これがVeo 3.1製品広告のための最小限のテンプレートです。
{
"model": "veo-3.1",
"aspectRatio": "16:9",
"durationSeconds": 8,
"subject": "",
"camera": "",
"lighting": "",
"style": "",
"audio": "",
"brandLock": {
"logoPlacement": "bottom-right",
"colorPalette": ""
}
}
ワイヤレスイヤホンを宣伝すると仮定しましょう。
{
"model": "veo-3.1",
"aspectRatio": "16:9",
"durationSeconds": 8,
"subject": "反射するガラス面上のマットブラックのワイヤレスイヤホン一対",
"camera": "ミディアムショットからクローズアップへのスロードリーイン、製品周りのわずかな視差",
"lighting": "鋭い白いリムライトとわずかな反射のある暗いスタジオ",
"style": "プレミアムテックコマーシャル、鮮明、高コントラスト、1080p対応",
"audio": "トランジションに同期した深い低音ヒットのあるモダンなエレクトロニックトラック",
"brandLock": {
"logoPlacement": "bottom-right",
"colorPalette": "black, white, electric blue"
}
}
JsonToVideoで以下の手順を実行します:
brandLockとstyleを自社のブランドに合わせて調整する。これで、壊れやすい1回限りのプロンプトではなく、再現可能で編集可能なレシピが手に入りました。
次に、Sora 2を使用して、このアイデアをUGCスタイルのTikTokまたはリール動画に適応させてみましょう。
{
"model": "sora-2",
"aspectRatio": "9:16",
"durationSeconds": 10,
"subject": "居心地の良いバスルームで、新しいスキンケア美容液について自撮り動画で話している若い女性",
"camera": "手持ち、アイレベル、わずかな自然な手ブレ、時折行われる微細なリフレーミング",
"lighting": "バスルームの鏡からの暖かい室内照明、柔らかな影、自然な肌の色合い",
"style": "UGC縦型広告、本物のスマホカメラ映像のような質感、軽い粒子感",
"audio": "低音量の控えめなBGMと自然なナレーション",
"callToAction": "画面上のテキスト:終了近くに表示される『30日間試してみる』"
}
これも構造化されていますが、Veo 3.1の製品スポットよりも意図的に洗練度を下げています。Sora 2に次のように指示しているのです。
JsonToVideoは、静止画をアップロードしてJSONで動きを制御するImage-to-Video(画像から動画生成)もサポートしています。
既に強力な製品写真があり、シンプルなヒーローモーションを加えたいとします。
{
"mode": "image-to-video",
"imageUrl": "https://your-cdn.com/images/serum-bottle.png",
"model": "veo-3.1",
"durationSeconds": 10,
"aspectRatio": "9:16",
"cameraPath": "ボトルのミディアムショットで開始、その後スロードリーインし、製品の周りを時計回りに小さく弧を描く",
"motionIntensity": "medium",
"pacing": "一定、急なジャンプなし",
"lighting": "清潔なスタジオライト、白い背景、ガラス上の柔らかな反射",
"style": "ミニマリストなEコマース広告、明瞭さとラベルの可読性を重視",
"audio": "柔らかなアンビエント背景音、ボーカルなし"
}
これは、JsonToVideoのImage to Video機能が「ワンステップで写真をモーションに」や「JSONモーションコントロール」と説明しているものと一致します。画像を提供し、Veo 3.1またはSora 2を選択し、モデルが良いパンやズームを選んでくれることを期待する代わりに、JSONを使用してカメラパスやペーシングを操作します。

JSONプロンプティングの真の力は、1つのプロンプトの見栄えが少し良くなることではありません。それは以下の点にあります。
subject、colorPalette、callToAction)を交換できる。例えば:
camera、lighting、style、durationSeconds、aspectRatioは固定します。
製品のスプレッドシートを反復処理します:
subject: "コンクリートの床上の赤いランニングシューズ"subject: "岩の道上の黒いトレイルシューズ"subject: "木製デスク上の白いライフスタイルスニーカー"あるいは、A/BテストのためにcallToActionだけを変更します:
これこそがJsonToVideoが設計された目的です。バージョンごとに手動で再プロンプトすることなく、構造化データをシネマティックなクリップに変換するのです。
無料ツールや1回限りのデモは趣味なら問題ありません。しかし、実際のキャンペーンにおいてチームは以下を重視します。
JSONプロンプティングは、動画の見栄えを良くするだけではありません。パイプライン全体を測定可能で再現可能なものにします。
JsonToVideoは、プロンプトをコードのように扱いたいチームのために特別に構築されています。
ビジュアルから始めてエディターにJSONを生成させることも、既に慣れている場合は生のJSONに直接飛び込むこともできます。
まだ1行のプロンプトを書いて最高の結果を期待しているなら、あなたはお金と、そして正気をドブに捨てているようなものです。
この記事を実際のワークフローに変える方法は以下の通りです。
subject、camera、lighting、durationSeconds、aspectRatioを追加します。subject、brandLock、callToActionをカスタマイズします。クリエイティビティを捨てる必要はありません。 祈るのをやめて、監督を始めるだけでいいのです。
コミュニティに参加する
最新のニュースと更新情報を入手するには、ニュースレターを購読してください
