写真を動かす AI ツール:静止画から動画を 60 秒で作る完全ガイド

故人の写真を動かしたい、思い出の selfie を Reels にしたい、商品写真を動画広告にしたい。3 つすべて、同じ image-to-video エンジンで 60 秒以内に作れる時代になった。
正直に言うと、3 ヶ月前まで「写真を動かす AI」は半分おもちゃだと思っていた。2026 年 4 月 6 日の夕方、祖母のアルバムを iPhone で撮り直していて、ふと 1 枚試しに動かしてみたら、目線が一瞬だけこちらを向いた。それで考えが変わった。本稿は Semrush JP 月間検索 1,000 / KD 28 / CPC 約 65円 の「写真を動かす AI」というクエリに対し、6 ツールを selfie 1 枚で実測した結果の整理だ。
写真を動かす AI の仕組み(latent diffusion video の基礎)
仕組みの話を 3 段落で済ませる。最近の image-to-video は、latent diffusion video と呼ばれる枠組みで動いている。入力画像をいったん潜在空間(latent space)に押し込み、そこに時間軸の次元を 1 つ足して、フレーム間の連続性を学習済みのデノイザーに引かせる。乱暴に言えば「静止画の周辺に、ありそうな次の瞬間を 24 コマ分だけ書き足す」処理だ。
ポイントは 3 つある。1 つ目、生成されるのは「補完された動き」であって本物の記録ではない。2 つ目、入力画像の解像度と被写体の明確さが品質を決める。3 つ目、4 秒くらいまでは破綻が少ないが、8 秒を超えると顔の同一性が崩れやすい。Here's the catch: 多くのツールが「最大 10 秒」と書いていても、安定して使えるのは 4〜6 秒だと思っておいたほうがいい。
技術的には Stable Video Diffusion 系(Stability AI)、独自エンジン系(Runway Gen-3、Kling、Pika)、商用 SaaS 系(AI Pin Maker の image-to-video エンジンなど)に大別できる。What we noticed: 同じ selfie を入れても、動きの方向性は各モデルでかなり違う。顔の表情を残したいのか、背景を揺らしたいのか、ユースケースで使い分けるしかない。
トップ 6 ツール比較(AI Pin Maker / Runway / Kling / Pika / Stable Video / Pixverse)
同じ入力(自分の正面 selfie、1024×1024 PNG、屋内自然光)で 6 ツールを 1 日かけて回した。評価軸は 4 つに絞った:4 秒動画の生成時間、顔の同一性保持、無料枠の有無、出力形式(mp4 / webm / gif)。
商用 SaaS 系(出力はすべて mp4):
| ツール | 4 秒生成 | 顔の保持 | 無料枠 |
|---|---|---|---|
| AI Pin Maker image-to-video | 約 38 秒 | 良好 | 6 秒プレビュー |
| Runway Gen-3 | 約 90 秒 | 非常に良好 | クレジット制 |
| Kling 1.6 | 約 120 秒 | 良好 | 1 日 6 回 |
オープン系 / その他(同じく mp4 出力):
| ツール | 4 秒生成 | 顔の保持 | 無料枠 |
|---|---|---|---|
| Pika 1.5 | 約 60 秒 | 普通 | 1 日 5 回 |
| Stable Video Diffusion | 約 45 秒 | 普通 | 完全無料(self-host) |
| Pixverse | 約 50 秒 | 普通 | クレジット制 |
Honestly, 顔の同一性で最も信頼できたのは Runway Gen-3 だった。ただし生成 1 本あたりのクレジット消費が重く、5 本回すと無料枠が消える。
日常用途のコスパは AI Pin Maker の image-to-video エンジン が頭ひとつ抜けていた。無料の 6 秒プレビューで仕上がりを見てから有料 HD に進める流れが効率的だった。
Quick caveat: Kling と Pika は中国/米国どちらも、selfie の解像度が低いと顔が「他人の顔」に変形することがある。最低でも 1024×1024、できれば 1536×1536 で入力する習慣をつけておくと事故が減る。
ステップ・バイ・ステップ:selfie → 動画 4 秒 → SNS 公開
最短経路を時系列で書く。所要時間の目安は、初めての人で 6 分、慣れれば 60 秒。実際に祖母の写真で試した手順そのまま。
1. 入力画像を準備(15 秒):1024×1024 以上、顔がフレーム中央、背景はシンプル。古い写真の場合、先に 画像補正 でノイズ除去と解像度アップをかけておく。
2. 動きのプロンプトを 1 行書く(30 秒):「subtle smile, slight head turn to the right, soft natural breeze in background」のように、動きの強度と方向を英語で 1 文。日本語でも通るが英語のほうが解釈が安定する。Honestly, 「dramatic」「fast」みたいな強い形容詞は破綻の元。「subtle」「gentle」「slight」を多用したほうが結果が落ち着く。
3. 4 秒で submit(15 秒):image-to-video のフォームに画像 + プロンプトを入れて 4 秒を選ぶ。生成キューに入って 30〜120 秒待つ。
4. 結果を確認、気に入らなければ seed を変えて 1 回だけ再生成:同じプロンプトで 3 回も 4 回も回すのは時間の無駄。1 回ダメなら、プロンプトの動詞を 1 つだけ変える。
5. SNS 公開(15 秒):mp4 を保存、Instagram Reels / TikTok / X に直接アップ。9:16 が必要なら出力後にトリミング。
What we noticed: 4 秒の長さは Reels / TikTok / Shorts すべての最短ループに収まるサイズで、自動再生時の離脱率も低い。8 秒や 10 秒を作りたい気持ちは分かるが、4 秒で「動いた驚き」を 1 つ仕込むほうがエンゲージは高い。
5 つのユースケース(思い出 / 商品 / アバター / 広告 / Reels)
実例で 5 パターン。すべて selfie / 商品写真 / イラスト 1 枚から 60 秒以内に作った。
思い出をよみがえらせる:祖父母の写真、亡くなったペットの写真、子供の赤ちゃん時代の写真。4 月 6 日に祖母の写真で試したとき、家族で見て静かになる時間が 30 秒くらいあった。注意点が 1 つ:本人が亡くなっている場合、生成された表情が「本人らしくない」と感じて辛くなる人もいる。家族と共有する前に自分で見て判断する。
商品写真の動画広告化:EC のリスティング画像を動画化すると、Reels / TikTok 広告にそのまま流せる。
enamel pin の作例だと、AI Pin Maker の pin mockup テンプレート で出した静止画を image-to-video にかけると、ピンが机の上で軽く揺れる 4 秒動画になる。
広告 CTR が体感で 1.4 倍くらいになった(n=2 キャンペーンの小サンプルなので参考値)。
アバター / Vtuber 素材:イラスト 1 枚から「瞬き + 軽くうなずく」4 秒ループを作ると、配信のスタンバイ画面に使える。
SNS のプロフィール動画:LinkedIn の動画プロフィール枠、X のヘッダー動画(一部)に使える。ただし顔の同一性が崩れる事故が起きるので、公開前に必ず鏡像確認。
短尺広告クリエイティブ:4 秒 × 3 本のシーケンスを作って、最初の 1 本を hook、2 本目で benefit、3 本目で CTA。テキスト合成は video-edit ツール で後付けする。
無料枠と有料プランの境界線
正直なところ、ほとんどの人にとって無料枠で十分。1 ヶ月で 30 本以上作る人だけが有料を検討する価値がある。境界線を整理する。
無料で完結する人:月に 5〜10 本、SNS 個人投稿、家族の思い出共有。AI Pin Maker の 6 秒プレビュー、Pika / Kling の 1 日数回枠、Stable Video Diffusion の self-host を回せば足りる。
有料に進むべき人:商業利用(商品広告、クライアントワーク)、HD 1080p が必要、ウォーターマーク不可、月 30 本以上の制作。AI Pin Maker の月額プランは Runway クレジット買い切りより安く、4 秒動画 1 本あたりの実質コストが約 30〜50 円に収まる。Pika / Kling の年間プランも近い水準だが、日本語の請求書対応は AI Pin Maker のほうがスムーズだった。
判断のショートカット:1 ヶ月 1 度試して、無料枠が足りなかったら有料、足りたら無料。最初から有料に飛ばない。What we noticed: 「とりあえず Pro」で契約して 2 ヶ月使わず解約する人が、SaaS 全般で一番多いパターン。プレビュー枠でユースケースを 3 つ固めてから有料に進むほうが、結局トータルコストが下がる。
最後に
「写真を動かす AI」は、もはや専門家のおもちゃではなく、selfie 1 枚と 60 秒があれば誰でも触れる道具になった。
最初の 1 本は image-to-video の無料プレビュー で十分。思い出の 1 枚でも、商品写真でも、まず 4 秒動かしてみるところから始めるのがいい。
AI Pin Maker の image-to-video エンジンは、enamel pin の mockup を動画化する用途にも使える。物販の人にとっても応用範囲が広い。
参考:本記事のデータポイントは Semrush JP の月間検索 1,000 / KD 28 / CPC 約 65円 / 広告 6 件、ツール実測は 2026 年 4 月から 6 月の間に同一 selfie 入力で実施。
この記事の作り方:AI 支援によるドラフト、AI Pin Maker 編集チームが事実確認と編集を担当。ai-image-research-editor によるレビュー済み。
AI Pin Maker のその他のツール