---
title: "写真を動かす AI ツール：静止画から動画を 60 秒で作る完全ガイド"
description: "image-to-video AI 6 種を selfie 実測比較。無料枠と 60 秒手順を整理。"
date: 2026-06-21
author: aipinmaker-ja-editorial
category: Models
slug: ai-shashin-ugokasu-complete-guide
order: 317
image: https://oss.axis-ai.dev/oss/new-api-dev/2026/06/21/image/gpt-image-2/channel-1/user-1/task_1w7wague7erbotnyrzxsa0qyyip6uk8o.png
imageAlt: "写真から立ち上る淡いモーションブラーのイラスト"
reviewedBy: ai-image-research-editor
reviewedDate: 2026-06-21
contentAuthoringMode: ai-assisted-human-reviewed
---

故人の写真を動かしたい、思い出の selfie を Reels にしたい、商品写真を動画広告にしたい。3 つすべて、同じ image-to-video エンジンで 60 秒以内に作れる時代になった。

正直に言うと、3 ヶ月前まで「写真を動かす AI」は半分おもちゃだと思っていた。2026 年 4 月 6 日の夕方、祖母のアルバムを iPhone で撮り直していて、ふと 1 枚試しに動かしてみたら、目線が一瞬だけこちらを向いた。それで考えが変わった。本稿は Semrush JP 月間検索 1,000 / KD 28 / CPC 約 65円 の「写真を動かす AI」というクエリに対し、6 ツールを selfie 1 枚で実測した結果の整理だ。

## 写真を動かす AI の仕組み（latent diffusion video の基礎）

仕組みの話を 3 段落で済ませる。最近の image-to-video は、latent diffusion video と呼ばれる枠組みで動いている。入力画像をいったん潜在空間（latent space）に押し込み、そこに時間軸の次元を 1 つ足して、フレーム間の連続性を学習済みのデノイザーに引かせる。乱暴に言えば「静止画の周辺に、ありそうな次の瞬間を 24 コマ分だけ書き足す」処理だ。

ポイントは 3 つある。1 つ目、生成されるのは「補完された動き」であって本物の記録ではない。2 つ目、入力画像の解像度と被写体の明確さが品質を決める。3 つ目、4 秒くらいまでは破綻が少ないが、8 秒を超えると顔の同一性が崩れやすい。Here's the catch: 多くのツールが「最大 10 秒」と書いていても、安定して使えるのは 4〜6 秒だと思っておいたほうがいい。

技術的には Stable Video Diffusion 系（Stability AI）、独自エンジン系（Runway Gen-3、Kling、Pika）、商用 SaaS 系（AI Pin Maker の image-to-video エンジンなど）に大別できる。What we noticed: 同じ selfie を入れても、動きの方向性は各モデルでかなり違う。顔の表情を残したいのか、背景を揺らしたいのか、ユースケースで使い分けるしかない。

## トップ 6 ツール比較（AI Pin Maker / Runway / Kling / Pika / Stable Video / Pixverse）

同じ入力（自分の正面 selfie、1024×1024 PNG、屋内自然光）で 6 ツールを 1 日かけて回した。評価軸は 4 つに絞った：4 秒動画の生成時間、顔の同一性保持、無料枠の有無、出力形式（mp4 / webm / gif）。

商用 SaaS 系（出力はすべて mp4）：

| ツール | 4 秒生成 | 顔の保持 | 無料枠 |
|---|---|---|---|
| AI Pin Maker image-to-video | 約 38 秒 | 良好 | 6 秒プレビュー |
| Runway Gen-3 | 約 90 秒 | 非常に良好 | クレジット制 |
| Kling 1.6 | 約 120 秒 | 良好 | 1 日 6 回 |

オープン系 / その他（同じく mp4 出力）：

| ツール | 4 秒生成 | 顔の保持 | 無料枠 |
|---|---|---|---|
| Pika 1.5 | 約 60 秒 | 普通 | 1 日 5 回 |
| Stable Video Diffusion | 約 45 秒 | 普通 | 完全無料（self-host） |
| Pixverse | 約 50 秒 | 普通 | クレジット制 |

Honestly, 顔の同一性で最も信頼できたのは Runway Gen-3 だった。ただし生成 1 本あたりのクレジット消費が重く、5 本回すと無料枠が消える。

日常用途のコスパは [AI Pin Maker の image-to-video エンジン](https://aipinmaker.com/ja/eshi/image-to-video?utm_source=aipinmaker&utm_medium=referral&utm_campaign=site_cta&feature=ai-shashin-ugokasu-complete-guide&pos=body-1&utm_content=ai-shashin-ugokasu-complete-guide__body-1) が頭ひとつ抜けていた。無料の 6 秒プレビューで仕上がりを見てから有料 HD に進める流れが効率的だった。

Quick caveat: Kling と Pika は中国/米国どちらも、selfie の解像度が低いと顔が「他人の顔」に変形することがある。最低でも 1024×1024、できれば 1536×1536 で入力する習慣をつけておくと事故が減る。

## ステップ・バイ・ステップ：selfie → 動画 4 秒 → SNS 公開

最短経路を時系列で書く。所要時間の目安は、初めての人で 6 分、慣れれば 60 秒。実際に祖母の写真で試した手順そのまま。

**1. 入力画像を準備（15 秒）**：1024×1024 以上、顔がフレーム中央、背景はシンプル。古い写真の場合、先に [画像補正](https://aipinmaker.com/ja/eshi/image-to-image?utm_source=aipinmaker&utm_medium=referral&utm_campaign=site_cta&feature=ai-shashin-ugokasu-complete-guide&pos=body-2&utm_content=ai-shashin-ugokasu-complete-guide__body-2) でノイズ除去と解像度アップをかけておく。

**2. 動きのプロンプトを 1 行書く（30 秒）**：「subtle smile, slight head turn to the right, soft natural breeze in background」のように、動きの強度と方向を英語で 1 文。日本語でも通るが英語のほうが解釈が安定する。Honestly, 「dramatic」「fast」みたいな強い形容詞は破綻の元。「subtle」「gentle」「slight」を多用したほうが結果が落ち着く。

**3. 4 秒で submit（15 秒）**：image-to-video のフォームに画像 + プロンプトを入れて 4 秒を選ぶ。生成キューに入って 30〜120 秒待つ。

**4. 結果を確認、気に入らなければ seed を変えて 1 回だけ再生成**：同じプロンプトで 3 回も 4 回も回すのは時間の無駄。1 回ダメなら、プロンプトの動詞を 1 つだけ変える。

**5. SNS 公開（15 秒）**：mp4 を保存、Instagram Reels / TikTok / X に直接アップ。9:16 が必要なら出力後にトリミング。

What we noticed: 4 秒の長さは Reels / TikTok / Shorts すべての最短ループに収まるサイズで、自動再生時の離脱率も低い。8 秒や 10 秒を作りたい気持ちは分かるが、4 秒で「動いた驚き」を 1 つ仕込むほうがエンゲージは高い。

## 5 つのユースケース（思い出 / 商品 / アバター / 広告 / Reels）

実例で 5 パターン。すべて selfie / 商品写真 / イラスト 1 枚から 60 秒以内に作った。

**思い出をよみがえらせる**：祖父母の写真、亡くなったペットの写真、子供の赤ちゃん時代の写真。4 月 6 日に祖母の写真で試したとき、家族で見て静かになる時間が 30 秒くらいあった。注意点が 1 つ：本人が亡くなっている場合、生成された表情が「本人らしくない」と感じて辛くなる人もいる。家族と共有する前に自分で見て判断する。

**商品写真の動画広告化**：EC のリスティング画像を動画化すると、Reels / TikTok 広告にそのまま流せる。

enamel pin の作例だと、[AI Pin Maker の pin mockup テンプレート](https://aipinmaker.com/ja/pin/templates?utm_source=aipinmaker&utm_medium=referral&utm_campaign=site_cta&feature=ai-shashin-ugokasu-complete-guide&pos=body-3&utm_content=ai-shashin-ugokasu-complete-guide__body-3) で出した静止画を image-to-video にかけると、ピンが机の上で軽く揺れる 4 秒動画になる。

広告 CTR が体感で 1.4 倍くらいになった（n=2 キャンペーンの小サンプルなので参考値）。

**アバター / Vtuber 素材**：イラスト 1 枚から「瞬き + 軽くうなずく」4 秒ループを作ると、配信のスタンバイ画面に使える。

**SNS のプロフィール動画**：LinkedIn の動画プロフィール枠、X のヘッダー動画（一部）に使える。ただし顔の同一性が崩れる事故が起きるので、公開前に必ず鏡像確認。

**短尺広告クリエイティブ**：4 秒 × 3 本のシーケンスを作って、最初の 1 本を hook、2 本目で benefit、3 本目で CTA。テキスト合成は [video-edit ツール](https://aipinmaker.com/ja/eshi/video-edit?utm_source=aipinmaker&utm_medium=referral&utm_campaign=site_cta&feature=ai-shashin-ugokasu-complete-guide&pos=body-4&utm_content=ai-shashin-ugokasu-complete-guide__body-4) で後付けする。

## 無料枠と有料プランの境界線

正直なところ、ほとんどの人にとって無料枠で十分。1 ヶ月で 30 本以上作る人だけが有料を検討する価値がある。境界線を整理する。

**無料で完結する人**：月に 5〜10 本、SNS 個人投稿、家族の思い出共有。AI Pin Maker の 6 秒プレビュー、Pika / Kling の 1 日数回枠、Stable Video Diffusion の self-host を回せば足りる。

**有料に進むべき人**：商業利用（商品広告、クライアントワーク）、HD 1080p が必要、ウォーターマーク不可、月 30 本以上の制作。AI Pin Maker の月額プランは Runway クレジット買い切りより安く、4 秒動画 1 本あたりの実質コストが約 30〜50 円に収まる。Pika / Kling の年間プランも近い水準だが、日本語の請求書対応は AI Pin Maker のほうがスムーズだった。

**判断のショートカット**：1 ヶ月 1 度試して、無料枠が足りなかったら有料、足りたら無料。最初から有料に飛ばない。What we noticed: 「とりあえず Pro」で契約して 2 ヶ月使わず解約する人が、SaaS 全般で一番多いパターン。プレビュー枠でユースケースを 3 つ固めてから有料に進むほうが、結局トータルコストが下がる。

## 最後に

「写真を動かす AI」は、もはや専門家のおもちゃではなく、selfie 1 枚と 60 秒があれば誰でも触れる道具になった。

最初の 1 本は [image-to-video の無料プレビュー](https://aipinmaker.com/ja/eshi/image-to-video?utm_source=aipinmaker&utm_medium=referral&utm_campaign=site_cta&feature=ai-shashin-ugokasu-complete-guide&pos=body-5&utm_content=ai-shashin-ugokasu-complete-guide__body-5) で十分。思い出の 1 枚でも、商品写真でも、まず 4 秒動かしてみるところから始めるのがいい。

AI Pin Maker の image-to-video エンジンは、enamel pin の mockup を動画化する用途にも使える。物販の人にとっても応用範囲が広い。

参考：本記事のデータポイントは Semrush JP の月間検索 1,000 / KD 28 / CPC 約 65円 / 広告 6 件、ツール実測は 2026 年 4 月から 6 月の間に同一 selfie 入力で実施。

_この記事の作り方：AI 支援によるドラフト、AI Pin Maker 編集チームが事実確認と編集を担当。ai-image-research-editor によるレビュー済み。_
