menu-logo
  • icon
    ホーム
  • icon
    記事
  • icon
    AIツール
  • icon
    eラーニング
  • icon
    AIエージェント
  • icon
    プロンプト
  • icon
    AI-OJT
v2.9.0
アカウント
menu-logo
ログイン
会員登録
  • ホーム
  • 記事
  • AI動画生成革命 1枚の画像で一貫したキャラクター表現

AI動画生成革命 1枚の画像で一貫したキャラクター表現

AI動画生成革命 1枚の画像で一貫したキャラクター表現
2025年06月20日 13:312024年09月27日 21:52
広報・マーケ / デザイナー
レベル★
AIニュース​
コンピュータビジョン
IT利活用
ソリューション企画
プロモーション計画

2024年9月11日、中国発の動画生成AI「Vidu(ビドゥ)」に、画期的な新機能「Reference to Video」が登場しました。

この機能により、たった1枚の参照画像で一貫したキャラクターの動画生成が可能になり、AI動画制作の世界に革命をもたらしています。

 

AROUSAL Techの代表を務めている佐藤(@ai_satotaku)です。

最近はもっぱら映像系の生成AIが熱いですね!

これまでも動画生成AIは紹介してきましたし、どんどん新しいサービスや新しい機能の実装などが行われ、クオリティも日に日に増しています。

そんな中でも画像や動画の生成は、どうしてもランダム性が出てしまい、一貫したキャラクターを生成し続けることは難しく、技術と根気が必要でした。

しかし!1枚の参照画像で一貫したキャラクターの動画生成が可能になったというわけです。

これはとても革新的です!

どんなことができるのか、ぜひ見ていってください。

感想をX(旧Twitter)でポストしていただけると嬉しいです。メンションも大歓迎です!

 

AI動画生成の新時代 Viduの「Reference to Video」機能

Viduの新機能「Reference to Video」は、AI動画生成の分野に大きな変革をもたらしています。

従来のImage to Video技術では、キャラクターの一貫性を保つためにLoRA(Low-Rank Adaptation)やDreamBoothなどのファインチューニングが必要でした。

しかし、この新機能により、たった1枚の参照画像でキャラクターの一貫性を維持した動画生成が可能になりました。

これは、Runway Gen-3 Alpha、Luma Dream Machine、KLINGなどの他の主要な動画生成AIサービスと比較しても、画期的な進歩と言えます。

特に、元画像が1枚しかない場合の動画生成において、Viduの新機能は大きなアドバンテージを持っています。

 

歴史上の人物も動く 坂本龍馬の例

「Reference to Video」機能の威力を示す好例として、坂本龍馬の動画生成が挙げられます。

唯一現存する坂本龍馬の写真をPhotoshopでカラー化し、それを参照画像として使用することで、驚くほど自然な動きの坂本龍馬を生成することができました。

具体的には、「ニューヨークのダウンタウンを侍が歩いている」というプロンプトで動画を生成したところ、坂本龍馬がニューヨークの街を歩く姿が自然に表現されました。

さらに、同じ参照画像を使用して戦闘シーンも生成可能であり、多様なシチュエーションでキャラクターの一貫性を保つことができます。

 

ペットも動く 思い出の猫の例

「Reference to Video」機能は人物だけでなく、動物にも適用可能です。

例えば、20歳まで生きた家猫「めそ」の写真を使用して、池のそばを歩く動画を生成することができました。これにより、外出の経験がなかった家猫の新しい姿を創造することが可能になりました。

この機能は、特定の時期の姿を動画化する際にも有効です。従来のLoRAを使用した方法では中間的な顔になりがちでしたが、「Reference to Video」では元の画像の個性をより強く反映させることができます。

 

AI動画生成の新たな可能性

Viduの新機能は、ストーリー性のある動画制作のハードルを大幅に下げました。

これまでLoRAを多用する必要があった一貫したキャラクター表現が、1枚の参照画像だけで可能になったのです。

動画の長さは4秒と8秒から選択でき、品質は速度優先と品質優先のオプションがあります。

8秒の高品質動画を生成するには16クレジットが必要で、さらにウォーターマークを外すには追加で8クレジットが必要となります。

 

課題と展望 AI動画生成の未来

Viduの「Reference to Video」機能は画期的ですが、課題もあります。

高品質な動画生成にはかなりのクレジットが必要で、コストが高くなる可能性があります。また、著作権や肖像権の問題も考慮する必要があります。

しかし、この技術の進歩は、映像制作やエンターテインメント業界に大きな影響を与える可能性があります。

個人クリエイターからプロの制作者まで、幅広いユーザーがより簡単に高品質な動画コンテンツを作成できるようになるでしょう。

今後は、生成される動画の品質向上や、より長時間の動画生成、さらには複数のキャラクターの同時制御など、さらなる進化が期待されます。

まとめ

Viduの「Reference to Video」機能は、AI動画生成の新時代を切り開きました。1枚の参照画像だけで一貫したキャラクター表現が可能になり、創造の可能性が大きく広がりました。

コストや著作権の課題はありますが、この技術は映像制作の未来を変える可能性を秘めています。

AI技術の進化とともに、私たちの創造力の限界も押し広げられていくことでしょう。

引用元

テクノエッジ 「一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox)」

AIツール

eラーニング

生成AIとは

生成AIとは

レッスン

関連記事

記事ランキング

AIツールランキング

AIツール

thumbnail
icon

Gemini

1. 製品/サービス概要目的テキスト、画像、音声、動画を統合的に理解・生成し、複雑なタスクを効率的に処理するターゲットユーザー個人ユーザーから大企業まで、AI による業務効率化や創造的タスクの支援を求めるすべての人々 2. 特徴マルチモーダル処理:テキスト、画像、音声、動画を同時に理解・処理できる高度な推論能力:複雑な問題解決や創造的タスクに対応Google 検索との連携:最新の情報を活用した回答が可能多言語対応:世界中のユーザーに対応可能コード生成と解析:プログラミング支援機能を搭載Google Workspace との統合:既存の Google サービスとシームレスに連携カスタマイズ可能:企業や個人のニーズに合わせて調整可能 3. 機能詳細テキスト生成機能名:高品質テキスト生成使用例:ブログ記事、レポート、メール文章の作成利便性:時間短縮と品質向上を同時に実現画像理解と生成機能名:ビジュアル AI使用例:商品画像の分析、デザイン案の生成利便性:ビジュアルコンテンツの作成・分析を効率化音声認識と生成機能名:音声インターフェース使用例:会議の議事録作成、音声コマンドによる操作利便性:ハンズフリーでの作業が可能に動画分析機能名:ビデオインテリジェンス使用例:動画コンテンツの自動要約、シーン分析利便性:大量の動画データから素早く情報を抽出コード生成と最適化機能名:AI プログラミングアシスタント使用例:新機能の実装、既存コードの最適化利便性:開発速度の向上とコード品質の改善データ分析と可視化機能名:インテリジェントアナリティクス使用例:複雑なデータセットの分析、インサイトの抽出利便性:データドリブンな意思決定をサポート翻訳と多言語対応機能名:AI 翻訳エンジン使用例:多言語ドキュメントの作成、リアルタイム通訳利便性:グローバルコミュニケーションを円滑化タスク自動化機能名:ワークフローオートメーション使用例:定型業務の自動化、スケジュール管理利便性:人間の創造的業務にフォーカスできる時間を創出セキュリティと倫理的 AI機能名:トラステッド AI使用例:データ保護、バイアス検出と軽減利便性:安全で公平な AI 利用を実現カスタマイズと拡張性機能名:AI プラットフォーム使用例:業界特化型 AI モデルの開発、既存システムとの統合利便性:ビジネスニーズに合わせた柔軟な AI ソリューションを構築 4. 導入事例1年で投資額の3倍以上の効果を実現|グローバル製造業A社課題多言語対応に多大な時間とコストがかかっていた製品設計プロセスが遅く、市場投入に時間がかかっていた成果Gemini の多言語機能により、翻訳コストを 60% 削減AI 支援による設計最適化で製品開発サイクルを 30% 短縮導入ステップニーズ分析:現状の課題を特定し、Gemini の適用領域を決定パイロット導入:小規模チームで試験的に導入し、効果を検証カスタマイズ:企業特有のニーズに合わせて AI モデルを調整全社展開:段階的に全部門へ展開し、利用をサポート継続的改善:フィードバックを基に機能を最適化し、新たな活用法を探求 5. 料金プランプラン名料金(月額)主な特徴Free無料GoogleAIStudioでも利用可能Advanced¥2,900初月無料Pro$19.99初月無料Ultra$249.993ヶ月間限定で$124.99にて提供2025年5月21日調べ上記料金は月間契約の月額費です。参考:https://one.google.com/u/1/explore-plan/gemini-advanced?utm_source=gemini&utm_medium=web&utm_campaign=sidenav_evo&g1_landing_page=65プランによって料金が異なります。追加サービスとオプションAPI 利用料:従量制、月額¥10,000 からカスタム機能開発:要相談優先サポート:月額¥50,000 から Geminiを使ってみる>>

共通
thumbnail
icon

Midjourney

1. 製品/サービス概要目的テキストプロンプトから高品質な画像を生成し、クリエイティブな表現や視覚的コンテンツ制作を革新するターゲットユーザーアーティストデザイナーマーケターコンテンツクリエイター広告代理店出版社 2. 特徴高品質な画像生成:驚くほど詳細で芸術的な画像を数秒で生成多様なスタイル対応:写実的なものから抽象的なものまで、幅広い表現が可能直感的なテキストプロンプト:複雑な技術知識不要で、言葉だけで画像を描写迅速な生成速度:数十秒で複数の画像バリエーションを提供商用利用可能:生成された画像は適切なプランで商用利用が可能コミュニティ駆動型開発:ユーザーフィードバックを積極的に取り入れた継続的な改善 3. 機能詳細テキストからの画像生成機能名:Text-to-Image Generation詳細説明:自然言語のプロンプトから、AIが解釈して画像を生成使用例:「夕暮れの東京スカイライン」と入力し、美しい都市風景を生成利便性:コンセプト段階からビジュアル化が可能、アイデア出しを加速スタイル調整機能名:Style Customization詳細説明:特定のアーティストやアートスタイルを指定して画像を生成使用例:「ゴッホ風の星空の下の田園風景」でユニークな絵画風の画像を作成利便性:ブランドの視覚的アイデンティティに合わせたコンテンツ制作が可能画像変更・編集機能名:Image Variation詳細説明:生成された画像をベースに微調整や大幅な変更を加える使用例:生成された風景画の季節を夏から冬に変更利便性:一度生成した画像を元に、効率的に多様なバリエーションを作成高解像度アップスケール機能名:High-Resolution Upscaling詳細説明:生成された画像を高解像度にスケールアップ使用例:ウェブサイト用のバナー画像を印刷用の高解像度版に変換利便性:様々な用途に対応できる柔軟性を提供プロンプトエンジニアリング機能名:Prompt Engineering詳細説明:効果的なプロンプト作成のためのガイドラインとテクニック使用例:「--ar 16:9」を追加してワイドスクリーン比率の画像を生成利便性:より精密で意図に沿った画像生成が可能バッチ処理機能名:Batch Processing詳細説明:複数の画像を一度に生成する機能使用例:同じプロンプトで4つの異なるバリエーションを同時に生成利便性:効率的なコンテンツ制作ワークフローを実現コミュニティギャラリー機能名:Community Gallery詳細説明:ユーザーが生成した画像を共有・閲覧できるプラットフォーム使用例:他のユーザーの作品からインスピレーションを得る利便性:クリエイティブコミュニティとの交流や学習機会を提供 4. 導入事例Midjourneyを使用してクライアントのブランドキャンペーンビジュアルを制作|広告代理店X成果制作時間を70%削減し、クリエイティブバリエーションが3倍に増加クライアントの満足度が大幅に向上し、キャンペーンのエンゲージメント率が25%上昇導入ステップDiscordアカウントの作成Midjourneyサーバーへの参加プランの選択と支払いチュートリアルの完了プロジェクトでの実践利用開始 5. 料金プランプラン名料金(月額)主な特徴推奨ユーザーBasic$10月200枚の高速画像生成基本機能のみ個人クリエイター小規模プロジェクトStandard$30 月900枚の高速画像生成リラックスモード無制限フリーランス中小企業Pro$60 月1,800枚の高速画像生成ステルスモード優先処理プロフェッショナル中規模企業Mega$120 月3,600枚の高速画像生成全機能利用可能大規模プロジェクト大企業2025年5月20日調べ上記料金は月間契約の月額費です。参考:https://www.midjourney.com/account年間契約だと、各月の料金が20%OFFされます。追加サービスとオプションFast GPUの追加購入:$4/時間企業向けカスタムプラン:要問い合わせプライオリティサポート:Pro・Megaプランに含まれるMidjourneyを使ってみる>>

広報・マーケ
デザイナー

eラーニング

H5P

H5PはHTML5 Packageの省略形です - プレゼンテーション、ビデオ、他のマルチメディア、問題、小テスト、ゲーム等のインタラクティブコンテンツです。H5P活動ではコースにH5Pをアップロードおよび追加できます。

すべての問題受験は自動的に評定されます。また、評定は評定表に記録されます。

詳細情報

mod_h5pactivity

IMSコンテンツパッケージ

IMSコンテンツパッケージは異なるシステム内で再利用できるよう同意された標準に基づきパッケージされた一連のファイルです。IMSコンテンツパッケージモジュールではZIP圧縮されたコンテンツパッケージをアップロードした後、リソースとしてコースに追加することができます。

通常、コンテンツはページ間のナビゲーションと共にそれぞれのページに表示されます。コンテンツをナビゲーションメニューまたはボタン等と共にポップアップウィンドウ上に表示するための様々なオプションがあります。

IMSコンテンツパッケージはマルチメディアコンテンツおよびアニメーションの表示に使用することができます。

詳細情報

mod_imscp

SCORMパッケージ

SCORMパッケージは同意された標準に基づきパッケージされた一連のファイルです。SCORM活動モジュールではSCORMおよびAICCパッケージをZIPファイルとしてをアップロードした後、コースに追加することができます。

通常、コンテンツはページ間のナビゲーションと共にそれぞれのページに表示されます。コンテンツを目次およびナビゲーションボタン等と共にポップアップウィンドウ上に表示するための様々なオプションがあります。通常、SCORM活動には問題を含み評点は評定表に記録されます。

SCORM活動は以下のように使用することができます:

  • マルチメディアコンテンツおよびアニメーションの表示のため
  • 評価ツールとして
詳細情報

mod_scorm

記事ランキング

thumbnail

離職率30%減の実績 AIオンボーディングで辞めない・成長する組織へ

2025/03/22

人事
総務・事務

レベル

★
thumbnail

AIが旅のしおりをつくってくれる!? GWを“賢く楽しむ”AI旅行計画術

2025/04/26

共通

レベル

★
thumbnail

アニメ作りが加速する。動画生成AI「Wan 2.1」が衝撃的

2025/04/05

広報・マーケ
デザイナー

レベル

★

AIツールランキング

thumbnail
icon

Suno AI

1. 製品/サービス概要目的テキストから高品質な音楽と歌声を自動生成し、音楽制作の民主化を実現するターゲットユーザー音楽クリエイターコンテンツ制作者マーケティング担当者個人ユーザー 2. 特徴テキストベースの音楽生成:簡単な文章入力だけで、完全なオリジナル楽曲を作成高品質な音声合成:プロ級のボーカルと楽器演奏を自動生成多様なジャンルとスタイル:ポップス、ロック、クラシックなど、幅広い音楽ジャンルに対応カスタマイズ可能:楽曲の長さ、テンポ、楽器構成などを細かく調整可能リアルタイム編集:生成された音楽をその場で編集し、即座に反映コラボレーション機能:チームでの共同制作や楽曲の共有が容易商用利用ライセンス:有料プランで商用利用が可能 3. 機能詳細AI作曲機能名:インテリジェント作曲エンジン詳細説明:テキストプロンプトから楽曲の構造、メロディ、ハーモニーを自動生成使用例:マーケティングキャンペーン用のジングル作成利便性:専門知識不要で短時間に高品質な楽曲を制作可能AI歌声合成機能名:ボーカルシンセサイザー詳細説明:自然で表現豊かな歌声を生成し、歌詞に合わせて自動調整使用例:ポッドキャストのオープニングテーマ制作利便性:ボーカリスト不要で、多様な声質やスタイルの歌声を即座に生成マルチトラック編集機能名:トラックマスター詳細説明:各楽器パートを個別に編集し、ミックスを調整可能使用例:生成された楽曲のギターソロを強調利便性:プロ級の音楽制作ソフトのような詳細な編集が可能スタイル転送機能名:ジャンルシフター詳細説明:既存の楽曲を別のジャンルやスタイルに自動変換使用例:クラシック曲をジャズアレンジにリメイク利便性:一つの楽曲から多様なバリエーションを簡単に作成歌詞生成機能名:リリックジェネレーター詳細説明:テーマやキーワードから歌詞を自動生成使用例:ブランドの価値観を表現する歌詞の作成利便性:ライターズブロックを解消し、創造的なアイデアを提供音楽理論アシスタント機能名:ハーモニーヘルパー詳細説明:コード進行や音階の提案、理論的な説明を提供使用例:初心者が適切なコード進行を学習利便性:音楽理論の知識を深めながら、質の高い楽曲制作が可能エクスポート機能機能名:フォーマットコンバーター詳細説明:生成された楽曲を様々な形式でエクスポート使用例:SNS投稿用に最適化された短尺動画の作成利便性:異なるプラットフォームや用途に合わせて柔軟に出力可能 4. 導入事例導入6ヶ月で投資額の5倍以上のコスト削減と新規案件獲得を実現|デジタルマーケティングエージェンシーA社課題クライアント向けの音楽制作に多額の予算と時間を費やしていた楽曲のカスタマイズに時間がかかり、クライアントの要望に迅速に対応できなかった成果Suno AIの導入により、音楽制作コストを70%削減クライアントの要望に応じた楽曲を数分で生成し、修正サイクルを大幅に短縮クリエイティブの幅が広がり、クライアント満足度が30%向上導入ステップアカウント作成:Suno AIの公式サイトでアカウントを登録プラン選択:利用目的に合わせて適切なプランを選択チュートリアル:基本的な使い方をガイド付きで学習初回プロジェクト:サンプルプロジェクトで実際に楽曲を生成カスタマイズと展開:生成された楽曲を編集し、実際のプロジェクトに活用 5. 料金プランプラン名料金(月額)主な特徴推奨ユーザーベーシック$0 1日10曲まで生成可能基本編集機能個人ユーザー学生プロ$10 月500曲生成可能高度な編集機能商用利用可フリーランス中小企業プレミアム$30 月2000曲生成可能全機能利用可優先サポート大企業プロダクションハウス2025年5月19日調べ上記料金は月間契約の月額費です。参考:https://suno.com/account年間契約だと、各月の料金が20%OFFされます。追加サービスとオプションAPI利用:カスタム価格設定(利用量に応じて)エンタープライズソリューション:要相談トレーニングワークショップ:1セッション$500からSuno AIを使ってみる>>

広報・マーケ
CS (カスタマーサポート)
thumbnail
icon

AivisSpeech

1. 製品/サービス概要目的AivisSpeechは、任意の音声を感情豊かに表現し、高精度でテキスト化することで、情報共有やコンテンツ制作を支援します。ターゲットユーザー動画制作やボイスドラマ制作を行うクリエイタービジネスプレゼンテーションや会議の効率化を目指す企業教育・研修用の音声資料を作成する教育機関や講師2. 特徴高精度な訳出技術:AIエンジンを搭載したモデルにより、音声の訳出における高精度を実現。複数言語の対応性:英語や日本語はもちろん、その他の言語にも対応。リアルタイムのテキスト化機能:訳出結果をリアルタイムで一瞬で可視化。シェアリング機能:結果を簡単に共有できるため、チーム作業が効率化。3. 機能詳細感情豊かな音声合成詳細説明:人間の声のように自然で感情豊かな音声を生成。使用例:ボイスドラマや動画ナレーションの作成。利便性:魅力的なコンテンツを迅速に制作可能。リアルタイム音声テキスト化詳細説明:音声を瞬時に文字データに変換。使用例:会議やインタビューの記録。利便性:効率的な情報整理が可能。カスタマイズ可能な話者スタイル詳細説明:音声のテンポや音量を細かく調整可能。使用例:キャラクターごとの表現を追加したボイスコンテンツ。利便性:多様な表現力でリスナーを引き込む。高互換性と簡単操作詳細説明:VOICEVOXやYMM4との互換性でスムーズに導入可能。使用例:動画編集ソフトと連携しての音声生成。利便性:既存のワークフローを簡単に強化。4. 導入事例動画コンテンツ制作におけるクリエイターの活用例課題 ナレーション制作に時間とコストがかかる複数の話者が必要なプロジェクトでの対応が困難成果 作業時間を50%短縮低コストで複数話者のナレーションを実現導入ステップスクリプトをAivisSpeechにアップロード話者スタイルを選択して音声を生成動画編集ソフトにインポートしてナレーションを完成5. 料金プラン無料でダウンロード可能。全ての基本機能を無料で利用可能。個人・法人・商用問わず適用。追加サービスとオプション音声合成モデル制作代行サービス:まるなげボイス(α) by Aivis Project にて、専用に録音されていない音声データからでも高品質な音声合成モデルを制作。詳細はAivis Projectの「お問い合わせフォーム」をご利用ください。AivisSpeechを使ってみる>>

広報・マーケ
thumbnail
icon

3秒敬語

1. 3秒敬語の製品/サービス概要目的:日常的なカジュアルな日本語を、ビジネスやフォーマルな場で適切な敬語表現に迅速かつ正確に変換すること。ターゲットユーザー:新社会人や学生ビジネスパーソン接客業従事者日本語学習者2. 3秒敬語の特徴3秒で変換:名前の通り、3秒程度で自然な敬語へ変換。ユーザー登録不要:ログインやアカウント作成は不要。平文とメールの2モード:チャット用とメール用で切り替え可能。マルチデバイス対応:ブラウザ・iPhone・Chrome拡張に対応。完全無料で安心:機能制限や有料化の心配が不要。3. 3秒敬語の機能詳細平文モード詳細説明:日常的なフランクな文章を、丁寧語・尊敬語・謙譲語を用いた敬語に変換。使用例:「今度の会議、出れる?」→「次回の会議にご出席いただけますか?」利便性:チャットや会話文をそのまま上司向けなどに変換できる。メールモード詳細説明:入力文を定型文付きのビジネスメール風に整形。使用例:「資料送るね」→「お世話になっております。資料をお送りいたします。」利便性:メールの敬語や文体に迷う時間を削減できる。Chrome拡張機能詳細説明:Webページ上のテキストを右クリックで敬語変換可能。使用例:求人記事の紹介文やSNS投稿を丁寧な表現に即時変換。利便性:ブラウザベースの業務に便利。iPhoneアプリ詳細説明:キーボードとして使用でき、どのアプリでも敬語変換可能。使用例:LINEやメール、Slackなどの文中で即敬語化。利便性:モバイル業務や日常連絡でもスムーズな表現を実現。4. 3秒敬語の導入事例ケース:新入社員の敬語メール支援に活用課題メール文面の敬語がわからず、上司確認に時間を要していた。成果自動変換により、初稿作成時間が大幅短縮。チーム内で敬語の統一感も向上。導入ステップWebサイトにアクセス(またはChrome/iPhoneアプリ導入)「平文モード」または「メールモード」を選択カジュアルな文章を入力出力された敬語文をコピペするだけ5. 3秒敬語の料金プランプラン名料金(月額)主な特徴推奨ユーザー無料プラン¥0すべての機能が無料で利用可能。登録・ログイン不要。ただし会員登録・ログインで敬語や返信の精度が大幅向上。1日10回以上の利用にはログインが必要。全ユーザー(学生〜ビジネスパーソン)3秒敬語を使ってみる

共通
WA²とはプライバシーポリシー利用規約運営会社
WA²とはプライバシーポリシー利用規約運営会社
navホームnav記事navAIツールnaveラーニング