中国のByteDanceが2026年6月23日、北京で開いたクラウド部門Volcano EngineのカンファレンスFORCEで、フラッグシップの動画生成モデル「Seedance 2.5」を発表しました。
現在はグローバル企業向けのベータ段階で、正式提供は7月上旬を予定しています。前世代のSeedance 2.0が登場したのが2026年2月ですから、わずか数か月での更新ですが、中身は小幅な改良ではありません。
一回の生成で最長30秒、ネイティブ4K、そして参照素材を最大50ファイルまで。この三つが、これまで「動くGIF」の域を出にくかったAI動画を、現場で使える映像へと押し上げています。
最長30秒を「ひとつなぎ」で——つなぎ目のない生成へ
これまでAI動画の最大の壁は、時間の長さでした。多くのツールは破綻を避けるために5〜15秒程度で生成を区切り、長いシーンは短いクリップをつなぎ合わせて作るのが前提でした。
このつなぎ目こそ、プロの制作で大きな摩擦になっていた部分です。Seedance 2.5は、ひとつのプロンプトと一度の生成で最長30秒を直接出力します。
15秒から30秒へというのは、単に倍になったという話ではありません。15秒では一瞬の動きや短いハイライトしか入りませんが、30秒あれば、状況の設定、動きの展開、カメラの追従、そして余韻まで、映画的な一カットの流れをまるごと組み立てられます。
シーンを途中で断ち切らずに着地させられる。これがAI動画を、実用的な映像ショットの生成器へと変える決め手になっています。
ネイティブ4Kで、微細な物理表現まで精緻に
解像度も、ネイティブ4Kに対応しました。あわせて、従来のSeedance 2.0にも4K対応の更新が入っています。これは単にピクセルが増えたという以上の意味を持ちます。
たとえば動物の毛並みの動き、花が開くマクロのタイムラプス、溶けたガラスや煙のような流体の表現、鳥が羽ばたくときの空気の流れまで、細かな物理のシミュレーションが格段に精緻になりました。
輪郭はくっきりとし、質感のディテールも保たれます。映画制作で使う大型LEDスクリーンへの投影や、高解像度の合成作業といった、現場の厳しい要求にも耐える水準です。
参照ファイル最大50で、「ガチャ」から「設計」へ
そして、プロの作り手にとって最も大きい変化が、参照素材の上限です。Seedance 2.0では最大12個だった参照ファイルが、2.5では最大50ファイルまで一気に増えました。
画像や動画クリップ、音声に加えて、構図やライティングを指示する3Dのホワイトモデル、特定の画風を決めるスタイル参照まで、あらゆる種類のデータを同時に読み込ませられます。これは生成の性質そのものを変えます。
テキストのプロンプトだけに頼る生成は、モデルの解釈に結果を委ねる「ガチャ」に近い、確率的なプロセスでした。そこに50もの参照を与えて強く方向づければ、渡した設定資料に忠実に映像化する、より決定論的なレンダリングへと近づきます。
複数回の生成をまたいでも同じ人物や同じ製品の見た目を保てるようになり、全体のスタイルを崩さずに一部分だけを差し替える、といった細かな制御も効くようになりました。
同時発表のDoubao 2.1 Pro——フルスタック化するByteDance
今回の発表は、Seedance 2.5単体の話にとどまりません。ByteDanceはクラウド市場で全方位の布陣を敷いています。同じカンファレンスでは、大規模言語モデルの最新版「Doubao 2.1 Pro」も披露されました。
ByteDanceは、コーディング、エージェント能力、視覚と言語の理解という三つの軸で大きく前進したとし、複数のベンチマークでAnthropicのClaude Opus 4.6を上回ると主張しています。
ただし、これは同社自身の主張で、独立した検証はまだ済んでいません。価格は破壊的で、入力100万トークンあたり6元、出力30元、キャッシュが効けば入力は1.2元まで下がります。Volcano Engineの試算では、総保有コストはClaude Opus 4.6と比べて約80%安いとされます。
Doubao系列の呼び出しは1日あたり180兆トークンを超え、この1年で10倍以上に伸びました。調査会社IDCによれば、Volcano Engineは中国のパブリッククラウドのMaaS(モデル提供サービス)分野で約49.5%のシェアを握っています。
画像生成の「Seedream 5.0 Pro」、音声生成の「Seed-Audio 1.0」も同時にプレビューされ、テキスト・画像・音声・動画のすべてを高性能かつ低価格でそろえる、フルスタックのAI提供者へと姿を変えつつあります。
用途で分かれる料金とアクセス——Jimeng・Dreamina・API
Seedanceの巧みさは、性能だけでなく届け方の設計にもあります。中国国内のクリエイター向けには、公式アプリ「Jimeng(即夢)」が中心です。DouyinやCapCutの中国版と深く結びつき、月額は基本プランで日本円にして千数百円程度からと、世界最先端の動画モデルに触れられる環境としては破格です。
ただし利用には中国の電話番号と、WeChat PayやAlipayといった中国国内の決済が必要で、海外のユーザーには事実上の壁があります。中国の番号を持たない国際ユーザー向けには、英語対応で国際クレジットカードが使える公式プラットフォーム「Dreamina」が用意されていますが、その分Jimengより価格は高めで、上位プランも段階的に設けられています。
さらに、大量生成を自社システムに組み込む企業向けにはVolcano EngineのAPIが提供され、標準モデルの生成コストはおおむね1秒あたり1元前後です。加えて、速度とコスト効率を突き詰めた軽量版「Seedance 2.0 Mini」もあり、標準モデルより大幅に安く使えます。
95分のAI映画『Hell Grind』が映した制作の現実
この一連のモデルが現場に何をもたらすかを、最も雄弁に語るのが、2026年5月にカンヌで上映されたAI長編映画『Hell Grind』です。サンフランシスコのスタートアップHiggsfield AIが、自社ツールとSeedance 2.0を組み合わせて作った95分のSF強盗アクションで、チベットの寺院から封建時代の日本まで舞台が飛びます。
ただしこれは、カンヌ国際映画祭の公式セレクションではなく、同時期に開かれた業界向けマーケットの周辺で行われた、サードパーティ主催の上映でした。映画祭側も公式ではないと明言しています。
注目すべきは制作データです。95分の長編を、わずか15人のチームが14日間で仕上げました。従来のハリウッド流なら、同規模の作品には数百人と数年、数千万ドルが要るところです。総予算は50万ドル弱。しかも、その約80%にあたる40万ドルが、俳優やロケではなく生成AIのコンピュート費用に消えています。さらに踏み込むと、最初の25分を作るために、チームは16,181回もクリップを生成し、最終的に採用したのはわずか253カットでした。
実に64対1という歩留まりです。1回の生成は安くても、監督の意図、つまり重力が正しく働く、小道具が宙に浮かない、演技が連続するといった条件を満たす完璧な一カットを引き当てるには膨大な試行が要り、結果として巨額のコンピュート予算を食う構造になっているわけです。
30秒生成と50参照は、現場の痛みから生まれた
ここまで読むと、Seedance 2.5の「30秒のネイティブ生成」と「最大50ファイルの参照」が、いかに切実な現場の痛みから生まれた機能かが見えてきます。参照を大量に与えて生成を制御できれば、この64対1という比率は大きく改善し、少ないテイクで狙った映像にたどり着けます。
そしてこの変化は、映像制作の仕事の形そのものに問いを投げかけます。カメラを回し、照明を組み、クルーを動かすという「実行」の工程はどんどんコモディティ化し、中間層の制作スタッフは大きな逆風にさらされます。
一方で価値は、「どう作るか」から「何を作るべきか」、そして無数に生まれる候補から最良の一本を選び抜く「キュレーションとディレクション」へと移っていきます。
映画から建築、産業用途へと広がる応用
影響は映画にとどまりません。建築や空間デザインの分野でも、設計図から書き出した数枚の静止画を開始フレームと終了フレームとして読ませるだけで、室内をゆっくり進むような映像や、昼から夜へと光が移ろうタイムラプスを瞬時に作れるようになっています。
家具のない空室から、家具を配置した部屋へなめらかに変化させる、といった見せ方も可能です。もっとも、被写体の周囲を回り込むような複雑なカメラワークでは空間の破綻も起きやすく、万能ではありません。
このほか、ライブコマースの仮想配信者や、自動運転向けの学習用データ生成といった産業用途への展開も進んでいます。
攻めの一手、AI著作権商用化プラットフォーム
そして、技術スペック以上に業界を驚かせたのが、ByteDanceが同時に披露した「AI著作権商用化プラットフォーム」です。生成AI業界全体が抱える最大の弱点は、著作権侵害のリスクと、作り手の権利を無断で学習・生成することへの反発です。
ByteDanceはこれに対し、生成結果を後からブロックする守りの発想ではなく、あらかじめ正式にライセンスを取り、プラットフォーム上で合法的な二次創作と収益分配を仕組み化するという、攻めの設計で応えました。
初期パートナーの筆頭には、香港の映画監督・俳優である周星馳(チャウ・シンチー)氏が名を連ねています。ユーザーはByteDanceのツール上で、公認テンプレートを使ってチャウ・シンチー氏のクラシック映画のシーンをモチーフにした二次創作を、侵害に怯えることなく作れます。
発表時点で、関連テンプレートを使った作品はその日のうちに数万回規模に達したとされ、普及の速さを物語っています。仕組みの核は、作品が視聴されて利益を生んだとき、その収益をByteDance、クリエイター、そして権利者の三者で分け合う方向にある点です。
これがうまく回れば、権利者にとってAIは「権利を奪う脅威」ではなく、「過去のIP資産から新たなライセンス収入を生み続ける仕組み」へと位置づけが変わります。性能だけを競う他社に先んじて、法的・商業的な堀を築いた一手と言えます。
主戦場は「画質競争」から「エコシステム競争」へ
こうして見ると、Seedance 2.5は単なる機能追加ではなく、AI動画がプロの現場へ本格的に移っていく節目だとわかります。30秒のネイティブ生成、緻密な4K、最大50ファイルの参照は、映像づくりを、プロンプト頼みの確率的な生成から、綿密な参照にもとづく決定論的なレンダリングへと近づけました。
音声と映像をその場で同期させる仕組みもSeedanceの強みの一つですが、ネイティブ音声はGoogleのVeo 3.1やKuaishouのKling 3.0といった競合も備えており、ここは横並びの競争が続いています。
動画生成の主戦場は、いまや「どのモデルが最も美しい映像を作るか」という純粋な技術競争から、「どのプラットフォームが最も安全に、権利者と作り手の双方に利益をもたらすエコシステムを築けるか」というプラットフォーム競争へと移りつつあります。
7月の正式稼働を境に、作り手に求められるのは、カメラや照明の操作スキルよりも、AIの出力を精密に導く参照づくりと、生成の海から物語を編み出す眼になっていくはずです。



