AIから一息つけると思った矢先、 。だが、TikTokの物語は終わらない。深センで行われた派手なAIイノベーションショーケースで、ByteDanceのVolcano Engineは、 抱く2つの強力なモデル、 発表した。PixelDance 、テキストとビジュアルのプロンプトからダイナミックで高品質のビデオを生成することに重点を置いており、ビデオ制作者の願いを叶える精霊と考えればよいだろう。Seaweed 、3Dアニメーションと芸術的レンダリングの領域に深く踏み込み、パーティーで紙吹雪のように映像を目立たせたい人々の要望に応えている。 ByteDanceが脚光を浴びる ビデオ生成環境を揺るがす大きな期待を PixelDanceとSeaweedを は は これらのモデルには本格的なテクノロジーが組み込まれていますが、それは、その真のターゲットオーディエンス がインフルエンサーに近いZ世代ではなく、本格的なクリエイターや制作会社だからです。 これは Bytedance からの興味深い最新情報です。その理由については、以下をお読みください。 彼らは何者なのか ない あなたに伝える ByteDance は長い間 AI に取り組んできました。同社がアルゴリズムによる推奨機能の開発を始めた頃、ほとんどの人は「AI」という略語を「Adobe Illustrator」と関連付けていました。同社が消費者向け業務に AI を集中させていると思われるかもしれませんが、彼らはそう信じ込ませたいのです。 彼らは、AI によって使い捨てのプラットフォーム (訴訟やデータ精査、煩雑な手続きに悩まされやすい) から ます。 、欠かせないツールへと 変貌することを期待してい ByteDance の将来は、一時的なハッシュタグや広告収入ではなく、成長と革新のために設計された である、本格的な制作の堅実で信頼できる腕 。 エンタープライズ中心のモデル にあります。専門的なアプリケーションに重点を戦略的にシフトすることで、ByteDance は嵐を乗り切るだけでなく、 ことで繁栄するでしょう テクノロジー エコシステムにおける役割を再定義する PixelDance: 心から魔法へ PixelDance は になることを約束します。その主な機能は次のとおりです。 、あなたの中途半端な文章やまとまりのないたわごとを、あなたが思い描いていた通りのものに仕上げてくれるエージェンシー テキストと画像を組み合わせた入力 従来のビデオ生成モデルとは異なり、PixelDance では、テキストと画像 (具体的には最初と最後のフレーム) の両方をユーザーが提供できます。つまり、思い描いたとおりに始まり、終わるビデオが得られます。 : あなたのアイデアを実際に聞いて、それを実現してくれる監督です。そして、口答えはしません。 一般人の要約 潜在的拡散モデルアーキテクチャ このベイビーは、 利用した潜在拡散モデルで実行されます。画像入力は VAE を介して供給され、ビデオ潜在変数とブレンドされて、シームレスな動きと一貫性が確保されます。 事前トレーニング済みの変分オートエンコーダー (VAE) とテキストエンコーダーを これは、あなたの夢のビデオを、無駄なく仕上げるハイテク ブレンダーです。 一般人の要約: 連続ビデオセグメント PixelDance は、 ながら連続したビデオ クリップを生成できます。1 つのセグメントの最後のフレームを次のセグメントの最初のフレームとして使用します。 時間的な一貫性を維持し 不自然なカットとはお別れしましょう。 一般人の要約: ゼロショットビデオ編集 この機能により、ユーザーは特別なトレーニングを受けなくてもビデオを編集できます。最初と最後のフレームを微調整するだけで、ビデオの作成をガイドできます。 冒頭と最後のシーンを調整するだけで、大ヒット映画全体を再編集できます。まさに映画の魔法です。 一般人の要約: 幅広いスタイルのサポート PixelDance は、白黒から 3D アニメーション、伝統的な中国絵画スタイルまで、1:1 や 3:4 などのアスペクト比を含む幅広い美学をサポートします。 これはアナ・ウィンターや他のスタイルにこだわる人ではありません。この製品には芸術的な好みはなく、ただツールの武器庫があるだけです。 素人の要約: トレーニングデータセット PixelDance は、解像度 336 x 596 の約 1,000 万本の短いビデオ (平均長さ: 18 秒) のデータセットである 。さらに、高品質の出力を保証するために、 使用しました。 WebVid-10M でトレーニングされました 透かしのないビデオ クリップを 50 万本 あなたよりも多くのビデオを視聴しています。これは映画の参考資料の百科事典です。そのプロ意識を信頼してください。 一般人の要約: 海藻:編集の錬金術師 Seaweed は、クリエイターを悩ませる編集の悩みに対する ByteDance の答えです。PixelDance を ように設計された Seaweed は、AI を活用して、優れた機能で 。 補完する 編集プロセスを効率化します 3Dレンダリング Seaweed は高度なレンダリング技術を使用して、単なる平面ではなく、深みとリアリズムを備えたビジュアルを生成するため、高品質のアニメーションや芸術的表現に適しています。 ピクサー アニメーション スタジオがあなたの指先で操作できます。 一般人向けの要約: インテリジェントカット検出 Seaweed は洗練されたアルゴリズムを使用して 、物語を損なうことなく素早いカットを可能にします。 映像内の重要な瞬間を識別し 生の映像から最高の瞬間を正確に見つけることができるパーソナルエディター。高速。本当に高速です。 一般人向けの要約: 強化されたカラーグレーディングとエフェクト このツールは、色補正を自動化し、スタイル効果を適用して、面倒な手動調整を行わずにビデオを洗練されたものにします。 バズ・ラーマンでさえ認める色彩とスタイルを手に入れることができます。色覚異常の人でも大丈夫です。 一般人の要約: AI支援によるユーザーフレンドリーなインターフェース Seaweed は、高度な AI 機能とシンプルなインターフェースを組み合わせ、技術に詳しくない人でも利用できるようにします。 まるでフェラーリを運転免許証付きで手に入れたようなもので、誰でもスムーズに運転できます。 一般人の要約: 最終的な考え: 技術エリートのための構築 PixelDance と Seaweed は単なるツールではない。ByteDance にとって、これらは、賭け金が高く競争が激しい、より洗練された新しい遊び場への切符なのだ。ほとんどの企業は、テンプレートを探したり、いとこの結婚式のスライドショー用に「そこそこ良い」コンテンツを作成したりしているカジュアルなクリエイターのニーズに応えることで満足しているが、ByteDance は一流のクリエイターを狙っている。 つまり、同社は を優先し、飽和状態のコンテンツ市場で際立つ、高度に洗練された洗練された動画を必要とする映画制作者、アニメーター、マーケティング エージェンシー、企業をターゲットにしています。 ByteDance は、AI 動画の Canva になることには興味がないことをはっきりと示しています。同社が目指しているのは、AI 駆動の Pixar-ILM ハイブリッドに近いものです。 ユーザーの量よりも質 それは賢い方法です。本当に賢い方法です。しかし、リスクがないわけではありません。 積極的な価格戦略:諸刃の剣? 彼らの積極的な価格戦略は、 市場を混乱させることを意図しています。これは中小企業やインディーズ クリエイターにとっての呼び声であり、彼らはこれまで手の届かないと思っていた最先端のツールにアクセスできるようになります。 トークンあたり 0.002 ドル(OpenAI の 1 トークンあたり 0.03 ドルと比較して)で、 しかし、トークンあたりのコストが低いのはリスクの高い賭けだ。バイトダンスは今のところこのゲームに参加する余裕があるが、 。特に、データ取得とインフラストラクチャのコストが不釣り合いに拡大した場合だ。最初の価格は顧客を引き付けるかもしれないが、品質や革新性を犠牲にすることなくこれを維持するのは綱渡りになるかもしれない。 長期的にこの価格を維持するのは困難かもしれない UnityとUnreal Engineとの競争 ByteDance は、3D レンダリング、アニメーション、さらにはリアルタイム映画制作の分野で先駆者であり、大規模で忠実なコミュニティと豊富なリソースを持つ に足を踏み入れようとしています。Unity はバーチャル プロダクションとリアルタイム ストーリーテリングで大きな進歩を遂げており、Unreal Engine の最近のアップデートでは、ハイパーリアリスティックなレンダリング機能で注目を集めています。現在、両社とも AI 機能を統合してサービスを強化しており、Seaweed の 3D レンダリングとインタラクティブ ビデオ機能の直接の競合相手となっています。 Unity や Unreal Engine などの大手企業がすでに支配している戦場 の課題は、PixelDance と Seaweed がこれらのプラットフォームでは提供できないもの (既存のツールとのより優れた統合、より高速なワークフロー、優れた出力品質など) を提供していることをクリエイターに納得させることです。 Unity と Unreal Engine の確立されたエコシステムも、 という決定的な優位性をもたらします。ByteDance ユーザー ベースとコミュニティ サポート しかし、技術的な優位性だけで、Unity と Unreal が何年もかけて培ってきたものをユーザーを納得させることができるでしょうか? 潜在的な落とし穴: 高い野心、高いリスク ByteDance の PixelDance と Seaweed に対する高い野望は、さまざまなリスクを伴います。ライバル業界の大物にプロ仕様のツールを提供するという高いハードルを設定するのは大胆な動きですが、これらのプラットフォームがそれ 場合、彼らが誘致しようとしているまさにその専門家の怒りに直面するリスクがあります。 も加わり (AI を扱っているときに政府の監査を嫌う人はいないでしょう)、特にデータ プライバシーの懸念が大きく迫り、TikTok がその子孫である状況では、緊張が高まることになります。 を実現できなかった 規制当局の監視 プロをターゲットにするのは賢い戦略ですが、ピーター ティールはおそらくこう尋ねるでしょう。「ここに独占を築く余地はあるか?」 全体像: 星を目指して、しかし着地は成功するのか? PixelDanceとSeaweedが幅広い展開に向けて準備を進める中、 。彼らは を目指しており、純粋な量よりも質の高いクリエイターに焦点を合わせるのは、特にあらゆるプラットフォームが可能な限りアクセスしやすいものにしようと競い合っている世界においては、大胆な動きだ。 ByteDanceは大胆な声明を出している。彼らはソーシャルメディアの巨人であることに満足していない デジタルコンテンツ制作のトップ層 彼らは AI 生成ビデオの世界を作り変え それとも、これはテクノロジーの歴史に残る、またひとつの野心的な実験となってしまうのでしょうか? 、テクノロジーの鉄の玉座に一歩近づくことができるのでしょうか? しかし、確かなことが 1 つあります。それは、ビデオ生成の状況がはるかに興味深いものになっていることです。 これはムーンショットであり、技術オタクなら誰でも知っているように、ムーンショットは必ずしもうまく着地するとは限りません。 さあ、ポップコーンを用意してください。このショーはまだ始まったばかりです。 注: どちらのプラットフォームも現在、招待制のテスト段階にあります (Volcano Engine 経由で申し込むことができます)。近いうちにさらに広範なアクセスが可能になる予定ですが、正確な日付は Zoom 通話中の Wi-Fi 信号と同じくらいわかりにくいです)。