拡大
2024中関村フォーラム年次総會で27日、中國が獨(dú)自に開発した「長時(shí)間?高一貫性?高ダイナミクス」という特徴を持つ動(dòng)畫生成大規(guī)模AIモデル「Vidu」が初発表された。
テキストを入力するだけでリアルな動(dòng)畫を生成してくれる。動(dòng)畫生成大規(guī)模AI(人工知能)モデル「Sora」が今年初め、世界のAI業(yè)界の內(nèi)外から広く注目された。2024中関村フォーラム年次総會で27日、中國が獨(dú)自に開発した「長時(shí)間?高一貫性?高ダイナミクス」という特徴を持つ動(dòng)畫生成大規(guī)模AIモデル「Vidu」が初発表された。新華社が伝えた
會場で明らかになったところによると、この動(dòng)畫生成大規(guī)模AIモデルは清華大學(xué)と北京生數(shù)科技が研究開発したもので、テキストの記述に基づき、最長16秒で解像度1080pの高畫質(zhì)動(dòng)畫コンテンツを直接生成できる?,F(xiàn)実の物理世界をシミュレーションできる上、豊富な想像力も合わせ持つ。
清華大學(xué)人工知能研究院副院長で、生數(shù)科技の首席科學(xué)者の朱軍(ジュウ?ジュン)氏は、「中國の動(dòng)畫生成大規(guī)模AIモデルの動(dòng)畫の長さは約4秒が大半だが、Viduは1度に16秒の動(dòng)畫を生成できる。動(dòng)畫はなめらかさを維持し、カメラの移動(dòng)に伴い人物とシーンが時(shí)間と空間の中で高い一貫性を保つことができる」と述べた。
ダイナミクスの面では、Viduは複雑な動(dòng)きのあるシーンを生成でき、単純にカメラを前後左右に動(dòng)かす固定的なアングルに限られず、1本の動(dòng)畫の中で、ロングショット、クローズショット、ミディアムショット、アップショットなど異なるアングルも切り替えられる。長回しやフォーカストラッキング、トランジションなどの効果も含まれる。
「Viduは実際の物理世界をシミュレーションし、細(xì)部が複雑で物理法則に合致するシーンを生成できる。例えば合理的な光と影の効果や、細(xì)やかな人物の表情などだ。さらには深みと複雑性を持つ超現(xiàn)実主義的な內(nèi)容も創(chuàng)出できる」。朱氏は、「『ワンステップ』の生成方法を採用しているため、動(dòng)畫のシーンが最初から最後まで連続的に生成され、明らかなフレーム挿入が見られない」と説明した。
このほか、Viduはパンダやドラゴンなどの映像も生成できる。
Viduの技術(shù)のブレークスルーは、チームの機(jī)械學(xué)習(xí)とマルチモーダル大規(guī)模AIモデルの長期的な蓄積によるものだ。その中核テクノロジーアーキテクチャはチームが早くも22年に打ち出すとともに、獨(dú)自の研究開発を続けた。朱氏は「汎用視覚モデルとしてのViduは今後、より多様で長時(shí)間の動(dòng)畫コンテンツを生成し、異なる生成任務(wù)を模索する。そのフレキシブルなアーキテクチャはより多くのモーダルに対応し、マルチモーダル汎用能力の境界をさらに広げてくれると確信する」と述べた。(提供/人民網(wǎng)日本語版?編集/YF)
Record China
2024/4/27
Record China
2024/4/27
Record China
2024/4/24
Record China
2024/4/13
Record China
2024/4/11
Record Korea
2024/4/11
ピックアップ
we`re
RecordChina
この記事のコメントを見る