1: 名無しのメタバースさん 0000/00/00(※) 00:00:00.00 ID:metaversesoku
おっ、Metaがテキストから4D生成(3D +時間)を行なうAI「MAV3D(Make-A-Video3D)」を発表!
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) January 27, 2023
学習に3Dや4Dデータは必要ないうえに、T2V(テキストからの動画生成)は「テキストと画像のペア」と「動画のみ」のデータで学習されたAIを利用
論文:https://t.co/MLrQit12gq
デモ:https://t.co/kLWu25WIzl pic.twitter.com/PkqEdkinHG
AI「MAV3D(Make-A-Video3D)」を発表!
T2V(テキストからの動画生成)は「テキストと画像のペア」と
「動画のみ」のデータで学習されたAIを利用
※: 本日のおすすめサイト記事一覧 0000/00/00(※) ID:metaversesoku
3: 名無しのメタバースさん 0000/00/00(※) 00:00:00.00 ID:metaversesoku
ネットの反応
MetaのMake-A-Video3D、すごすぎんだろ…。
いきなり3Dシーン動画作るとか
まだ誰もその話してなかったじゃん!
3次元物体の認識や構築については
おお、なんだかすごそう😳
早すぎる👀
what
4: 名無しのメタバースさん 0000/00/00(※) 00:00:00.00 ID:metaversesoku
5: 名無しのメタバースさん 0000/00/00(※) 00:00:00.00 ID:metaversesoku
Metaよりテキストから4D(動く3D)を生成できる
— やまかず (@Yamkaz) January 27, 2023
「MAV3D(Make-A-Video3D) 」が発表!https://t.co/0Ns77Mo9tshttps://t.co/LmNdde0J4c
3Dや4Dデータを必要とせず、テキストから動画を生成するモデルはテキストと画像のペアとラベルのない動画のみで学習 pic.twitter.com/dJKyhJfiie
テクストから動画生成。AIの重要トレンド。 https://t.co/OmY9HSxnvs
— 株式会社ディエムアイ|担当者の傍白 (@DMI_Corporation) January 27, 2023
ついに来てしまった。 https://t.co/XmCkdTGniW
— らだい (@tw_rdi) January 27, 2023
The 2022 AI Recap (STATE OF AI)
— 村山 理 (@sam_murayama) January 12, 2023
1) Resolution-robust Large Mask Inpainting with Fourier Convolutions
・画像の一部を削除し、その後ろに表示されるべきものに置き換えるimage inpainting
2) NeROIC
— 村山 理 (@sam_murayama) January 12, 2023
・写真を何枚か用意して、これらの写真に写っている物体が空間の中でどのように見えるべきかを機械に理解させる
3) SpeechPainter:
・動画上の物体や人物を除去するビデオインペインティングに合わせて音声も消去するインペインティング
4) BlobGAN
— 村山 理 (@sam_murayama) January 12, 2023
・ブロブの小さな塊はすべて物体を表しており、それらを動かしたり、大きくしたり小さくしたり、あるいは取り除いたりすることができる
5) A Generalist Agent
・Gato (DeepMind)
・トランスフォーマーとマルチタスク強化学習エージェントの進歩をミックス
6) No Language Left Behind
— 村山 理 (@sam_murayama) January 12, 2023
・200もの言語を最先端の画像を理解し、何が起こっているかを説明する文章を生成する品質で翻訳(MetaAI)
7) Make-a-scene
・テキストとスケッチによる画像生成(Meta)
8) Panoptic Scene Graph Generation
— 村山 理 (@sam_murayama) January 12, 2023
・画像やシーンをより包括的にグラフ表現することとによって、画像を理解し、何が起こっているかを説明する文章を生成する
9) MAKE-A-VIDEO
・テキストから動画を生成する(MetaAI)
10) DreamFusion
・文章を理解し、その3Dモデルを生成する
11) Imagic
— 村山 理 (@sam_murayama) January 12, 2023
・拡散モデルを用いて、画像を生成し、それを好きなように編集できる
12) eDiffi
・DALLE 2やStable Diffusionよりも見栄えがよく、より正確な画像を生成する(NVIDIA)https://t.co/mHCc5jnMDv
_________________________________________________________________________________
コメントする