1: 名無しのメタバースさん 0000/00/00(※) 00:00:00.00 ID:metaversesoku
画像生成AI「DeepFloyd IF」と同時に、チャットボット「StableVicuna(130億パラメータ)」も公開された!
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) April 28, 2023
人間によるフィードバックを用いた強化学習(RLHF)も行なってる。オープンソース大規模チャットボットでは世界初と主張
派生の順番:LLaMA→Vicuna →StableVicunahttps://t.co/w4xs0g6I5v
#StableVicuna また🆕おもちゃが笑
— forasteran (@forasteran) April 28, 2023
日本語できそうにゃ?
StableVicuna-13Bは、LLaMA13bモデルからのVicuna v0 13bをベースにRLHFで訓練した130億パラLLM!
OpenAssistant、GPT4All、Alpacaの3種データで微調整した後、
trlX(Transformer Reinforcement Learning X)でRLHFhttps://t.co/i1SGSP8P6l pic.twitter.com/CHFPYY8Sde
※: 本日のおすすめサイト記事一覧 0000/00/00(※) ID:metaversesoku
やっぱ英語のほうが早いし、精度高そw
— forasteran (@forasteran) April 28, 2023
でも日本語で言って、日本語でちゃんと返してくれたし、OSSだし調教期待!LLM界のSDくんだね♪
🤗デモ #StableVicuna by CarperAIhttps://t.co/SbsqoV4JJp pic.twitter.com/ttmfMoql9m
Stable-vicuna-13bのマージ終わった
— てんのすけ (@Meteor_Eternal) April 29, 2023
Stable-vicuna、ちょっとだけやってみました。元のLLaMaにデルタファイルをあてて、Stable版を作成(すでにネットには野良ファイルもあるようだが)。Vicunaを動かす定番のFastChatで難なくchatできました。性能は、今あるVicuna1.1と大差ない感じ。皆様の実験結果を待ちます。
— yhkondo (@yhkondo) April 29, 2023
https://t.co/WTc210w8xZ Stable-Vicuña-13B ちゃんとllama.cppで動かす用のGGMLがあるな.
— Shigekazu Ishihara (@shigekzishihara) April 29, 2023
生成速度とか正確性とかこちらからのmsgを読み取る能力がchatGPTがどれだけすごいか思い知らされた.
— ash (@shah39B) April 29, 2023
hello stableVicuna !! pic.twitter.com/nu6TvoCJyI
4: 名無しのメタバースさん 0000/00/00(※) 00:00:00.00 ID:metaversesoku
うーーーーーーーーーーーん
— てんのすけ (@Meteor_Eternal) April 29, 2023
Stable-vicuna-13bとVicuna-13bそんなに違わないような…
コードやスクリプト関連だとオリジナルVicunaよりもStable-Vicunaの方が良いかも。
— てんのすけ (@Meteor_Eternal) April 29, 2023
一般的な受け答えやタスクは差があるのはわかるけどどちらが良いのか判断できない。
まさに。違いがあるけど、どっちがいいとも言えない感じです。Stableに期待したけど、現状では1.1をメインに使っていきたいと思います。
— yhkondo (@yhkondo) April 29, 2023
vicunaのv0とv1.1は性能は一緒でuserとbotのフォーマットが違うだけだった気するので好みの範疇です。
— てんのすけ (@Meteor_Eternal) April 29, 2023
Stable-Vicunaはv0ベースなのでv1.1の形式で聞くとちょっとおかしくなります。
original VicunaとStable-Vicunaは甲乙つけ難いですね。もうちょっと検証してみます。
なるほど。v0とv1.1の差がよくわかっていませんでした。ありがとうございます。私もちょっとずつStable-Vicunaも触ってみます!
— yhkondo (@yhkondo) April 29, 2023
RHLFで訓練された、オープンソースLLM チャットモデル 「StableVicuna」を試す|はまち #note #AIとやってみた https://t.co/CA02vKyg8R
— はまち (@hama_jp) April 29, 2023
5: 名無しのメタバースさん 0000/00/00(※) 00:00:00.00 ID:metaversesoku
立て続けにStability AIが発表している。今度はLLMのStableVicunaか。
— ガル・トーロイド (@yk5KEpDk) April 29, 2023
3年後ぐらいにはローカルマシンでLLMが当たり前に動く時代になるのかなぁ。
ところで、ラマ属残るはグアナコだけなんだけど、なにか出てくるかな?
>https://t.co/g6QL0l8BNt
Stability AI は、AI 世界初のオープンソースRLHF LLMチャットボット「StableVicuna」をリリースしました。Stability AI https://t.co/DAMEze5PZ2
— AI 人工知能 ニュース (@ai_news_jp) April 29, 2023
初の大規模オープン ソース RLHF チャットボット StableVicuna https://t.co/0cQ4Lnxxtr
— ばじ (@mio43420) April 29, 2023
StableVicuna!!
— 走れ!櫻木さん (@sakuragi_zero) April 28, 2023
命令を微調整し、RLHF でトレーニングした Vicuna 13b https://t.co/P8iPMYG19z
大きな変更。
— 布留川英一 / Hidekazu Furukawa (@npaka123) April 29, 2023
LlamaIndex 0.6.0 - データに対する新しいクエリインターフェイス|npaka @npaka123 #note https://t.co/921YULiFdh
LLM開発はGPT-3.5, 4の出力結果に使わず性能を高めることを志向する派、使って性能を高めることを志向する派(Vicunaとか)がいると思っていて前者からすると後者はそりゃ性能良いでしょ、でも商用利用できないじゃんって思ったりする....志向の違いはビジネス寄りかアカデミア寄りかの違いなのかな。
— クニえもん.inc🤗 (@kun1em0n) April 29, 2023
オーバークロッカーと同じだと思うんですよね。液体窒素使って7GHz達成しました! 爆速! って言ってる人に、それ普段の動画エンコードとかRAW現像で使えませんよねと言っても食い違うというか。性能そのものを追い求めるのが楽しいタイプなんじゃないでしょうか。 https://t.co/MnzNy3BMqe
— こうき (@koki_1157) April 29, 2023
Vicunaとかが商用利用できない話って、厳密にはどういう意味なんだろうって。例えばFFMpegはGPLライセンスだけど、FFMpeg使って加工した動画にはライセンス感染しないじゃん。てことは、Vicunaもモデルは非商用だけどその出力物はライセンス関係ないんじゃね?だとしたら誰かが非商用でホストしてるVic…
— うみゆき@AI研究 (@umiyuki_ai) April 29, 2023
_________________________________________________________________________________
コメント
コメント一覧 (1)
教育コストやメモリ消費、量子化等々...営利で利用するには業界の進展が早すぎる。
教育用データのライセンスなんて、そいつ等が解決してから心配すればいい。
mijikamekarume1
758
が
しました
コメントする