Googleが、12月6日(現地時間)に
マルチモーダル処理性能を向上させた新AI「Gemini」を発表しました。
最新の大型言語モデル(LLM)で
今までよりも更に
テキストの生成、翻訳、要約、質問への回答などの
さまざまなタスクに使うことができ
精度も向上していると言われています。
その中でも特徴は
マルチモーダル処理性能が
大幅に向上しているところで
テキスト・画像・音声・動画など
複数の種類のデータを一度に処理できる技術が
凄いと言われていて
今後様々な分野で使用される可能性を秘めています。
ちょっとマニアックに話すと
GoogleのAIモデルは
LaMDA → PaLM → PaLM 2と
進化してきて
今回の「 Gemini 」になります。
Geminiには3つのバージョンがあり
最高性能の「Ultra」
バランスの良い「Pro」
最軽量の「Nano」です。
AIの知識量・言語理解能力・マルチタスク性能を
計測するための「MMLU」という試験がありまして
これを人間の専門家が受けた時の
スコアが89.8%だったのですが
Geminiはそれを少し超える
90.0%を叩き出したんです。
ちなみにGPT-4は86.4%だそうです。
ただ人とGPT-4を追い越したのはUltraで
クラウドスーパーコンピューターでしか
動かせないほど
重くまだ実用的ではなさそうです。
一方スマホ上で動かせるくらい
軽いバージョンの「Nano」もあり
GoogleのスマホPixel 8にも
搭載されているとされています。
今は、スマホで録音すると
文字起こしをしてくれて要約まで
作ってくれるんですよ。知ってました?
AIの進化は凄まじいです…。
#大分 AI
#大分 AI システム
#大分 システム開発
#大分 AI 医療
#福岡 AI
#福岡 AI システム
#福岡 システム開発
#福岡 AI 医療
#医療 AI
#医療 IT
#大分 医療 システム
#透析 AI システム