日々、様々な生成AIが世に進出してきていますが、種類が多すぎて情報を追いきれない!と感じていませんか?
2023年にテキスト生成AI ChatGPTのリリースから始まったとされるAIイノベーションは2024年も加速し、現在は画像・動画・音楽・3Dモデル・Webサイトに至るまでAIで生成できる時代となってまいりました!
<本記事では!>
■テキスト/画像/動画/音楽/3Dモデル/Webサイト/ビジネス向け の7つの種類の生成AIを紹介しています!
■種類ごとに主要なツール、特徴、どのように活用されているのかを徹底解説!
「生成AI」と聞いて一番最初に連想されるのはChat GPTを始めとしたテキスト生成AIかと思います。
<主なサービス比較>
– | Gemini | ChatGPT | ChatGPT Plus | Copilot |
---|---|---|---|---|
提供元 | OpenAI | OpenAI | MicroSoft | |
言語モデル | PaLM2 | GPT-3.5 | GPT-4 | GPT-4 |
料金 | 無料 | 無料 | 有料 | 無料 |
参照情報 | Google検索結果を参照可能 | 2021年9月までの情報 | Webブラウジング可能 | Bing検索結果を参照可能 |
昨今は基本的にWebブラウジングや、GeminiならGoogle検索結果、CopilotならBingの検索結果を参照して応答をしてくれるので、情報のリアルタイム性も高くなってきております。
<主な活用>
■GoogleやYahoo、Bing等の検索エンジンに代わる調べごとで利用する。
■小説等を始めとした創作物のシナリオ作成等に活用する。
■複数の案を検討する時に、候補となる案を考えてもらう。
主な活用としては上記が多いかと思いますが、その他にもプログラミングの代行や論文の作成、データ分析等々…その活用は多岐にわたります。
テキスト生成AIに次いで利用者が多く、人気があるのが画像生成AIです。
主にはイラストの作成に利用されますが、昨今は実在しない架空の人物を作成し、SNS発信を行う「AIインフルエンサー」としても活用されています。
■実際には実在しないAI生成による架空のアイドル例 (Midjourney作)
<主な活用>
■イラストを生成し、SNSやブログ等のアイコンに利用する。
■サービスやNFTとしてイラストを販売する。
■AIインフルエンサーを作成して、SNSで情報発信をする。
■漫画や絵本を描くのに利用する。
人気のツールとしては「Midjourney」や「Stable Diffusion」、「DALL E3」がございます。
弊ブログにおきましては「Stable Diffusion」は取り扱っていませんが、「Midjourney」と「DALL E3」は以前に比較記事を書いているので、良かったらご参照頂けると幸いです。
■参考リンクはこちらから!
現在、画像生成AIを牽引するMidjourney v6と同等のクオリティであるとして注目を集めています。
従来は主にテキストから画像を生成する「Text to Image」が画像生成AIの主流でしたが、昨今は手書きの画像からAIイラストを生成する「Image to Image」機能を持った生成AIも登場しています。
■Akuma AIのAIキャンバス機能
右側に描いた手書きのイラストをベースに、左側に補正したイラストを生成してくれます。
■KREA AIのImage to Image機能
左側に描いた手書きのイラストをベースに、右側に補正したイラスト(実写も対応可)を生成してくれます。
■参考リンクはこちらから!
実用的なツールとしては企業やお店、Webサイト等の「ロゴデザイン」作成に特化した画像生成AIもございます。
Midjourney等の既存の画像生成AIでもロゴデザインは作れなくはないのですが、「文字入れ」機能に対応している画像生成AIはそう多くはございません。
Midjourneyでのロゴデザインについては以前に私の方で紹介している以下の記事をご参照ください。
2023年まではテキスト生成AI、画像生成AIが一世を風靡しましたが、2024年は動画生成AIが最注目であると言われています!
特に注目度が高いのはOpen AI社の「Sora」とGoogle社の「Google Veo」です。
■Open AI Soraの生成動画例
■Google Veoの生成動画例
既にリリースされている動画生成AIであれば、人気なのは「Runway Gen-2」と「Pika Labs」辺りになるかと思います。
動画生成AIにおいてはテキストから動画を生成する「Text to Video」と、画像から動画を生成する「Image to Video」が主流ですが、その上で各社が独自に機能を付けています。
<独自機能例>
■Runway Gen-2:指定した範囲だけを動かす「モーションブラシ」機能
■Pika Labs:動画に合わせた音楽を生成する「Sound Effect」機能
■参考リンクはこちらから!
前述の「Text・Image to Video」とは異なり、既存のVideoを変換する「Video to Video」の生成AIも人気です!
報道ステーションでも紹介されていました!
こうした「Video to Video」と言えば「Domo AI」が元祖になるかと思いますが、最近は「GoEnhance AI」と言う別のツールも出てきました。
■参考リンクはこちらから!
TikTok等のSNSで人気のあるダンス動画を生成するのに特化したAIもございます。
公式Xアカウントのポストはこちらです!
従来の動画生成AIは指定した通りに人物を動かすことが出来ないので、「VIGGLE AI」の様に指定したモーションで人物を動かすことが出来ると創作の幅も広がりそうですね!
■参考リンクはこちらから!
アニメーション(モーション)自体をテキストから生成する「Text to Animation/Motion」の生成AIも登場してきています。
私が知る限りまだ世に出ている数も少ないですが、アニメーションは他の様々な生成AIと組み合わせて使うことが出来ると思うので、要注目なジャンルですね!
■参考リンクはこちらから!
昨今も根強い人気を誇る「Vtuber用動画」を生成するのに特化した生成AIツールもございます。
Vtuber動画は初心者が1から始めようとするとキャラクターの作成から録音/編集等に非常に時間がかかります。
以前に私の方で試しに作ってみたVtuber動画がこちらです!
■参考リンクはこちらから!
少しこれまで紹介した動画生成AIとは趣が異なりますが、リアルタイムで解説動画を生成してくれるAIもございます
■参考リンクはこちらから!
音楽生成AIは「Suno AI」と「Udio AI」の2つが注目されています!
<音楽生成AIの特徴>
■英語のみならず、日本語の歌詞にもしっかり対応をしています!
■曲調もバラードやロック、ジャズ、カントリーソング等々の様々なジャンルに対応しています!
■最新は2分程度の曲も生成出来る様になりました!
過去に私の方で作成してみたSuno AIの曲がこちら!
■参考リンクはこちらから!
前述の曲を作るSuno AIとは趣が異なりますが、指定したテキストから効果音を生成するAIもございます!
■参考リンクはこちらから!
3D生成AIに関しては「CSM AI」「Tripo AI」「Meshy AI」「Luma AI」の4つのツールが注目されています!
主流なのはテキストから生成する「Text to 3D Model」と、画像から生成する「Image to 3D Model」の機能です。
ツールによって使い勝手や、対応している細かい機能等に差異がございます。
昨今はついに、プログラミング不要でテキストからWebサイトやブラウザ上で動作するゲーム等のアプリ生成が出来るAIが登場しました!
実際にDora AIで生成されたランディングページは以下からご覧いただけます!
また、「Create XYZ」においてはテキストからWebブラウザ上で動作するゲーム等のアプリ生成も可能です!
■参考リンクはこちらから!
クリエイティブ方面のツールとは少々異なりますが、実際にプレゼン資料等の作成に仕事で使えるスライド生成AIが登場しました!
使い勝手はマイクロソフトのパワーポイントに似ていますが、スライドを作成するにあたって最大三分の一まで作業効率化を図れるAI機能が搭載されています!
■Youtubeの紹介動画はこちら!
■参考リンクはこちらから!
生成AIをもっと学びたい!仕事や趣味に活かしたい!と言う方必見!
Udemy では様々な画像生成AIのオンライン講座を受けられます!
ツールの使い方から副業への活かし方まで!目的にあった講座を是非、以下から検索してみてください!
「生成AI 副業」等のキーワードで検索してみましょう!
最後までご覧になって頂きありがとうございます!
後から見直したい方は是非、ブックマークに登録を頂けると幸いです。
主にAIやNFTに関する活用を紹介するブログを書いています。
Xで発信もしているので、良かったらフォロー頂けると嬉しいです。アカウントはこちらから!