AI一覧

項目一覧

マルチモーダル生成AIシステム – ChatGPT4o
テキスト生成AIシステム(text to text, image to text)
画像生成AIシステム(text to image, image to image)
音声生成AIシステム(text to speech)
音声・テキスト変換AIシステム
動画変換AIシステム(video to video)
音声認識AIシステム(speech to text)
カスタムボイス生成AI
生成AIシステム・チェッカー
その他の生成AIシステム

項目一覧（以上）

テキスト生成AIシステム – text to text

別ページ参照

音声生成AIシステムー text to speech

Realistic Text-to-Speech AI converter
https://speechgen.io/
Google Cloud: Text-to-Speech AI
https://cloud.google.com/text-to-speech?hl=ja
コエステーション
https://coestation.jp/
VOICEVOX
https://voicevox.hiroshiba.jp/
OSS（オープンソース・ソフトウェア）版 VOICEVOX をもとに構築された日本語音声合成用ソフトウェア
VoiceSpace
https://voicespace.ai/

音声・テキスト変換AIシステム

facebook SeamlessM4T
https://huggingface.co/spaces/facebook/seamless-m4t-v2-large
SeamlessM4Tは、スピーチ(speech)およびテキストを多言語間で相互に変換するサービスである。下記の変換サービスをWEBページで対話的に実行することができる。
1. Speech-to-Speech (S2ST)
2. Speech-to-Text(S2TT)
3. Text-to-Speech (T2ST)
4. Text-to-Text(T2ST)

動画変換生成AIシステム – video to video

Meta “Seamless Communication Translation Demo”

https://seamless.metademolab.com/expressive

シームレスな多言語への音声翻訳を実現するMetaのSeamlessM4T v2のデモ。英語、スペイン語、フランス語、ドイツ語間での音声翻訳が可能である。

SeamlessM4Tは、https://github.com/facebookresearch/seamless_communicationによれば、下記のようなサービスである。

SeamlessM4T is our foundational all-in-one Massively Multilingual and Multimodal Machine Translation model delivering high-quality translation for speech and text in nearly 100 languages.

同サービスは、下記の5つの機能を組み合わせることで実現されている。

Speech-to-speech translation (S2ST)
Speech-to-text translation (S2TT)
Text-to-speech translation (T2ST)
Text-to-text translation (T2TT)
Automatic speech recognition (ASR)

音声認識テキスト生成AIシステムー speech to text (video to text)

Google Cloud : Speech-to-text AI
https://cloud.google.com/speech-to-text?hl=ja

カスタムボイス生成AI — 自分の「声」による音声生成AI

コエステーション［個人向けサービス：「合成音声を手軽に楽しめる」スマホアプリ］
https://coestation.jp/consumer/coestationapp/
スマートフォンアプリを使って指定の文章をいくつか読み上げることで、自分の声の分身である「コエ」を生成し、テキストを入力するだけでその「コエ」でしゃべらせることができるサービス

生成AIシステム・チェッカー

テキスト生成AIシステムが生成したテキストのチェッカー紹介

その他の生成AIシステム

Amazon.comn AWSにおける機械学習サービス(一部機能を無料利用可能）
クラウドで機械学習アプリケーションを構築、デプロイ、実行するためのサービスと無料利用枠ご紹介
AWS は、幅広い機械学習サービスとサポートクラウドインフラストラクチャを提供し、すべてのデベロッパー、データサイエンティスト、およびエキスパートに機械学習を提供している。AWS は、Gartner クラウド人工知能デベロッパーサービスのマジッククアドラントリーダーに選ばれ、何万人もの顧客が機械学習の導入を加速するよう支援している。
1. テキストから音声へ
2. 音声からテキストへ
3. 機械学習 — 機械学習モデルを迅速に構築、トレーニング、デプロイします。
4. 機械翻訳
　
IBMの生成AI「watsonx」の紹介ページ
 https://www.ibm.com/jp-ja/info/generative-ai

項目一覧

項目一覧（以上）

メタ情報