音声合成– tag –
-
人工知能
「フレーム」と「深さ」で音をつくるAI :階層トークン生成が拓く次世代マルチモーダル合成
1. はじめに 数年前まで、AIが生成する音楽は「メロディらしきもの」が断片的につながった、どこか不自然な合成音でした。それが今では、テキストでと指示するだけで、コーラスもベースもドラムも整った数分のトラックが出てきます。音声合成も同じです。... -
人工知能
1000言語時代の「声のOS」:多言語Text-to-Speechが“低リソース言語”を救う仕組み
1. はじめに スマホやカーナビが自然にしゃべるのは当たり前。でも、その「当たり前」は世界の言語すべてには届いていません。話者が多い言語は高品質な音声合成(TTS)が整っている一方で、学習データが集めにくい言語(低リソース言語)では、いまだに不...
1
