生成AIとDX

Voicvを自作アプリに実装!まじで凄いわ

ninnin2025

まとめ

  • 先日、ボイスクローニングをリサーチしていて技術の進化に驚いたが、Voicvがコスパ最高と分かったので自作アプリに実装したhttps://ninnin2025.com/voice_cloning
  • アプリはノート付きパワポからスライド動画を自動生成するもの、これまではMicrosoftやOpenAI、GoogleのAPIを使用して悪くなかったがVoicvのクローンボイスは別格
  • 30秒のサンプルから音声だけでなく話し方まで完コピする、HaggingFaceのIndexTTS2は英語と中国語だけだがVoicvのAPIは日本語も完璧

ふたり言

いや、まじで凄い。クローン技術が凄いのももちろんだけど、エージェントのClaude Codeくんが一発でサービス追加をやってくれたよ。

にんにん
にんにん

ボイスクローニングの話じゃないの?

みんみん
みんみん

いやまあ、どちらもだね。ちょっとした修正も含めて午後の時間にちょこちょこ指示してもう完成だよ。ホント、人間がコード書いている場合じゃなくなった。

にんにん
にんにん

今回のクローンってIndexTTS2なのよね。

みんみん
みんみん

うん。だけどHaggingFaceに登録されているやつは英語と中国語だけなんだよね。VoicvのサイトやAPIは日本語が使える。APIもシンプルで反応速度もまあまあで何より安い。OpenAIが最安だけどほとんど同じレベルでクローンボイスが使える。さすが中華だな。

にんにん
にんにん

そのうちコナンみたいなリアルタイムボイスチェンジャーが出てくるね。前にも言ったけど、絶対詐欺電話に使われるわ。

みんみん
みんみん

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


ABOUT ME
にんにん
にんにん
神出鬼没の忍者です
2025年8月に40年勤めた大手金融機関を定年退職してサラリーマンを卒業

これからはフリーランスで自由に働く生き方に挑戦するよ
記事URLをコピーしました