使用Nvidia Fugatto AI 聲音生成技術,輸入文字即創造全新聲音

1732605814 00

Nvidia 最近推出了一款名為 Fugatto 的全新 AI 音樂編輯工具,其核心技術可以生成音效,例如將小號聲轉變為貓叫聲。Fugatto 能透過文字和音訊輸入,創造出全新的音樂和聲音效果。

據 Nvidia 分享的示範影片顯示,Fugatto 可以根據特定提示生成音樂。例如,輸入「創作一段色士風的狼嚎與狗叫聲,接著融合電子音樂和狗吠聲」,系統便能生成符合描述的創作。Fugatto 不僅能改變人聲的口音或音調(如怒吼或平靜聲線),還可以對現有音樂進行編輯,包括分離歌曲中的人聲、加入額外樂器,甚至以歌劇演唱取代鋼琴旋律,並根據簡單描述製作獨特音效。

目前,市場上已有多款 AI 音訊工具,如 Stability AI、OpenAI、Google DeepMind、ElevenLabs 和 Adobe,但大多數工具尚未聲稱能創造完全新穎的音效。同時,部分 AI 初創企業因其音樂生成技術面臨版權訴訟, Nvidia 和其他公司也被指曾利用 YouTube 字幕來訓練 AI 模型。

Nvidia 發表的研究報告中提到,Fugatto 的訓練過程依賴於大量音訊數據,涵蓋數百萬個樣本,其中包括 BBC 提供的音效資料庫。研究團隊還設計了指令,進一步擴展模型的任務範圍,使其在不需要額外數據的情況下能有更準確的性能。暫時,Nvidia 尚未透露何時會全面推出 Fugatto。

«
»
  • hq720 4
    2025-01-22
  • image3 694x345 1
    2025-01-22
  • edm beta
    2025-01-22
  • edm beta
    2025-01-22
  • edm beta
    2025-01-22
  • 0J53CV6 0
    2025-01-22
  • hq720 4
    2025-01-22
  • image3 694x345 1
    2025-01-22
  • edm beta
    2025-01-22
  • edm beta
    2025-01-22
  • edm beta
    2025-01-22
  • 2025-01-22
  • 0J53CV6 0
    2025-01-22
  • 2025-01-22