跳至主要內容

【日本專家】AI 語音識別技術發展 | 主題資料庫 | 三建產業資訊

主題資料庫詳細內容

機器人/PLC/機械/自動化

【日本專家】AI 語音識別技術發展

(包班)2024年12月6日(金) 13:00~16:30 小時 25T00104
三建 SUMKEN 生成AI GAI 語音識別 語音訊號 聲音訊號 VR 語音合成 多模態對話系統 語音對話 情感識別

大綱內容

隨著智慧手機及家電產品的普及,語音識別技術已經深入到日常生活中。近年來,人工智慧(AI)的引入使語音訊號處理技術取得了顯著進展。
本課題涵蓋從語音基礎到語音識別的核心技術,並介紹AI應用於語音訊號處理的最新技術及發展,幫助學習者深入理解語音識別技術的發展趨勢。
此外,隨著語音識別技術的高功能化,學習者將深入了解語音與AI技術及深度學習的應用,並探索語音合成、聲質轉換、歌聲合成、情感識別、VR空間對話系統等語音訊號處理技術的應用場景。

將人類語音作為數據進行處理的技術被稱為語音訊號處理,包括將語音轉換為文字的語音識別技術,以及將文字轉換為語音的語音合成技術等。過去,語音識別與語音合成在技術上具有挑戰性,實現實用的系統較為困難。然而,隨著AI技術的進步,近年來這些技術已被廣泛應用於多個領域。基於AI的技術自2011年起逐漸被積極研究,而特別是最近幾年的技術進展十分驚人,AI技術的內涵與幾年前相比發生了巨大變化。
本課題介紹語音識別以及其他相關語音技術的發展,並通過研究案例展示其應用。

【習得知識】
・語音的基礎知識
・AI技術概述
・利用AI技術進行語音識別及其他語音訊號處理
・語音訊號處理技術的應用

一、生活中的語音處理技術
二、語音介紹
2-1 語音的性質
2-2 語音的生成機制
2-3 共振峰(Formant)
2-4 音素種類
2-5 語音特徵
2-6 語音的感知
三、語音識別的核心技術
3-1 語音識別研究歷史
3-2 語音語料庫
3-3 語音訊號處理基礎
3-4 語音識別框架
3-5 利用音響模型與語言模型進行語音識別
3-6 深度學習
3-7 混合型音響模型
3-8 基於大規模預訓練模型的語音識別
四、AI 驅動的語音訊號處理
4-1 語音合成與聲質轉換
.語音合成
.聲質轉換
.情感語音合成
.歌聲合成
4-2 基於語音的情感識別
4-3 語音對話系統
.語音對話系統介紹
.VR空間中的代理人對話系統
.多模態對話系統

加入會員,掌握最新開課資訊

主題資料庫為公開展示,需透過公開課程或企業內訓方可報名上課。立即註冊會員,搶先收到此主題開班通知與專屬優惠。

有興趣將此主題導入貴單位?

三建可為企業規劃專屬內訓課程,含客製化大綱、講師派遣與教材配套。

聯絡我們