主題資料庫詳細內容

機器人/PLC/機械/自動化

【日本專家】AI 語音識別技術發展

（包班）2024年12月6日（金） 13:00～16:30 小時 25T00104

三建 SUMKEN 生成AI GAI 語音識別語音訊號聲音訊號 VR 語音合成多模態對話系統語音對話情感識別

大綱內容

隨著智慧手機及家電產品的普及，語音識別技術已經深入到日常生活中。近年來，人工智慧（AI）的引入使語音訊號處理技術取得了顯著進展。
本課題涵蓋從語音基礎到語音識別的核心技術，並介紹AI應用於語音訊號處理的最新技術及發展，幫助學習者深入理解語音識別技術的發展趨勢。
此外，隨著語音識別技術的高功能化，學習者將深入了解語音與AI技術及深度學習的應用，並探索語音合成、聲質轉換、歌聲合成、情感識別、VR空間對話系統等語音訊號處理技術的應用場景。

將人類語音作為數據進行處理的技術被稱為語音訊號處理，包括將語音轉換為文字的語音識別技術，以及將文字轉換為語音的語音合成技術等。過去，語音識別與語音合成在技術上具有挑戰性，實現實用的系統較為困難。然而，隨著AI技術的進步，近年來這些技術已被廣泛應用於多個領域。基於AI的技術自2011年起逐漸被積極研究，而特別是最近幾年的技術進展十分驚人，AI技術的內涵與幾年前相比發生了巨大變化。
本課題介紹語音識別以及其他相關語音技術的發展，並通過研究案例展示其應用。

【習得知識】
・語音的基礎知識
・AI技術概述
・利用AI技術進行語音識別及其他語音訊號處理
・語音訊號處理技術的應用

一、生活中的語音處理技術
二、語音介紹
2-1 語音的性質
2-2 語音的生成機制
2-3 共振峰（Formant）
2-4 音素種類
2-5 語音特徵
2-6 語音的感知
三、語音識別的核心技術
3-1 語音識別研究歷史
3-2 語音語料庫
3-3 語音訊號處理基礎
3-4 語音識別框架
3-5 利用音響模型與語言模型進行語音識別
3-6 深度學習
3-7 混合型音響模型
3-8 基於大規模預訓練模型的語音識別
四、AI 驅動的語音訊號處理
4-1 語音合成與聲質轉換
．語音合成
．聲質轉換
．情感語音合成
．歌聲合成
4-2 基於語音的情感識別
4-3 語音對話系統
．語音對話系統介紹
．VR空間中的代理人對話系統
．多模態對話系統

加入會員，掌握最新開課資訊

主題資料庫為公開展示，需透過公開課程或企業內訓方可報名上課。立即註冊會員，搶先收到此主題開班通知與專屬優惠。

免費註冊

有興趣將此主題導入貴單位？

三建可為企業規劃專屬內訓課程，含客製化大綱、講師派遣與教材配套。

聯絡我們

主題資料庫詳細內容

【日本專家】AI 語音識別技術發展

大綱內容

加入會員，掌握最新開課資訊

有興趣將此主題導入貴單位？

網站導覽

聯絡資訊

訂閱電子報

【日本專家】AI 語音識別技術發展 | 主題資料庫 | 三建產業資訊

主題資料庫詳細內容

【日本專家】AI 語音識別技術發展

大綱內容

加入會員，掌握最新開課資訊

有興趣將此主題導入貴單位？

網站導覽

聯絡資訊

訂閱電子報