把聲音變成可以「看見」的資料:迪威智能技術串聯 Epson,拓展生產力工具新場景


在 2025 Epson 創新大賽中,迪威智能(DeepWave)以「Sound Jet — 讓聲音看得見」為題,結合自家 AI 技術與 Epson Connect API,提出聲音資料的創新應用。此次展示整合了會議摘要平台 Meeting Ink 與數位樂譜服務 TuneJet,將語音、摘要與知識管理,從數位轉化為紙本資料,並以 Epson 穩定的硬體輸出環境完成落地,最終獲得銀牌肯定。
聲音資訊雖即時豐富,卻也最容易消逝。我們提出的核心問題是:如何讓『聲音』得以被閱讀、回顧,甚至成為可互動的資料?對於仰賴語音作業的使用者——例如會議紀錄者、鋼琴練習者或教學單位來說,他們不只需要「聽懂」,更希望「記得」與「活用」。這正是 Epson 與迪威智能技術結合的契合點:一端提供聲音的結構化與摘要,一端實現實體輸出與使用現場的回應,讓語音資訊真正融入生產與學習流程中。
🧠 從測試轉譜開始:技術的驗證與發展
這次的系統整合,不是一蹴可幾的設計,而是從最小原型逐步驗證而來。早期我們曾推出 PopPianoAI,嘗試將音樂轉成 MIDI,卻發現尚無法直接對應樂譜使用情境。於是團隊加入節奏量化、轉調偵測、左右手分軌等演算法,讓含人聲與各種樂器的流行歌曲能轉為更實用的 MusicXML 樂譜,成功搭建出可營運的原型。
接著,我們投入 Discord 社群經營、問卷調查、網站導引與付費測試,實際驗證技術的採納意願與使用動機,也快速釐清了市場輪廓;整個實驗階段只動用了 1 位工程師與 1 個月以內的時間。這段過程讓我們更確信:與其追求模型極致,不如聚焦在可被驗證、可產出價值的應用場景。也因此,當我們將這套技術擴展成完整服務 TuneJet 並結合 Epson Connect API 時,已經不只是技術整合,而是一套從底層驗證開始、走入實際場域的應用範式。

🎼 將聲音應用多元轉化:從語音摘要到樂譜輸出
迪威這次的展示,也體現聲音資料的多重面貌。除了會議記錄與知識整理,我們也展示了語音轉譯為鋼琴樂譜的應用場景。對音樂創作者與教育者來說,這項服務提供了一個結合 AI 與紙本的橋梁,讓聽覺資料能快速變成視覺化的學習工具。透過 Epson 高解析列印技術,紙本樂譜不只是結果,更是記憶與創作過程的一部分。我們相信,聲音的資料化應該走入更多元的日常情境。
🧭 超越聲音的智慧助手:從生產力場景,到決策幕僚的延伸
這次技術展示的價值,不只體現在聲音處理與輸出,更是我們對 AI 工具角色的一種重新詮釋。迪威智能所打造的系統,不只是「處理資料」的工具,而是如幕僚般的輔助角色,協助使用者整理思緒、記錄流程、提煉決策依據。從娛樂實驗出發、走入企業應用,我們希望未來能與更多合作夥伴共創,無論是語音、文字或影音資料,只要存在於組織知識的網絡裡,我們都願意成為將資訊轉化為智慧的橋梁。
競賽現場提報紀錄(Meeting Ink 範例)
更多參賽新聞參考