# Dify + Whisper Asr Webservice **這邊假設你已經成功啟動dify的服務** * [Whisper Asr Webservice](https://ahmetoner.com/whisper-asr-webservice/) * [Dify的dsl](https://github.com/shaoeChen/Dify-DSL/blob/main/dsl/Workflow_Speech%20To%20Text.yml) Whisper Asr Webservice是一個很方便的工具,因為作者已經幫忙把語音轉文字的服務API化,對於應用端來說只要做常規的API呼叫就可以滿足應用上的需求。 ## 啟動Whisper Asr Webservice 啟動服務最快的方法就是docker: ```shell= docker run -d -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest ``` ```shell= docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu ``` 不過要注意自己的cuda版本是否有對應,如果最新版的無法啟動的話就要降版,這取決於你的硬體設備。 ## Openapi設置 成功啟動docker container之後,可以直接連接到應網頁,http://你的ip:9000/docs 沒意外的話你會看到下圖:  點擊上圖紅框處的`openapi.json`,系統會開立一個新的視窗,一堆的json格式的字串,複製出來之後,拿到你喜歡的平台去做排版,排版之後我們要做兩個處理,這樣才能成功在dify中引用: 1. 在`info`與`path`的中間加入`servers`  2. 修正`requestBody`中的`content-type`,原本是`multipart/form-data`,修正為`multipart/form-data; boundary=----WebKitFormBoundarydzemBAPhdeDfTCfR`  :::info 更多關於模型的選擇與細部配置請自行參考Whisper Asr Webservice官方文件說明。 ::: ## Dify - 自定義工具設置 進入Dify之後,我們就可以自定義工具,首先點擊工具:  點擊自定義之後,點擊建立自定義工具:  自己定義名稱,然後將剛剛調整的openapi貼上,就可以成功建立一個自定義工具:  ## Dify - 應用流程開發 現在,你已經可以直接在dify的workflow中取用自定義的語音轉文字的工具:  把一些參數設置一下:  測試應用:  把取到的文字再弄成問答集: ``` 問題:客戶在聯絡退稅服務時需要提供哪些信息? 答案:當客戶聯繫退稅服務時,他們需要先將退稅輔導單的背面展示給客服人員。這是因為背面上有重要的信息如退稅編號,而該編號是核實和處理退稅事宜的關鍵資訊之一。此外,客戶還需告知他們想將退稅款轉入的帳戶號碼,以便在核准退稅後正確地入帳。 問題:退稅作業需要多久時間? 答案:退稅的整個作業過程大約需要一個星期的時間。這段時間內,相關部門會處理客戶提供的信息,完成核對和審批程序。 問題:退稅款入帳後會如何通知客戶? 答案:一旦退稅款成功入帳到客戶指定的帳戶中,相關單位將透過簡訊的方式向客戶發出通知。這樣可以讓客戶即時了解退稅款項處理的情況。 問題:如果客戶需要查詢或提供退稅相關信息,應如何聯繫? 答案:客戶若需查詢或提供退稅相關資訊時,可以直接致電服務中心。在通話過程中,客服人員會引導客戶展示退稅輔導單的背面以取得所需信息,並記錄下客戶想要轉入的帳戶號碼等詳細資料。 問題:客服人員在接獲退稅請求時通常會有何反應? 答案:根據提供的文本內容,客服人員表現出專業且友善的態度。他們會告知客戶如何取得退稅編號,需求收集轉入帳戶的信息,並確認已記錄下所有必要資料後表示感謝。此外,客服人員也會鼓勵客戶耐心等待退稅作業完成,並祝願他們一切順利。 ``` 有興趣的話,可以再把問答集轉成主持人與來賓的對話,那就是一個podcast了。 如果是公司會議記錄,就可以讓與會人員每天聽聽老闆愛的盯寧了。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up