--- language: zh tags: - whisper - coreml - apple-neural-engine - speech-recognition - macos license: mit --- # Scribby CoreML Encoders 為 [逐字搞定(Scribby)](https://github.com/souminei/scribby) 預先編譯的 whisper.cpp CoreML encoder 模型,讓 macOS 裝置可以透過 **Apple Neural Engine (ANE)** 加速語音辨識。 ## 檔案說明 | 檔案 | 對應模型 | 大小 | 說明 | |------|---------|------|------| | `ggml-large-v3-encoder.mlmodelc.zip` | whisper large-v3 | ~1.1 GB | 最高精度 | | `ggml-large-v3-turbo-encoder.mlmodelc.zip` | whisper large-v3-turbo | ~1.1 GB | 快速、高精度 | ## 使用方式 這些檔案由 Scribby app 在首次啟動時自動下載,無需手動操作。 如需手動使用: ```bash # 下載 wget https://huggingface.co/souminei/scribby-coreml-encoders/resolve/main/ggml-large-v3-encoder.mlmodelc.zip # 解壓到 whisper.cpp models 目錄 unzip ggml-large-v3-encoder.mlmodelc.zip -d /path/to/whisper.cpp/models/ ``` ## 產生方式 1. 使用 `openai-whisper` Python 模型轉換為 CoreML `.mlpackage` 2. 使用 `coremltools.utils.compile_model()` 編譯為 `.mlmodelc` 轉換時使用 128 mel bins(`n_mels=128`)和輸入形狀 `(1, 128, 3000)`,對應 whisper large-v3 系列的規格。 ## 相容性 - macOS 13+ (Ventura 或更新) - Apple Silicon (M1/M2/M3/M4) - 搭配 [whisper.cpp](https://github.com/ggerganov/whisper.cpp) 使用(需開啟 `WHISPER_USE_COREML`) ## 授權 MIT License