OpenAI 翻译 Delphi 客户端

2023年4月9日 · 功能

将音频翻译为文字使用 OpenAI API 非常简单，只需上传以下格式之一的音频文件：mp3、mp4、mpeg、mpga、m4a、wav 或 webm。API 将把音频翻译成英文。

Delphi 翻译示例

OpenAI 要求构建一个请求，您需要传入音频文件、模型、温度（以获得或多或少的随机输出……以下是可用参数列表。

- Filename（文件名）：（必填）要转录的音频文件，格式为以下之一：mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
- Model（模型）：（必填）要使用的模型 ID。目前仅 whisper-1 可用。
- Prompt（提示）：可选文本，用于引导模型的风格或继续上一个音频片段。提示应与音频语言匹配。
- ResponseFormat（响应格式）：转录输出的格式，可选以下之一：json、text、srt、verbose_json 或 vtt。
- Temperature（温度）：采样温度，介于 0 和 1 之间。较高的值（如 0.8）将使输出更随机，而较低的值（如 0.2）将使输出更集中和确定性。如果设置为 0，模型将使用对数概率自动提高温度，直到达到某些阈值。

以下是使用 whisper-1 翻译音频文件的简单示例

procedure DoTranslateAudio(const aFileName: string);
var
  oRequest: TsgcOpenAIClass_Request_Translation;
  oResponse: TsgcOpenAIClass_Response_Translation;
begin
  oRequest := TsgcOpenAIClass_Request_Translation.Create;
  Try
    oRequest.Filename := aFileName;
    oRequest.Model := 'whisper-1';
    oResponse := OpenAI.CreateTranslationFromFile(oRequest);
    Try
      DoLog(oResponse.Text);
    Finally
      oResponse.Free;
    End;
  Finally
    oRequest.Free;
  End;
end;

以下是使用 sgcWebSockets OpenAI Delphi 库编译的 Windows 演示程序。