Vertaling OpenAI Delphi-client (4 / 5)

· Functies

Audio vertalen naar tekst is heel eenvoudig met de OpenAI-API; upload een audiobestand in een van de volgende formaten: mp3, mp4, mpeg, mpga, m4a, wav of webm. En de API vertaalt de audio naar het Engels.

Vertaling Delphi-voorbeeld

OpenAI vereist het opbouwen van een request waarin je het audiobestand, het model en de temperatuur meegeeft (om een meer of minder willekeurige output te krijgen...). Vind hieronder een lijst met de beschikbare parameters.

- Filename: (Vereist) Het audiobestand om te transcriberen, in een van deze formaten: mp3, mp4, mpeg, mpga, m4a, wav of webm.
- Model: (Vereist) ID van het te gebruiken model. Momenteel is alleen whisper-1 beschikbaar.
- Prompt: Een optionele tekst om de stijl van het model te sturen of een eerder audiosegment voort te zetten. De prompt moet overeenkomen met de audiotaal.
- ResponseFormat: Het formaat van de transcript-uitvoer, in een van deze opties: json, text, srt, verbose_json of vtt.
- Temperature: De sampling-temperatuur, tussen 0 en 1. Hogere waarden zoals 0.8 maken de uitvoer willekeuriger, terwijl lagere waarden zoals 0.2 deze meer gefocust en deterministisch maken. Indien ingesteld op 0, gebruikt het model log-waarschijnlijkheid om de temperatuur automatisch te verhogen tot bepaalde drempels worden bereikt.


Vind hieronder een eenvoudig voorbeeld dat een audiobestand vertaalt met whisper-1


procedure DoTranslateAudio(const aFileName: string);
var
  oRequest: TsgcOpenAIClass_Request_Translation;
  oResponse: TsgcOpenAIClass_Response_Translation;
begin
  oRequest := TsgcOpenAIClass_Request_Translation.Create;
  Try
    oRequest.Filename := aFileName;
    oRequest.Model := 'whisper-1';
    oResponse := OpenAI.CreateTranslationFromFile(oRequest);
    Try
      DoLog(oResponse.Text);
    Finally
      oResponse.Free;
    End;
  Finally
    oRequest.Free;
  End;
end; 

Vind hieronder de gecompileerde demo voor Windows met de sgcWebSockets OpenAI Delphi-bibliotheek.