Transcription OpenAI Delphi Client (3 / 5)

· Özellikler

Sesi Metne Dönüştürmek ( Konuşmadan Metne olarak da bilinir) OpenAI API'si kullanılarak çok kolaydır; yalnızca şu biçimlerden birinde bir Ses dosyası yükleyin: mp3, mp4, mpeg, mpga, m4a, wav veya webm. API ise dizeyi döndürür.

Transkripsiyon Delphi Örneği

OpenAI, ses dosyasını, modeli ve sıcaklığı (az çok rastgele bir çıktı elde etmek için) ilettiğiniz bir istek oluşturmanızı gerektirir... kullanılabilir parametrelerin bir listesini aşağıda bulabilirsiniz.

- Filename: (Zorunlu) Şu biçimlerden birinde, transkripsiyonu yapılacak ses dosyası: mp3, mp4, mpeg, mpga, m4a, wav veya webm.
- Model: (Zorunlu) Kullanılacak modelin kimliği. Şu anda yalnızca whisper-1 kullanılabilir.
- Prompt: Modelin stilini yönlendirmek veya önceki bir ses segmentini sürdürmek için isteğe bağlı bir metin. İstem, sesin diliyle eşleşmelidir.
- ResponseFormat: Transkript çıktısının biçimi, şu seçeneklerden birinde: json, text, srt, verbose_json veya vtt.
- Temperature: 0 ile 1 arasındaki örnekleme sıcaklığı. 0,8 gibi daha yüksek değerler çıktıyı daha rastgele hale getirir, 0,2 gibi daha düşük değerler ise daha odaklı ve belirleyici hale getirir. 0 olarak ayarlanırsa, model belirli eşiklere ulaşılana kadar sıcaklığı otomatik olarak artırmak için log olasılığını kullanır.
- Language: Giriş sesinin dili. Giriş dilini ISO-639-1 biçiminde sağlamak doğruluğu ve gecikmeyi iyileştirir.


whisper-1 kullanarak bir ses dosyasının transkripsiyonunu yapan basit bir örneği aşağıda bulabilirsiniz

procedure DoFileTranscription(const aFilename: string);
var
  oRequest: TsgcOpenAIClass_Request_Transcription;
  oResponse: TsgcOpenAIClass_Response_Transcription;
begin
  oRequest := TsgcOpenAIClass_Request_Transcription.Create;
  Try
    oRequest.Filename := aFilename;
    oRequest.Model := 'whisper-1';
    oResponse := OpenAI.CreateTranscriptionFromFile(oRequest);
    Try
      DoLog(oResponse.Text);
    Finally
      oResponse.Free;
    End;
  Finally
    oRequest.Free;
  End;
end; 

 sgcWebSockets OpenAI Delphi Kütüphanesini kullanan Windows için derlenmiş Demo'yu aşağıda bulabilirsiniz.