API Realtime OpenAI

Parla con il modello OpenAI Realtime in millisecondi — audio e testo bidirezionali su un'unica sessione WebSocket, pilotata da Delphi/C++Builder.

TsgcWSAPI_OpenAI

Client WebSocket per l'API Realtime di OpenAI — ciclo di vita completo della sessione, function tools, streaming di frame audio ed eventi di trascrizione.

Classe del componente

TsgcWSAPI_OpenAI

Protocollo

OpenAI Realtime API

Piattaforme

Windows, macOS, Linux, iOS, Android

Edizione

Standard / Professional / Enterprise

Inserisci il componente, imposta la chiave API, parla

Abbinalo a TsgcWebSocketClient, imposta OpenAI.ApiKey e OpenAI.Model, quindi invia audio o testo e ascolta gli eventi di risposta.

uses
  sgcWebSocket, sgcWebSocket_API_OpenAI;

var
  WSClient: TsgcWebSocketClient;
  OpenAI: TsgcWSAPI_OpenAI;
begin
  WSClient := TsgcWebSocketClient.Create(nil);

  OpenAI := TsgcWSAPI_OpenAI.Create(nil);
  OpenAI.Client := WSClient;
  OpenAI.OpenAI.ApiKey := 'sk-...';
  OpenAI.OpenAI.Model  := 'gpt-realtime';

  WSClient.Active := True;

  // invia un turno di testo
  OpenAI.ConversationCreateMessageText('Hello', 'user');
  OpenAI.ResponseCreate;
end;
// uses: sgcWebSocket, sgcWebSocket_API_OpenAI
TsgcWebSocketClient *WSClient = new TsgcWebSocketClient(this);
TsgcWSAPI_OpenAI *OpenAI = new TsgcWSAPI_OpenAI(this);
OpenAI->Client = WSClient;
OpenAI->OpenAI->ApiKey = "sk-...";
OpenAI->OpenAI->Model  = "gpt-realtime";

WSClient->Active = true;
OpenAI->ConversationCreateMessageText("Hello", "user");
OpenAI->ResponseCreate();

Cosa contiene

Incapsula il gateway WebSocket OpenAI Realtime come componente Delphi tipizzato con helper per sessione, conversazione e audio.

Ciclo di vita della sessione

SessionUpdate applica le impostazioni di modalities, voice, instructions, input_audio_format, output_audio_format e turn_detection alla sessione Realtime attiva.

Elementi di conversazione

ConversationCreateMessageText e ConversationCreateMessageAudio inviano contenuti utente/sistema; ConversationItemDelete e ConversationItemTruncate rimodellano la cronologia in corso.

Streaming audio

InputAudioBufferAppend invia frame PCM (codificati in base64), InputAudioBufferCommit termina un turno utente. L'audio in uscita arriva come eventi response.audio.delta.

Function calling

Dichiara gli strumenti in SessionUpdate; gli argomenti arrivano come eventi response.function_call_arguments.delta, i risultati tornano tramite ConversationCreateFunctionCallOutput.

Voice activity detection

La VAD lato server (turn_detection: {type: server_vad}) rileva automaticamente la fine del parlato — il componente consegna ogni fase come evento dedicato.

Header di autenticazione

Il componente inietta gli header Authorization e OpenAI-Beta: realtime=v1 nell'handshake WebSocket. Abbina con TsgcWebSocketClient_WinHTTP su Windows per il TLS gestito dal sistema operativo.

Specifiche e riferimenti

Fonti autorevoli per le API che questo componente implementa.

Documentazione e demo

Collegamenti diretti al riferimento del componente, progetto demo pronto all'uso e download della versione di prova.

Guida online — API_OpenAI Riferimento completo di proprietà, metodi ed eventi di questo componente.
Versione di prova — sgcWebSockets Scarica il pacchetto di prova e inizia a inviare in streaming audio e testo Realtime nelle tue applicazioni Delphi.
Documento tecnico (PDF) Funzionalità, guida rapida, esempi di codice per Delphi e C++ Builder e riferimenti alle fonti primarie — solo questo componente.
Manuale utente (PDF) Manuale completo che copre ogni componente della libreria.

Pronto a usare OpenAI Realtime?

Scarica la versione di prova gratuita e aggiungi audio e testo AI in tempo reale alle tue applicazioni Delphi.