> ## Documentation Index
> Fetch the complete documentation index at: https://veniceai-docs-revamp.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

# Modelli Speech-to-Text

> Modelli di riconoscimento vocale per trascrivere audio in testo

<div id="model-search-placeholder" data-filter="asr">Loading models...</div>

***

## Utilizzo

I modelli speech-to-text trascrivono l'audio parlato in testo scritto. Si accede tramite l'[API Audio Transcriptions](/api-reference/endpoint/audio/transcriptions).

### Formati audio supportati

`mp3`, `mp4`, `mpeg`, `mpga`, `m4a`, `wav`, `webm`, `flac`, `ogg`

### Formati di risposta

| Formato        | Descrizione                                                       |
| -------------- | ----------------------------------------------------------------- |
| `json`         | Predefinito. Restituisce `{ "text": "..." }`.                     |
| `text`         | Testo trascritto in chiaro.                                       |
| `srt`          | Formato sottotitoli SubRip con timestamp.                         |
| `vtt`          | Formato sottotitoli WebVTT con timestamp.                         |
| `verbose_json` | Risposta completa con timestamp a livello di segmento e metadati. |

<Note>
  I prezzi sono fatturati per secondo di audio in input. Consulta l'[API Audio Transcriptions](/api-reference/endpoint/audio/transcriptions) per esempi di richiesta e dettagli sui parametri.
</Note>