> ## Documentation Index
> Fetch the complete documentation index at: https://veniceai-docs-revamp.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

# Speech-to-Text 모델

> 오디오를 텍스트로 전사하기 위한 음성 인식 모델

<div id="model-search-placeholder" data-filter="asr">Loading models...</div>

***

## 사용법

Speech-to-text 모델은 음성 오디오를 텍스트로 전사합니다. [Audio Transcriptions API](/api-reference/endpoint/audio/transcriptions)를 통해 액세스할 수 있습니다.

### 지원되는 오디오 형식

`mp3`, `mp4`, `mpeg`, `mpga`, `m4a`, `wav`, `webm`, `flac`, `ogg`

### 응답 형식

| 형식             | 설명                               |
| -------------- | -------------------------------- |
| `json`         | 기본값. `{ "text": "..." }`를 반환합니다. |
| `text`         | 일반 전사 텍스트.                       |
| `srt`          | 타임스탬프가 포함된 SubRip 자막 형식.         |
| `vtt`          | 타임스탬프가 포함된 WebVTT 자막 형식.         |
| `verbose_json` | 세그먼트 수준 타임스탬프와 메타데이터가 포함된 전체 응답. |

<Note>
  가격은 입력 오디오의 초당 청구됩니다. 요청 예제와 매개변수 세부 정보는 [Audio Transcriptions API](/api-reference/endpoint/audio/transcriptions)를 참조하세요.
</Note>
