---
read_when:
    - Desea usar la conversión de voz a texto de SenseAudio para archivos adjuntos de audio
    - Necesitas la variable de entorno de la clave de API de SenseAudio o la ruta de configuración de audio
summary: Conversión por lotes de voz a texto de SenseAudio para notas de voz entrantes
title: SenseAudio
x-i18n:
    generated_at: "2026-05-06T09:06:09Z"
    model: gpt-5.5
    provider: openai
    source_hash: f53af21c746cdd44c71485cbad669f4a01a6e5be956675c73831e7b5f15df8c4
    source_path: providers/senseaudio.md
    workflow: 16
---

SenseAudio puede transcribir adjuntos de audio entrante y notas de voz mediante la canalización compartida `tools.media.audio` de OpenClaw. OpenClaw publica audio multiparte en el endpoint de transcripción compatible con OpenAI e inyecta el texto devuelto como `{{Transcript}}` más un bloque `[Audio]`.

| Propiedad     | Valor                                            |
| ------------- | ------------------------------------------------ |
| Id. del proveedor | `senseaudio`                                |
| Plugin        | incluido, `enabledByDefault: true`               |
| Contrato      | `mediaUnderstandingProviders` (audio)            |
| Variable de entorno de autenticación | `SENSEAUDIO_API_KEY`       |
| Modelo predeterminado | `senseaudio-asr-pro-1.5-260319`            |
| URL predeterminada | `https://api.senseaudio.cn/v1`               |
| Sitio web     | [senseaudio.cn](https://senseaudio.cn)           |
| Documentación | [senseaudio.cn/docs](https://senseaudio.cn/docs) |

## Primeros pasos

<Steps>
  <Step title="Set your API key">
    ```bash
    export SENSEAUDIO_API_KEY="..."
    ```
  </Step>
  <Step title="Enable the audio provider">
    ```json5
    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "senseaudio", model: "senseaudio-asr-pro-1.5-260319" }],
          },
        },
      },
    }
    ```
  </Step>
  <Step title="Send a voice note">
    Envía un mensaje de audio a través de cualquier canal conectado. OpenClaw sube el
    audio a SenseAudio y usa la transcripción en la canalización de respuesta.
  </Step>
</Steps>

## Opciones

| Opción     | Ruta                                  | Descripción                         |
| ---------- | ------------------------------------- | ----------------------------------- |
| `model`    | `tools.media.audio.models[].model`    | Id. del modelo ASR de SenseAudio    |
| `language` | `tools.media.audio.models[].language` | Indicio de idioma opcional          |
| `prompt`   | `tools.media.audio.prompt`            | Prompt de transcripción opcional    |
| `baseUrl`  | `tools.media.audio.baseUrl` o modelo  | Sobrescribe la base compatible con OpenAI |
| `headers`  | `tools.media.audio.request.headers`   | Encabezados de solicitud adicionales |

<Note>
SenseAudio es solo STT por lotes en OpenClaw. La transcripción en tiempo real de llamadas de voz
sigue usando proveedores con compatibilidad de STT en streaming.
</Note>

## Relacionado

- [Comprensión de medios (audio)](/es/nodes/audio)
- [Proveedores de modelos](/es/concepts/model-providers)