Rate Limits¶
Visão Geral¶
A API Pontotel implementa rate limiting para garantir disponibilidade e performance para todos os clientes.
O que é Rate Limiting?
Rate limiting é uma técnica que limita o número de requisições que um cliente pode fazer em um período de tempo específico.
Limites Atuais¶
| Ambiente | Limite | Janela | Burst |
|---|---|---|---|
| Sandbox | 1000 requisições | 1 hora | 100/min |
| Produção | 500 requisições | 1 hora | 50/min |
Headers de Rate Limit¶
Cada resposta da API inclui headers informativos:
| Header | Descrição |
|---|---|
X-RateLimit-Limit | Limite total de requisições |
X-RateLimit-Remaining | Requisições restantes |
X-RateLimit-Reset | Timestamp (Unix) quando o limite reseta |
Resposta 429 (Too Many Requests)¶
Quando o limite é excedido:
| JSON | |
|---|---|
Status Code: 429 Too Many Requests
Header adicional:
| HTTP | |
|---|---|
Boas Práticas¶
1. Monitorar Headers¶
2. Implementar Retry com Backoff¶
3. Cache de Respostas¶
Reduza requisições armazenando respostas em cache:
4. Batch de Requisições¶
Agrupe múltiplas operações quando possível:
| Python | |
|---|---|
5. Paginação Eficiente¶
Use paginação para evitar requisições desnecessárias:
Aumentar Limites¶
Se você precisa de limites maiores:
- Entre em contato com o suporte comercial
- Apresente seu caso de uso
- Considere upgrade de plano
Planos Enterprise
Planos enterprise oferecem:
- Rate limits personalizados
- Burst maior
- SLA garantido
- Suporte prioritário
Monitoramento¶
Dashboard Recomendado¶
Monitore métricas importantes:
- Requisições por hora
- Taxa de erro 429
- Tempo médio de resposta
- Percentual de uso do rate limit
Alertas¶
Configure alertas para:
- 80% do rate limit atingido
- Erros 429 consecutivos
- Tempo de resposta > 2s