Multimodal konuşma standart oluyor

GPT-4o artık tek istekte metin, ses ve görüntüyü birlikte işleyebiliyor. Bu sayede müşteri destek botları, bir ürünün fotoğrafını analiz edip aynı anda kullanıcının sesiyle konuşarak cevap verebiliyor.

Realtime API ile anlık etkileşim

Yeni Realtime API, WebRTC veya WebSocket üzerinden 400 ms altında yanıt veriyor. Çağrı merkezleri için canlı çeviri, toplantı uygulamaları için gerçek zamanlı özetler geliştirmek mümkün hale geliyor.

Hafif modellerle maliyeti kontrol edin

GPT-4o mini ve GPT-4o audio preview gibi hafif sürümler, yüksek hacimli isteklerde ciddi maliyet avantajı sağlıyor. Kritik anlarda büyük model, genel işlemlerde mini model kullanarak bütçeyi optimize edebilirsiniz.

Geliştiriciler için hazır araç seti

Functions, JSON mode ve Vision çıktıları tek endpoint altında toplandı. Bu da entegrasyon kodunu sadeleştiriyor, bakım maliyetini düşürüyor ve ürününüzü daha hızlı yayınlamanıza yardımcı oluyor.