Neden yapay zeka ve OCR?
Yapay zeka, gün geçtikçe hayatımızın vazgeçilmez bir parçası haline geliyor. Artık yalnızca bir teknoloji trendi değil, çağımızın gerekliliği. Çünkü büyük bir iş yükünü, saatler harcatmadan çok daha hızlı bir şekilde çözüme ulaştırabiliyor.
OCR nedir?
OCR (Optik Karakter Okuma), görsel metin tanıma sistemidir. Kimlik kartlarını, faturaları, çeşitli belgeleri, el yazılarını ve basılı metinleri tarayıp metni dijital ortama aktarabilir.
Klasik görselden metin çıkarma ile OCR servisi arasındaki fark
Bir faturayı ChatGPT, DeepSeek veya başka bir yapay zekaya görsel olarak yükleyip metni okuyabilirsiniz. Ancak OCR servislerinde fark şurada başlar:
- Çıktıyı düz metin yanında, alanlara ayrılmış biçimde JSON formatında alabilirsiniz.
- Bu yapılandırılmış çıktı, mevcut sistemlerinize (ERP, muhasebe, doküman yönetimi gibi) entegre etmeyi çok daha kolay hale getirir.
Huawei Cloud OCR nasıl çalışıyor?
Huawei, doğruluk oranını yüksek tutmak için CNN ve LSTM temelli yapay zeka modellerinden yararlanır. Bu yaklaşım, karmaşık veya düşük kaliteli görsellerde bile tanıma başarımını artırabilir.
OCR servisi API tabanlıdır. RESTful API ile Python, Java veya PHP tabanlı sistemlere entegrasyon genellikle oldukça rahattır.
Demo: Experience Center üzerinden test edelim
- İlk olarak, Huawei Cloud Experience Center sayfasına gidin.

Experience Center giriş ekranı - Karşınıza çıkan “Ücretsiz Dene” butonuna tıklayın.
- Experience Center içinde aşağı tarafta farklı demo seçeneklerini göreceksiniz.
- Demolar üzerinden OCR’ı test edebilirsiniz.
- Ya da kendi belgenizi yükleyerek sonuçları görebilirsiniz.

OCR sonucu JSON olarak görüntülenebilir
Yukarıdaki örnekte de görüldüğü gibi, taranan belge çıktısı JSON formatında dışa aktarmaya hazır hale gelir.
Bölge (Region) bilgisi
Son olarak servis şu bölgelerde kullanılabilir:
- AP-Singapore
- CN Hong Kong
- AP-Bangkok
- AF-Johannesburg
- LA-Mexico City2
- LA-Santiago
