Cognitive
Cognitive
Aktiviteler
Color Detection
Bu aktivite, verilen bir görsel üzerinde bulunan renkleri analiz ederek, en çok kullanılan renkleri bir collection (liste) formatında değişkene aktarmak için kullanılır. Renk istatistiği çıkarmak, belirli renkleri filtrelemek veya renk ağırlıklı analiz yapmak için kullanılır.
Kullanım Senaryoları:
- Görselde en baskın renklerin tespit edilmesi
- Logo, ürün görseli gibi alanlarda marka renklerinin analiz edilmesi
- Renk eşleştirme veya filtreleme yapılması
- Görsel üzerinde belirli renklerin var olup olmadığının kontrol edilmesi
- Görsel kalite ya da format farklılıklarının tespiti
Parametreler:
- Image Path: İşlem yapılacak görselin tam dosya yoludur. Manuel olarak girilebilir. Örnek: “C:\Images\ornek.png”
- Path Choose: Görsel dosyasının kullanıcı tarafından arayüz üzerinden seçilmesini sağlar.
- Top Count: Görselde kaç farklı rengin analiz edilip döndürüleceğini belirtir. Örnek: “20” → En çok kullanılan ilk 20 rengi getirir.
- Distinct:Bu parametre True olarak seçilirse benzersiz renkler filtrelenir (tekrarlar alınmaz). Örnek: Sadece farklı renk tonları listelenir.
- Excluded Colors: İstenmeyen renkleri dışlamak için kullanılır. Renkler RGB ya da Hex formatında yazılır ve ; ile ayrılır. Örnek: “255,255,255;0,0,0” → Beyaz ve siyah hariç tüm renkler analiz edilir.
Duckling Get
Bu aktivite, bir metin içindeki tarih, zaman, sayı, para birimi, ölçü birimi, miktar, süre gibi anlamlı ifadeleri tanır ve yapılandırılmış verilere dönüştürür. Duckling, doğal dil işleme (NLP) için kullanılan bir açık kaynak aracıdır.
Kullanım Senaryoları:
- Kullanıcıdan alınan serbest metinlerde geçen parasal değer, tarih veya süre bilgisini ayrıştırmak
- Form alanlarına yazılmış karışık metinleri anlamlı parçalara ayırmak
- Chatbot, form analizi, belge işleme gibi uygulamalarda veri çıkarımı yapmak
- Doğal dildeki sayısal veya tarihsel verilerin yapısal hale getirilmesi
Parametreler:
- Base Adress: Duckling sunucusunun bağlantı adresi.Örnek: “http://172.20.163.92:8000/parse”
- Locale: Dil ve ülke formatı. Örnek: “en_GB” → İngilizce (İngiltere), “tr_TR” → Türkçe
- Text: Analiz edilecek düz metin verisi. Örnek: “45$” veya “12 Ocak 2025, saat 14:30”
Örnek Output:
Aşağıdaki örnek, “45$” ifadesine göre oluşabilecek çıkışları gösterir:
- Body: Orijinal metin → “45$”
- Value: Sayı değeri → “45”
- Unit: Para birimi → “$”
- Dimension: Veri tipi → “amount-of-money”
- Normalized Value: Dönüştürülmüş sayısal karşılık → “45”
- Normalized Unit: Standart birim → “USD” (örnek)
- Values: Tüm tespit edilen değerlerin listesi (collection olarak)
Extract Images From PDF
Bu aktivite, bir PDF dosyası içerisindeki gömülü resimleri çıkartarak, belirlenen hedef klasöre istenen formatta kaydetmek için kullanılır. Ayrıca, çıkartılan toplam resim sayısı da output üzerinden alınabilir ve süreçte kullanılabilir.
Kullanım Senaryoları:
- PDF raporlarından ya da formlardan resimlerin alınması
- Görsel içerikli belgelerdeki medyanın ayrıştırılması
- Dökümanlarda yer alan imzaların, grafiklerin veya tabloların dışa aktarımı
- Otomatik arşivleme veya doğrulama sistemlerinde görsel kaydı oluşturma
Parametreler:
- Pdf Path: PDF dosyasının manuel olarak yazılan tam yolu (örnek: “C:\Belgeler\ornek.pdf”).
- Pdf Path Choose: PDF dosyasını arayüz üzerinden seçmek için kullanılır.
- Image Path: Görsellerin kaydedileceği klasörün tam yolu (örnek: “C:\Belgeler\Resimler”).
- Image Path Choose: Görsellerin kaydedileceği klasörü arayüzden seçmek için kullanılır.
- Image Name: Kaydedilecek görsellere verilecek dosya adı (otomatik sıra numarası eklenir: resim1.png, resim2.png).
- Pdf Password: PDF şifreliyse parola girilir, değilse boş bırakılır.
- Start Page: Başlangıç sayfa numarası (örnek: 1).
- End Page: Bitiş sayfa numarası (örnek: 5).
- Save As Type: Görsellerin kaydedileceği format (“bmp”, “tiff”, “jpeg”, “gif”, “png”, “vmf”).
Fix Low Quality PDF
Fix Low Quality PDF aktivitesi, görüntü kalitesi düşük olan PDF türündeki dosyaların çözünürlüğünü arttırma işleminde kullanılmaktadır. Düşük çözünürlüğün bulunduğu PDF’in path bilgisi ilk satıra, işlem sonrasında oluşacak PDF dosyasının path bilgisi de ikinci satıra yazılır. Eğer isterseniz PDF Path Choose ve Fixed PDF Path Choose satırlarını kullanarak dosya ve klasör seçimi yapabilirsiniz.
Image to Text
Image to Text aktivitesiyle, görsel üzerindeki metinsel ve sayısal ifadeleri bir değişkene aktarabilirsiniz.
Location From Image
Location From Image aktivitesi ile input’ta verilen resim içerisinde yer alan konum bilgisinden adres çıktısı alabilirsiniz. Bu özelliğin kullanılabilmesi için çekilen resmin GPS verisi resmin özellikleri içerisinde yer almalıdır. URL parametresine herhangi bir web sitesinden GPS verisi açık olan bir resim eklenerek yapılabilir. Api Key parametresine, https://developers.google.com/maps/ adresinden Geocoding API kısmından elde edilecek API Key girilmelidir.
Örneğin; aşağıdaki resim için aktivite çalıştırıldığında elde edilen sonuç bu şekilde olacaktır.
Object Detection
Object Detection aktivitesiyle, Path Choose ya da Path satırlarını kullanılarak seçilen bir resmin nesne tespitini yapabilirsiniz. Resim içerisindeki tüm objelerin; isim, oran ve konum bilgilerini İngilizce dilinde bulabilirsiniz.
Aşağıdaki görsel için nesne tespiti yapıldığında elde edilen sonuçlar bu şekilde olacaktır.
PDF To Excel
PDF To Excel aktivitesiyle, PDF’lerinizi excel formatına çevirebilirsiniz.
Not: Excel formatına çevirmek istediğiniz pdf’lerinizin dijital ortamda hazırlanmış olması ve kalitesi önemlidir.
PDF To Text
Belirtilen PDF dosyasının içeriğinde yer alan metinleri okuyarak bir değişkene aktarmak için kullanılır. Sayfa bazlı çalışabilir ve içerikleri doğrudan metin formatında çıkarır.
Kullanım Senaryoları:
- PDF fatura, sözleşme veya formlarındaki verileri otomatik olarak okumak
- Tarama yapılmış PDF’lerden anlamlı metinler çıkarmak
- OCR gerekmeden doğrudan yazılı metni çekmek
- Belirli bir sayfadaki bilgileri işlemek veya analiz etmek
Parametreler:
- Path: İşlem yapılacak PDF dosyasının tam dosya yolu
- Path Choose: PDF dosyasının arayüz üzerinden seçilmesini sağlar.
- Page: Metnin alınacağı sayfa numarası (örn: “1”)
- Language : Dil seçimi.
- PDF Crop : PDF üzerinde belirli bir koordinat (bölge) seçilerek yalnızca o alandaki metnin alınmasını sağlar.
- Delay Time : İşlem başlamadan önce bekleme süresi (milisaniye cinsinden).
Dikkat Edilmesi Gerekenler:
- PDF dosyası yazı içerikli olmalı; görüntü tabanlı içerikler için OCR gerekebilir.
- Sayfa numarası doğru verilmezse çıktı boş olabilir.
- Çok sütunlu metinlerde içerik hizası bozulabilir.
- Büyük dosyalarda işlem süresi artabilir.
Text Translate
Text Translate aktivitesiyle, girilen metni istenilen dile çevirebilirsiniz. Bunun için çevrilmesi istenilen metni girip, kaynak dil ve hedef dil satırlarında seçim yapmanız yeterli olacaktır.