2018
DOI: 10.29130/dubited.330094
|View full text |Cite
|
Sign up to set email alerts
|

DocDig: Content Based Figure Search in Digitized Documents

Abstract: ÖZET Örüntü tanıma psikolojiden biyometriye, biyoenformatikten gen ifadelerinin analizine, trafikten hesaplamalı finansa kadar birçok alanda kullanılmaktadır. Optik Karakter Tanıma da bu alanlardan bir tanesidir. Kamu ve özel birçok firma, arşivlerindeki klasörlenmiş verilerini taratarak dijital hale getirmekte ve bunun için emek yoğun çalışmalar yapmaktadır. Ancak resim olarak sayısallaştırılan bu verilerin içerik olarak aranması ve işlenmesi ancak operatörlerin manuel olarak taranan resim verisine meta veri … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1

Citation Types

0
1
0
2

Year Published

2019
2019
2022
2022

Publication Types

Select...
4
1

Relationship

3
2

Authors

Journals

citations
Cited by 5 publications
(3 citation statements)
references
References 11 publications
0
1
0
2
Order By: Relevance
“…It simultaneously produced region proposals and embedded them into a word-embedding space in which searches were performed. Atay et al [41] developed an architecture that makes content-based figure searches possible on these scanned documents in large quantities. The user can search with some keywords and display related figures in digital documents with their captions.…”
Section: Related Workmentioning
confidence: 99%
“…It simultaneously produced region proposals and embedded them into a word-embedding space in which searches were performed. Atay et al [41] developed an architecture that makes content-based figure searches possible on these scanned documents in large quantities. The user can search with some keywords and display related figures in digital documents with their captions.…”
Section: Related Workmentioning
confidence: 99%
“…Doküman anlama genellikle taranmış dokümanlar/görüntüler üzerinde yapılmaktadır (Aiello, Monz, Todoran, & Worring, 2002;Altamura, Esposito, & Malerba, 2000;Eken, Atay, Sönmez & Sayar, 2018;Eken, Karabaş, Sarı & Sayar, 2018;Eken ve Sayar, 2013). Proje kapsamında, yapılan çalışmalardaki gibi biz de özgeçmiş PDF dokümanlarından isim, soy isim (kişisel bilgiler), iletişim bilgileri, eğitim durumu, iş tecrübesi deneyimler, referanslar, özel zevkler gibi metinsel nesneler ile kişi görüntüsü gibi görsel nesnelerin doküman içindeki konumlarıyla (düzen) tespit edilmesi ve XML formatında ilgili özgeçmişin ifade edilmesi gerçekleştirildi.…”
Section: Introductionunclassified
“…İlgilenilen bir diğer konu da PDF ve XML'in birbirlerine karşılıklı olarak dönüştürülebilmesidir. PDF dokümanlarından XML dokümanlarının elde edilmesindeki amaç indeksleme ve geri getirim yoluyla dokümanlar üzerinde yapılacak bir arama için arama uzayını (search space) daraltmaktır (Eken, Ekinci & Sayar, 2014). Bu tür çalışmalar literatürde "belge özetleme-söylem çıkarımı" olarak geçmektedir.…”
Section: Introductionunclassified