Semantic and Interactive Content-based Image Retrieval - Björn Barz

Semantic and Interactive Content-based Image Retrieval (eBook)

Björn Barz (Autor)

eBook Download: EPUB | PDF

2020 | 1. Auflage
322 Seiten
Cuvillier Verlag
9783736963467 (ISBN)

Content-based Image Retrieval (CBIR) ist ein Verfahren zum Auffinden von Bildern in großen Datenbanken wie z. B. dem Internet anhand ihres Inhalts. Ausgehend von einem vom Nutzer bereitgestellten Anfragebild, gibt das System eine sortierte Liste ähnlicher Bilder zurück. Der Großteil moderner CBIR-Systeme vergleicht Bilder ausschließlich anhand ihrer visuellen Ähnlichkeit, d.h. dem Vorhandensein ähnlicher Texturen, Farbkompositionen etc. Jedoch impliziert visuelle Ähnlichkeit nicht zwangsläufig auch semantische Ähnlichkeit. Zum Beispiel können Bilder von Schmetterlingen und Raupen als ähnlich betrachtet werden, weil sich die Raupe irgendwann in einen Schmetterling verwandelt. Optisch haben sie jedoch nicht viel gemeinsam. Die vorliegende Arbeit stellt eine Methode vor, welche solch menschliches Vorwissen über die Semantik der Welt in Deep-Learning-Verfahren integriert. Als Quelle für dieses Wissen dienen Taxonomien, die für eine Vielzahl von Domänen verfügbar sind und hierarchische Beziehungen zwischen Konzepten kodieren (z.B., ein Pudel ist ein Hund ist ein Tier etc.). Diese hierarchiebasierten semantischen Bildmerkmale verbessern die semantische Konsistenz der CBIR-Ergebnisse im Vergleich zu herkömmlichen Repräsentationen und Merkmalen erheblich. Darüber hinaus werden drei verschiedene Mechanismen für interaktives Image Retrieval präsentiert, welche die den Anfragebildern inhärente semantische Ambiguität durch Einbezug von Benutzerfeedback auflösen. Eine der vorgeschlagenen Methoden reduziert das erforderliche Feedback mithilfe von Clustering auf einen einzigen Klick, während eine andere den Nutzer kontinuierlich involviert, indem das System aktiv nach Feedback zu denjenigen Bildern fragt, von denen der größte Erkenntnisgewinn bezüglich des Relevanzmodells erwartet wird. Die dritte Methode ermöglicht dem Benutzer die Auswahl besonders interessanter Bildbereiche zur Fokussierung der Ergebnisse. Diese Techniken liefern bereits nach wenigen Feedbackrunden deutlich relevantere Ergebnisse, was die Gesamtmenge der abgerufenen Bilder reduziert, die der Benutzer überprüfen muss, um relevante Bilder zu finden. Content-based image retrieval (CBIR) aims for finding images in large databases such as the internet based on their content. Given an exemplary query image provided by the user, the retrieval system provides a ranked list of similar images. Most contemporary CBIR systems compare images solely by means of their visual similarity, i.e., the occurrence of similar textures and the composition of colors. However, visual similarity does not necessarily coincide with semantic similarity. For example, images of butterflies and caterpillars can be considered as similar, because the caterpillar turns into a butterfly at some point in time. Visually, however, they do not have much in common. In this work, we propose to integrate such human prior knowledge about the semantics of the world into deep learning techniques. Class hierarchies serve as a source for this knowledge, which are readily available for a plethora of domains and encode is-a relationships (e.g., a poodle is a dog is an animal etc.). Our hierarchy-based semantic embeddings improve the semantic consistency of CBIR results substantially compared to conventional image representations and features. We furthermore present three different mechanisms for interactive image retrieval by incorporating user feedback to resolve the inherent semantic ambiguity present in the query image. One of the proposed methods reduces the required user feedback to a single click using clustering, while another keeps the human in the loop by actively asking for feedback regarding those images which are expected to improve the relevance model the most. The third method allows the user to select particularly interesting regions in images. These techniques yield more relevant results after a few rounds of feedback, which reduces the total amount of retrieved images the user needs to inspect to find relevant ones.

Erscheint lt. Verlag	23.12.2020
Sprache	englisch
Themenwelt	Mathematik / Informatik ► Informatik
ISBN-13	9783736963467 / 9783736963467

Informationen gemäß Produktsicherheitsverordnung (GPSR)
Haben Sie eine Frage zum Produkt?

EPUB (Adobe DRM)

Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine Adobe-ID und die Software Adobe Digital Editions (kostenlos). Von der Benutzung der OverDrive Media Console raten wir Ihnen ab. Erfahrungsgemäß treten hier gehäuft Probleme mit dem Adobe DRM auf.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine Adobe-ID sowie eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

PDF (Wasserzeichen)
Größe: 24,8 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Print-Ausgabe

Buch | Buch

CHF 147,65