Zum Hauptinhalt springen
Nicht aus der Schweiz? Besuchen Sie lehmanns.de

Collaborative Annotation for Reliable Natural Language Processing (eBook)

Technical and Sociological Aspects

(Autor)

eBook Download: EPUB
2016 | 1. Auflage
192 Seiten
John Wiley & Sons (Verlag)
978-1-119-30765-5 (ISBN)

Lese- und Medienproben

Collaborative Annotation for Reliable Natural Language Processing - Karen Fort
Systemvoraussetzungen
139,99 inkl. MwSt
(CHF 136,75)
Der eBook-Verkauf erfolgt durch die Lehmanns Media GmbH (Berlin) zum Preis in Euro inkl. MwSt.
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
This book presents a unique opportunity for constructing a consistent image of collaborative manual annotation for Natural Language Processing (NLP). NLP has witnessed two major evolutions in the past 25 years: firstly, the extraordinary success of machine learning, which is now, for better or for worse, overwhelmingly dominant in the field, and secondly, the multiplication of evaluation campaigns or shared tasks. Both involve manually annotated corpora, for the training and evaluation of the systems.

These corpora have progressively become the hidden pillars of our domain, providing food for our hungry machine learning algorithms and reference for evaluation. Annotation is now the place where linguistics hides in NLP. However, manual annotation has largely been ignored for some time, and it has taken a while even for annotation guidelines to be recognized as essential.

Although some efforts have been made lately to address some of the issues presented by manual annotation, there has still been little research done on the subject. This book aims to provide some useful insights into the subject.

Manual corpus annotation is now at the heart of NLP, and is still largely unexplored. There is a need for manual annotation engineering (in the sense of a precisely formalized process), and this book aims to provide a first step towards a holistic methodology, with a global view on annotation.

Karën Fort is Associate Professor at University Paris-Sorbonne (Paris 4) working on the STIH (meaning, text, computer science, history) team. Her current research interests include collaborative manual annotation, crowdsourcing and ethics.

Preface ix

List of Acronyms xi

Introduction xiii

Chapter 1. Annotating Collaboratively 1

1.1. The annotation process (re)visited 1

1.1.1. Building consensus 1

1.1.2. Existing methodologies 3

1.1.3. Preparatory work 7

1.1.4. Pre-campaign 13

1.1.5. Annotation 17

1.1.6. Finalization 21

1.2. Annotation complexity 24

1.2.1. Example overview 25

1.2.2. What to annotate? 28

1.2.3. How to annotate? 30

1.2.4. The weight of the context 36

1.2.5. Visualization 38

1.2.6. Elementary annotation tasks 40

1.3. Annotation tools 43

1.3.1. To be or not to be an annotation tool 43

1.3.2. Much more than prototypes 46

1.3.3. Addressing the new annotation challenges 49

1.3.4. The impossible dream tool 54

1.4. Evaluating the annotation quality 55

1.4.1. What is annotation quality? 55

1.4.2. Understanding the basics 56

1.4.3. Beyond kappas 63

1.4.4. Giving meaning to the metrics 67

1.5. Conclusion 75

Chapter 2. Crowdsourcing Annotation 77

2.1. What is crowdsourcing and why should we be interested in it? 77

2.1.1. A moving target 77

2.1.2. A massive success 80

2.2. Deconstructing the myths 81

2.2.1. Crowdsourcing is a recent phenomenon 81

2.2.2. Crowdsourcing involves a crowd (of non-experts) 83

2.2.3. "Crowdsourcing involves (a crowd of) non-experts" 87

2.3. Playing with a purpose 93

2.3.1. Using the players' innate capabilities and world knowledge 94

2.3.2. Using the players' school knowledge 96

2.3.3. Using the players' learning capacities 97

2.4. Acknowledging crowdsourcing specifics 101

2.4.1. Motivating the participants 101

2.4.2. Producing quality data 107

2.5. Ethical issues 109

2.5.1. Game ethics 109

2.5.2. What's wrong with Amazon Mechanical Turk? 111

2.5.3. A charter to rule them all 113

Conclusion 115

Appendix 117

Glossary 141

Bibliography 143

Index 163

Erscheint lt. Verlag 14.6.2016
Sprache englisch
Themenwelt Informatik Theorie / Studium Künstliche Intelligenz / Robotik
Schlagworte Computer Science • Informatik • Informationstechnologie • Information Technologies
ISBN-10 1-119-30765-1 / 1119307651
ISBN-13 978-1-119-30765-5 / 9781119307655
Informationen gemäß Produktsicherheitsverordnung (GPSR)
Haben Sie eine Frage zum Produkt?
EPUBEPUB (Adobe DRM)

Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belle­tristik und Sach­büchern. Der Fließ­text wird dynamisch an die Display- und Schrift­größe ange­passt. Auch für mobile Lese­geräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine Adobe-ID und die Software Adobe Digital Editions (kostenlos). Von der Benutzung der OverDrive Media Console raten wir Ihnen ab. Erfahrungsgemäß treten hier gehäuft Probleme mit dem Adobe DRM auf.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine Adobe-ID sowie eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Die Grundlage der Digitalisierung

von Knut Hildebrand; Michael Mielke; Marcus Gebauer

eBook Download (2025)
Springer Fachmedien Wiesbaden (Verlag)
CHF 29,30
Die materielle Wahrheit hinter den neuen Datenimperien

von Kate Crawford

eBook Download (2024)
C.H.Beck (Verlag)
CHF 17,55