Zum Hauptinhalt springen
Nicht aus der Schweiz? Besuchen Sie lehmanns.de
Informationsextraktion von Webseiten via RoadRunner - Pawel Broda

Informationsextraktion von Webseiten via RoadRunner

(Autor)

Buch | Softcover
28 Seiten
2010 | 10004 A. 4. Auflage
GRIN Verlag
978-3-640-51864-7 (ISBN)
CHF 25,10 inkl. MwSt
  • Titel nicht im Sortiment
  • Artikel merken
Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik, Note: 1, Ludwig-Maximilians-Universität München (Centrum für Informations- und Sprachverarbeitung), Veranstaltung: Web Data Mining, Sprache: Deutsch, Abstract: Das Web hat sich in den letzten Jahren zum größten existierenden und frei verfügbaren Daten- und Informationsbestand entwickelt.
Im Netz, wo es ein absoluter Datenüberfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach benötigten Informationen wird durch unzählige Dokumente gestöbert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. Während die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert können, bleibt ein sehr großer Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zurückgeführt. Die gesuchten Informationen sind nicht mehr statisch verfügbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt.
In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden können. Im nächsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.
Erscheint lt. Verlag 1.2.2010
Sprache deutsch
Maße 148 x 210 mm
Gewicht 55 g
Themenwelt Mathematik / Informatik Informatik
Sozialwissenschaften Pädagogik Schulpädagogik / Grundschule
Sozialwissenschaften Pädagogik Schulpädagogik / Sekundarstufe I+II
Schlagworte extraktion von webseiten • extraktionvonwebseiten • information extraktion • informationextraktion • Informationretrieval • Information Retrieval • Informationsextraktion • Internet • Roadrunner • webdatamining • Web Data Mining • Webseiten • Wrapper
ISBN-10 3-640-51864-0 / 3640518640
ISBN-13 978-3-640-51864-7 / 9783640518647
Zustand Neuware
Informationen gemäß Produktsicherheitsverordnung (GPSR)
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich
für Kinder mit Down-Syndrom, Leseratten und Legastheniker

von Christel Manske

Buch | Softcover (2023)
Lehmanns Media (Verlag)
CHF 27,90
wie Lehrer, Eltern und Schüler guten Unterricht gestalten

von Christoph Eichhorn

Buch | Softcover (2024)
Klett-Cotta (Verlag)
CHF 33,55
Unterrichtsstörungen, Beleidigungen und Gewalt erfolgreich eingrenzen

von Christoph Eichhorn

Buch | Softcover (2025)
Klett-Cotta (Verlag)
CHF 30,80