@phdthesis{Risse2011, type = {Master Thesis}, author = {Sarah Risse}, title = {Web Content Mining nach Informationen zu wissenschaftlich t{\"a}tigen Personen im Umfeld der Informationswissenschaft}, url = {https://nbn-resolving.org/urn:nbn:de:gbv:hil2-opus-985}, pages = {102}, year = {2011}, abstract = {In der vorliegenden Arbeit wird ein Verfahren zur Suche nach Informationen zu Wissenschaftlern prototypisch f{\"u}r den Bereich der Informationswissenschaft entwickelt, in welchem Ans{\"a}tze des Web Content Mining eingesetzt werden. Zun{\"a}chst werden M{\"o}glichkeiten und Probleme der Informationssuche im Web aufgezeigt, sowie verschiedene Verfahren des Web Content Mining beschrieben. Das entwickelte Verfahren verwendet online Publikationsdienste und pers{\"o}nliche Homepages der Wissenschaftler als Quellen. Zur Suche in den Publikationsdiensten und der Informationsextraktion aus ihren Ergebnisseiten werden Wrapper konstruiert. Des Weiteren werden Methoden zur Informationsextraktion aus den Homepages implementiert, die auf Heuristiken zu Struktur und Aufbau der Seiten beruhen. F{\"u}r die Suche nach pers{\"o}nlichen Homepages von Informationswissenschaftlern wird ein spezialisiertes Suchverfahren entwickelt. Das Verfahren wird in einer Java-Applikation implementiert und anschlie{\"s}end evaluiert, um das Potenzial des gew{\"a}hlten Ansatzes zu untersuchen.}, language = {de} }