(Pre-)Scientific Information Retrieval and Wikipedia

(Vor-)Wissenschaftlich Recherchieren mit Wikipedia?

 

Abstract: Whoever teaches students about research skills should be able to distinguish prescientific information retrieval from scientific information retrieval and lead students to the latter without condemning the former.
DOI: dx.doi.org/10.1515/phw-2018-12317.
Languages: English, Deutsch


Wer Studierende in wissenschaftlichen Arbeitstechniken unterrichtet, sollte die vorwissenschaftliche Recherche von wissenschaftlicher Recherche unterscheiden können und Student*innen zu letzterer hinführen, ohne erstere zu verdammen.

Google, Wikipedia und Co.

Es ist ein alltäglicher Vorgang geworden, egal ob für Laien oder Wissenschaftler*innen: Wer auch immer sich auf Informationssuche begibt, eventuell weiterführende, auch wissenschaftliche Literatur sowie historische Quellen zu einem bestimmten Thema eruieren möchte, ruft eine Suchmaschine – zumeist Google – auf und wird unter den erzielten Ergebnissen zumeist einen mehr oder weniger passenden Artikel aus der Online-Enzyklopädie Wikipedia finden, manchmal auch ein auf YouTube zum Thema vorhandenes Video konsultieren.

Egal ob diese Vorgangsweise von Historiker*innen und Geschichtslehrer*innen mit Grausen beobachtet oder wohlwollend begleitet wird, sie beschreibt die Realität der Informationsrecherche für einen Großteil der vernetzten Menschheit. Allfällige Einschränkungen – in der Türkei etwa ist seit April 2017 der Zugang zur Wikipedia aus politischen Gründen gesperrt – sind hier ausgenommen. Vielleicht ist es sinnvoll, diese Form der Suche als “vorwissenschaftlich” zu bezeichnen, womit ich einen Begriff benutze, der analog zu einer im österreichischen Schulsystem verwendeten Bezeichnung gebildet ist: Dort handelt es sich bei der so genannten “vorwissenschaftlichen Arbeit” um eine für die Reifeprüfung nötige schriftliche Arbeit, deren Thema von den Schüler*innen im vorletzten Schuljahr bekannt zu geben ist und die einen Umfang von 60.000 Zeichen nicht überschreiten soll.[1]

Nur Fälschungen und Lügen?

Aufgabe von Lehrenden in der Schule, spätestens aber an der Universität, sollte es sein, die alltäglich gewordene Verwendung der geschilderten Kombination Google/Wikipedia/YouTube nicht zu verdammen oder gar zu verbieten, wie es vielleicht manchmal noch geschieht, sondern auf die Beschränkungen dieses Zugangs hinzuweisen. So sollte etwa bewusst sein, dass die Reihenfolge der von Suchmaschinen angezeigten Ergebnisse (Ranking) von geheim gehaltenen Algorithmen bestimmt wird und dass manche Bereiche des Internets (Deep Web) der Erfassung durch Suchmaschinen entgehen, weswegen trotz der manchmal erzielten Fülle an Treffern nicht alle möglichen Ergebnisse angezeigt werden. Des Weiteren sollten Beispiele dafür angeführt werden, dass es sich bei den gefundenen Treffern in den meisten Fällen nicht um wissenschaftlich abgesicherte Erkenntnisse handelt, sondern sich darunter zuweilen sogar bewusste Fälschungen und Lügen befinden.

Was Wikipedia anbelangt, so sollten Lehrende hier betonen, dass diese von Laien erstellte Online-Enzyklopädie nicht den Anspruch stellt, dass ihre Inhalte wissenschaftlichen Anforderungen genügen müssen: Es gibt darin Artikel, die den Vergleich mit hochrangigen Fachlexika nicht scheuen müssen, andere Beiträge wiederum sind qualitativ miserabel, enthalten schon längst von der Wissenschaft widerlegte Fehler oder bewusste Tatsachenverfälschungen. Speziell für die Literaturrecherche ist wichtig festzustellen, dass zumindest aus heutiger Perspektive für historisch relevante Wikipedia-Artikel gilt, dass die dort verzeichneten Literaturangaben oft nicht die wichtigsten Werke zum behandelten Thema enthalten. Kurz: Eine Literaturrecherche, die ihre Ergebnisse ausschließlich mit Hilfe der in Wikipedia-Artikeln vorhandenen Literaturangaben zusammenstellt, ist ungenügend und genügt keinesfalls wissenschaftlichen Ansprüchen.

Richtig recherchieren

Die genannten Beschränkungen lassen sich zwar nicht einfach umgehen, man kann sie aber Schüler*innen und Studierenden durch bestimmte Übungen bewusstmachen: Was die Recherche mittels Suchmaschinen anbelangt, so können diese angeregt werden, sich nicht nur auf eine Suchmaschine zu verlassen, sondern auch weitere, nicht so weit verbreitete Suchmaschinen zu verwenden: Warum nicht die ersten 50 oder 100 Ergebnisse einer Google-Suche mit den Ergebnissen einer Recherche mittels Bing – der von Microsoft betriebenen Suchmaschine – vergleichen? Des Weiteren können die Ergebnisse alternativer Suchmaschinen wie startpage.com oder duckduckgo.com herangezogen werden; diese greifen zwar auf die Datenbestände der großen Suchmaschinenbetreiber wie Google oder Bing zu, anonymisieren allerdings die Anfragen: Die Treffer sind daher nicht personalisiert und können von den sonst erzielten Ergebnissen abweichen.

Für die Bewertung und Analyse von Wikipedia-Einträgen wiederum hat der verstorbene Historiker Peter Haber bereits 2012 vier einfache Regeln aufgestellt, die ebenfalls im Unterricht als Übungsaufgabe gestellt werden können:

– Konsultieren Sie die zu jedem Artikel vorhandene Diskussionsseite.
– Konsultieren Sie die Versionsgeschichte des Artikels.
– Sichten Sie die im Artikel vorhandenen Belege und Querverweise.
– Konsultieren Sie die unterschiedlichen Sprachversionen des Artikels.[2]

Auf dem Weg zur wissenschaftlichen Recherche

Aufbauend auf dieser Analyse der Ergebnisse vorwissenschaftlicher Recherche können nun jene Suchmethoden vorgestellt werden, die als wissenschaftlich bezeichnet werden können: Dazu zählt die Konsultation von Referenzwerken wie des Lexikons des Mittelalters oder der Enzyklopädie der Neuzeit, des Weiteren die Recherche in den Katalogen wissenschaftlicher Bibliotheken sowie in fachspezifischen Datenbanken (Historical Abstracts etwa). Als Zwischenschritt kann die Verwendung der Kataloge öffentlicher Büchereien sowie von Google Scholar genannt werden. Hier bieten sich folgende Übungsaufgaben an:

– Lemmata aus Wikipedia mit dem jeweiligen Lemma einer Fachenzyklopädie vergleichen.
– Student*innen sollen jeweils eine festgelegte Zeit – z.B. eine Stunde – zum einen mittels Suchmaschine und zum anderen mittels fachspezifischer Datenbanken/Bibliothekskatalogen recherchieren und im Anschluss die Ergebnisse dieser Recherche vergleichen.

Aufbauend auf dem Begriff der “vorwissenschaftlichen Recherche” wäre es auch möglich, ein Ziel eines Bachelorstudiums der Geschichte (und analog anderer Fächer) zu definieren: Absolvent*innen eines Bachelorstudiums sollten dazu fähig sein, Wikipedia-Artikel ihres Faches auf Grundlage der Kenntnis wissenschaftlicher Literatur kritisch analysieren und gegebenenfalls auch verbessern zu können.

_____________________

Literaturhinweise

  • Haber, Peter. “Wikipedia. Ein Web 2.0-Projekt, das eine Enzyklopädie sein möchte.” Geschichte in Wissenschaft und Unterricht 63 (2012): 261–270.
  • Tantner, Anton. “Wikipedia und Weblogs in der universitären Lehre.” In Digital Humanities: Praktiken der Digitalisierung, der Dissemination und der Selbstreflexivität, Hrsg. Wolfgang Schmale, 45-56. Stuttgart: Franz Steiner, 2015.

Webressourcen

  • Haber, Peter [Lehrveranstaltungsleiter]. “Raster und Methode” [Lehrmaterialien des Forschungsseminars “Wikipedia und die Geschichtswissenschaft”, Universität Wien 2010], http://wiki.histnet.ch/Raster_und_Methode (letzter Zugriff am 5. Juni 2018).
  • Wikibu Online-Tool zur Einschätzung der Qualität von Wikipedia-Artikeln. http://www.wikibu.ch/ (letzter Zugriff am 18. Juni 2018).

_____________________
[1] Informationen zur vorwissenschaftlichen Arbeit unter: http://www.ahs-vwa.at (letzter Zugriff am 18. Juni 2018).
[2] Peter Haber, “Wikipedia. Ein Web 2.0-Projekt, das eine Enzyklopädie sein möchte,” Geschichte in Wissenschaft und Unterricht 63 (2012): 261–270, hier S. 270; Anton Tantner, “Wikipedia und Weblogs in der universitären Lehre,” in Digital Humanities: Praktiken der Digitalisierung, der Dissemination und der Selbstreflexivität, Hrsg. Wolfgang Schmale, 45-56. Stuttgart: Franz Steiner, 2015.

_____________________

Abbildungsnachweis

Wikipedia © Pixabay (letzter Zugriff 26. Juni 2018).

Empfohlene Zitierweise

Tantner, Anton: (Vor-)Wissenschaftlich Recherchieren mit Wikipedia? In: Public History Weekly 6 (2018) 25, DOI: dx.doi.org/10.1515/phw-2018-12317.

Whoever teaches students about research skills should be able to distinguish prescientific information retrieval from scientific information retrieval and lead students to the latter without condemning the former.

Google, Wikipedia et al.

It has become commonplace, whether for amateurs or for experts: Whoever wishes to retrieve information, be it scientific literature or historical sources for a certain topic, uses a search engine—Google in most cases—and will find among the results a more or less suitable article from the online encyclopedia Wikipedia. Sometimes, they will also look up a YouTube video on the subject.

Whether or not we as historians or history teachers appreciate it, this is the reality of information retrieval for the majority of the connected world, exceptions to this being examples such as in Turkey, where access to Wikipedia has been blocked for political reasons since April 2017. Perhaps it makes sense to designate this kind of information retrieval as “prescientific,” to use a term that is a conceptualized analogy to what in the Austrian school system is called “prescientific paper.” This is a written text which is required to obtain a high school diploma; the topic has to be announced by the pupils in their penultimate year of school and its length must not exceed 60,000 characters.[1]

Is It All Just Forgeries and Lies?

If it is not the task of school teachers or university teachers to condemn the use of this combination of Google, Wikipedia and YouTube (or even forbid it, as some do), then it is to highlight their limitations. As we know, the ranking of the results is determined by algorithms that are kept secret and some areas of the internet—the so-called deep web—evade being gathered by search engines. Despite the often seemingly endless amount of entries provided, we do not obtain all possible results. Furthermore, teachers should give examples that point out how most of the results are not based on scientific evidence and how some of them are even forgeries and lies.

Concerning Wikipedia, teachers should stress that this online encyclopedia written by non-experts does not claim that its contents comply with scientific standards. Some articles sustain comparison with those belonging to high-ranking encyclopedias, whilst others are wholly inadequate as they spread mistakes that have been refuted by scholars long ago or distort facts on purpose. With regards to literature retrieval, it is particularly important to stress that—at least in the present—Wikipedia articles centering on history topics most often do not cite the most influential articles or books on the subject. This means that a bibliography based on references given by Wikipedia only is insufficient and does not meet scientific requirements.

How to Search for Information

It is not easy to evade the limitations mentioned in the last section, but teachers can make students aware of these restrictions by making them carry out exercises. Concerning information retrieval via search engines, they can be encouraged to not only use Google but also search engines that are less common. Why not compare the first 50 or 100 results of a Google search with the results obtained by Bing, Microsoft’s search engine? In addition to this, the results of alternative search engines such as startpage.com or duckduckgo.com can also be consulted. Even though they have the same pool of data at their disposal as the big players such as Google and Bing, the request will be anonymized and therefore non-personalized, thereby differing from the results obtained otherwise.

Regarding the evaluation and analysis of Wikipedia-entries, the late historian Peter Haber established four simple rules which can also be utilized as exercises in teaching:

– Consult the “Talk” page provided by every article.
– Consult the revision history of the article.
– Check the (cross-) references and literature in every article.
– Consult the different language versions for the article.[2]

Switching to Scientific Information Retrieval

By referring to this analysis of the results of prescientific information retrieval, teachers can present search methods which might be designated as scientific, i.e. consulting online reference works such as the Lexicon of the Middle Ages or the Encyclopedia of Early Modern History, or using catalogues of scientific libraries and specialized databases (e.g. Historical Abstracts). An intermediate task may include consulting public library catalogues and Google Scholar. For this, the following two exercises can be proposed:

– Compare an article from Wikipedia with the matching lemma from a specialized encyclopedia.
– Spend a certain amount of time (one hour for example) performing your search using a search engine, then use the same amount of time to look up specific databases and library catalogues. Compare the results obtained by these two methods!

By using the term “prescientific information retrieval” as a starting point, it is also possible to define the skills a graduate student with a B.A. in History (or in other corresponding studies) is expected to have acquired: Based on the knowledge of scientific literature, a graduate should be able to critically analyze Wikipedia articles in their field of study and they should moreover be able to improve them if necessary.

_____________________

Further Reading

  • Haber, Peter. “Wikipedia. Ein Web 2.0-Projekt, das eine Enzyklopädie sein möchte.” Geschichte in Wissenschaft und Unterricht 63 (2012): 261–270.
  • Tantner, Anton. “Wikipedia und Weblogs in der universitären Lehre.” In Digital Humanities: Praktiken der Digitalisierung, der Dissemination und der Selbstreflexivität, edited by Wolfgang Schmale, 45–56. Stuttgart: Franz Steiner, 2015.

Web Resources

  • Haber, Peter [teacher], “Raster und Methode,” [teaching materials of the research seminar “Wikipedia and the science of history,” University of Vienna, 2010], http://wiki.histnet.ch/Raster_und_Methode (last accessed on 5 June 2018).
  • Wikibu online tool for assessing the quality of Wikipedia articles. http://www.wikibu.ch/ (last accessed on 18 June 2018).

_____________________
[1] Information on the “prescientific paper” in the Austrian school system can be found under http://www.ahs-vwa.at (last accessed on 18 June 2018).
[2] Peter Haber, “Wikipedia. Ein Web 2.0-Projekt, das eine Enzyklopädie sein möchte,” Geschichte in Wissenschaft und Unterricht 63 (2012): 261–270, here p. 270; Anton Tantner, “Wikipedia und Weblogs in der universitären Lehre,” in Digital Humanities: Praktiken der Digitalisierung, der Dissemination und der Selbstreflexivität, ed. Wolfgang Schmale, 45–56. Stuttgart: Franz Steiner, 2015.

_____________________

Image Credits

Wikipedia © Pixabay (last accessed 26 June 2018).

Translation

Translated by Stefanie Svacina and Paul Jones (paul.stefanie at outlook.at)

Recommended Citation

Tantner, Anton: (Pre-)Scientific Information Retrieval and Wikipedia. In: Public History Weekly 6 (2018) 25, DOI: dx.doi.org/10.1515/phw-2018-12317.

Copyright (c) 2018 by De Gruyter Oldenbourg and the author, all rights reserved. This work may be copied and redistributed for non-commercial, educational purposes, if permission is granted by the author and usage right holders. For permission please contact the editor-in-chief (see here). All articles are reliably referenced via a DOI, which includes all comments that are considered an integral part of the publication.

The assessments in this article reflect only the perspective of the author. PHW considers itself as a pluralistic debate journal, contributions to discussions are very welcome. Please note our commentary guidelines (https://public-history-weekly.degruyter.com/contribute/).


Categories: 6 (2018) 26
DOI: dx.doi.org/10.1515/phw-2018-12317

Tags: , , ,

1 reply »

  1. To all our non-German speaking readers we recommend the automatic DeepL-Translator.

    In weiten Teilen ist das durchaus ein sinnvoller Artikel, der aus der Masse des Unsinns, der über Wikipedia geschrieben wird, herausragt.
    Ein paar Anmerkungen möchte ich aber doch machen:

    * “diese von Laien erstellte Online-Enzyklopädie” – das kann man so pauschal nicht sagen. Ein Gutteil der Autor*innen hat durchaus einen akademischen Hintergrund. Nicht selten sind es beispielsweise Student*innen der jeweiligen Fächer, die schreiben. In anderen Fällen auch Emeriti. Die Autorenschaft ist sehr gemischt. Von den Laien bis zur*m Vollprofi. Auch in den Geschichtswissenschaften.

    * “Eine Literaturrecherche, die ihre Ergebnisse ausschließlich mit Hilfe der in Wikipedia-Artikeln vorhandenen Literaturangaben zusammenstellt, ist ungenügend und genügt keinesfalls wissenschaftlichen Ansprüchen.” – völlig richtig. Jeder vernünftige Wikipedia-Autor würde als nächsten Satz in einer Wikipedia-Einführung sagen, daß Wikipedia nur ein Einstieg in ein Thema sein kann und dass danach beginnend von der angegebenen Literaur eine weitere Recherche erfolgen müsste (es sei denn, man möchte ohnehin nur eine Info oder aus persönichem Interesse etwas lesen). Wikipedia ist ausdrücklich keine Bibliografie, somit ist auch die Zahl der Literaturangaben meist beschränkt und verweist eher auf die genutzte Literatur.

    * Peter Habers Regeln sind sicher sinnvoll bei der Interpretation und Überprüfung von Wikipedia-Artikeln, sind für den Normalgebrauch aber denkbar ungeeignet. Und auch nicht nötig. Wikipedia soll und will nur der Einstieg zur Recherche sein. Wikipedia ist Tertiärliteratur. Wer sich wissenschaftlich mit einem Thema beschäftigt, sollte die Quellen nehmen oder wenigstens die Sekundärliteratur. Wenn man das beherzigt, muss man auch nicht Habers vier Regeln beachten. Wer das tun muss, hat in seiner akademischen Arbeit ohnehin schon einen Fehler gemacht.

Pin It on Pinterest