gms | German Medical Science

GMS Medizin — Bibliothek — Information.

Arbeitsgemeinschaft für Medizinisches Bibliothekswesen (AGMB)

ISSN 1865-066X

Auf Nutzerbedürfnisse abgestimmtes Design: Usability-Untersuchung des neuen ZB MED-Suchportals LIVIVO

Design that meets user needs: Usability test of the new ZB MED search portal LIVIVO

Fachbeitrag

Search Medline for

  • corresponding author Jana Pössel - ZB MED – Leibniz-Informationszentrum Lebenswissenschaften

GMS Med Bibl Inf 2016;16(1-2):Doc06

doi: 10.3205/mbi000361, urn:nbn:de:0183-mbi0003618

Published: September 23, 2016

© 2016 Pössel.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Die Untersuchung der Nutzerfreundlichkeit auf Basis von Usability-Tests ist ein gängiges Mittel zur Verbesserung der Bedienbarkeit eines Webangebots. Beschrieben wird ein Projekt, welches das Thema Usability-Prüfung im bibliothekarischen Kontext aufgreift. Am praktischen Beispiel der Suchportale LIVIVO und MEDPILOT der Zentralen Fachbibliothek ZB MED wird der Frage nachgegangen, wie sich die Einbeziehung von Usability-Ergebnissen und eine auf Nutzerbedürfnisse basierende Neukonzeption auf die Bedienfreundlichkeit eines solchen Angebots auswirkt. Anhand von Benutzertests werden Usability-Probleme bei LIVIVO aufgedeckt und dazu Lösungsvorschläge erarbeitet. Anschließend zeigt ein Vergleich zu Usability-Ergebnissen des Vorgänger-Suchportals MEDPILOT, wie sich die Wahrnehmung der Bedienfreundlichkeit durch die Neukonzeptionierung verbessert hat. Im Bericht über den Projektverlauf werden die Unterschiede zwischen Projektplanung und praktischer Umsetzung herausgearbeitet, sowie Optimierungsvorschläge gegeben. Das Ergebnis kann als beispielhafter Projektablauf für eine Usability-Untersuchung dienen, wie sie an Bibliotheken ohne größeren personellen und finanziellen Aufwand durchgeführt werden kann.

Schlüsselwörter: Gebrauchstauglichkeit, Bedienfreundlichkeit, Usability-Test, Nutzerführung, Nutzerorientierung, Benutzeroberfläche, User Interface Design, Suchportal, Discovery System, Zentrale Fachbibliothek, LIVIVO, MEDPILOT, GREENPILOT, ZB MED, Leibniz-Informationszentrum Lebenswissenschaften, Morae

Abstract

Usability testing is a current method to value and improve the usability of a website or search portal. The described project sets usability testing in a library-related context. Using the example of the search portals LIVIVO and MEDPILOT by the special library ZB MED, it is investigated how the usability of a product is improved when results of usability testing are included in the process of the redesign of such a portal. In the project, a usability-study with user tests of LIVIVO is planned and carried out. The exposed usability problems are evaluated and first solutions are developed. Some of the test results are then compared to previous usability testing results of the former ZB MED search portal MEDPILOT, in order to find out how the usability has actually been improved by the redesign. An analysis of the course of the project states differences between project planning and actual implementation, as well as suggestions on improvement. The result may be used as an exemplary project workflow for a usability study that can be carried out with little human or financial resources by any library.

Keywords: usability, utility, usability testing, user orientation, user navigation, user interface design, search portal, discovery system, national specialist library, LIVIVO, MEDPILOT, GREENPILOT, ZB MED, Leibniz Information Centre for Life Sciences, Morae


1 Einführung

Die Benutzerfreundlichkeit und Gebrauchstauglichkeit von Systemen, bezeichnet mit dem Wort Usability, hat seit Nielsens Grundlagenwerk Designing Web Usability [1] aus dem Jahr 2000 vor allem für Webangebote immer mehr an Bedeutung gewonnen. Praktische Usability-Tests sind ein probates Mittel, um Nutzerfreundlichkeit und Bedienkomfort eines solchen Angebots zu ermitteln. Regelmäßige Untersuchungen der Usability sind als wichtiger Aspekt eines nachhaltigen Qualitätsmanagements kaum mehr verzichtbar, sei das Angebot eine Website oder ein Suchportal ([2], S. 212). Dabei geht der Trend von groß angelegten, repräsentativen Studien hin zu kleineren Untersuchungen, die mit geringem Aufwand und minimalem Budget durchgeführt werden können, sowie schnelle Ergebnisse versprechen ([3], S. 131). Ein Vorteil dieser Vorgangsweise liegt darin, dass auch in nicht finanzkräftigen Bereichen wie dem Bibliothekssektor so regelmäßige Usability-Prüfungen der bibliothekarischen Webangebote realisierbar werden.

Noch sind Usability-Untersuchungen in Bibliotheken jenseits vom Alltagsgeschäft, die Thematik setzt sich jedoch langsam auch im deutschsprachigen Raum durch. Insbesondere die drei Zentralen Fachbibliotheken Leibniz-Informationszentrum Lebenswissenschaften (im Folgenden: ZB MED), Technische Informationsbibliothek (TIB) [4] und Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) [5] investieren in den vergangenen Jahren verstärkt Ressourcen in diesen Bereich.

Der folgende Beitrag beschreibt die Durchführung eines Praxisprojekts im Rahmen des Masterstudiengangs Bibliotheks- und Informationswissenschaft (Master in Library and Information Science – MALIS) der Technischen Hochschule Köln. Inhalt des Projekts war die Planung und Durchführung einer Usability-Untersuchung des neuen ZB MED-Suchportals LIVIVO (https://www.livivo.de). Im Verlauf der Ausarbeitung wird der Frage nachgegangen, wie sich die Einbeziehung von Erkenntnissen früherer Usability-Untersuchungen in die Neukonzeption des Suchportals tatsächlich auf die Bedienfreundlichkeit dieses Angebots ausgewirkt hat. Auf Basis von Benutzertests werden Usability-Probleme bei LIVIVO im Beta-Status aufgedeckt und dazu Lösungsvorschläge erarbeitet. Ein Vergleich von Ergebnissen der Usability-Untersuchungen mit früheren Tests zeigt schließlich auf, wie sich die Wahrnehmung der Bedienfreundlichkeit durch die Neukonzeptionierung verbessert hat. Neben einer kritischen Auseinandersetzung mit dem Projektablauf gibt die Herausarbeitung von Erfahrungswerten („Lessons Learned“) wichtige Hinweise für die Ausgestaltung eines solchen Projekts im Bibliotheksbereich.


2 Das Projekt: Usability-Untersuchung von LIVIVO

2.1 Ausgangslage

ZB MED – Leibniz-Informationszentrum Lebenswissenschaften hat am 15.04.2015 sein neues lebenswissenschaftliches Suchportal LIVIVO als Beta-Version veröffentlicht [6]. LIVIVO vereinigt die beiden vorherigen ZB MED-Suchportale MEDPILOT [7], [8] und GREENPILOT unter einem neuen User-Interface. Anders als kommerzielle Discovery Systeme nutzt LIVIVO einen von ZB MED erstellten und gepflegten Suchindex, bestehend aus etwa 45 qualitätsgeprüften Fachdatenbanken (eine detaillierte Auflistung aller enthaltenen Datenquellen findet sich im Hilfebereich von LIVIVO unter https://www.livivo.de/app/misc/help/sources). Die intelligente Suchtechnologie von LIVIVO, basierend auf einer SOLR-Suchmaschine mit zusätzlicher semantischer Komponente der Firma Averbis (http://www.averbis.com), sucht automatisch nach ähnlichen Begriffen und liefert so schnell die relevantesten Treffer zur Suchanfrage (weitere Informationen unter im Hilfebereich von LIVIVO unter https://www.livivo.de/app/misc/help/about).

ZB MED hat in der Vergangenheit bereits Usability-Untersuchungen zu den Suchportalen MEDPILOT [9], [10], [11], [12] und GREENPILOT [13] durchgeführt. Diese kamen zumeist zu dem Ergebnis, dass die Nützlichkeit (Utility) der angebotenen Services unbestritten war. Als eine Ursache für die dennoch verhältnismäßig geringe Nutzung (MEDPILOT je nach Zielgruppe zwischen 15–30%, bei GREENPILOT durchweg etwa 2%, [14], S. 59) wurden die verbesserungswürdige Nutzerführung und Usability der Portale identifiziert ([9], S. 37).

Die Konzeptionierung des neuen Suchportals erfolgte daher auf Basis der Erkenntnisse der früheren Usability-Untersuchungen. In Zusammenarbeit mit der auf Usability spezialisierten Medienagentur Wilder Jäger (http://www.wilder-jaeger.de) wurde ein neues Nutzerführungskonzept und User-Interface konzipiert, das alle Services komfortabel bedienbar macht – dank Responsive Design auch unabhängig vom Endgerät.

Inwieweit dieses Vorgehen zu einer tatsächlichen Verbesserung der Bedienfreundlichkeit des Suchportals geführt hat, sollten Usability-Tests noch in der Beta-Phase des Angebots aufzeigen.

2.2 Zielsetzung

Das Ziel der Untersuchung war es, anhand einer Usability-Prüfung mit Benutzertests von LIVIVO, Schwachstellen in Nutzerführung und Usability des neuen User-Interfaces zu ermitteln. Der Fokus lag dabei auf der Bewertung der neuen Oberfläche und den Basisfunktionalitäten. Gefundene Probleme wurden auf mögliche Ursachen hin analysiert und Lösungsvorschläge bzw. Anregungen für eine Weiterentwicklung gegeben.

Ein Vergleich einzelner Ergebnisse der Usability-Untersuchungen von LIVIVO (2015) und MEDPILOT (2012) [9] sollte außerdem aufzeigen, wie sich das neue User-Interface und die überarbeitete Nutzerführung auf die Bewertung der allgemeinen Bedienfreundlichkeit des Suchportals ausgewirkt haben.

2.3 Zielgruppe

Die Usability-Tests wurden mit künftigen Hauptanwendern von LIVIVO durchgeführt: Wissenschaftlich Arbeitende aus den ZB MED-Fachgebieten. Ausgehend von der ZB MED Markt- und Zielgruppenanalyse 2012 waren für ZB MED – neben den Studierenden – Forschende als Hauptzielgruppe identifiziert worden [15]. Zuletzt war MEDPILOT 2012 von einer Gruppe Studierender der Medizin bzw. Gesundheitswesen getestet worden. Diesmal sollten etwa zehn Teilnehmer aus dem lebenswissenschaftlichen Forschungs- und Wissenschaftsbereich als Probanden rekrutiert werden. Diese klein erscheinende Zahl an Testpersonen reicht nach gängiger wissenschaftlicher Meinung aus, um einen Großteil der Usability-Probleme eines Angebots aufzudecken ([2], S. 224).

2.4 Projektbeteiligte

Trotz minimalen personellen Aufwands war in verschiedenen Phasen des Projektes die Beteiligung mehrerer Personen notwendig. Das Projektteam bestand in diesem Fall aus der Projektleitung (Autorin), dem technischen Support, dem Interviewer und einer Kontaktperson für die Auswahl der Teilnehmer.

2.5 Zeitbedarf

Für das Projekt wurde inklusive Pufferzeit ein Zeitraum von 18 Wochen geplant. Die tatsächliche Durchführung nahm schließlich trotz teilweise erheblicher Verzögerungen in Teilphasen knapp 20 Wochen in Anspruch. Die einzelnen Projektbeteiligten waren dabei nur mit einem Teil ihrer Arbeitszeit involviert. Die Anteile werden im Folgenden bei den Teilphasen angegeben, dabei wird von einer regelmäßigen täglichen Arbeitszeit von acht Stunden ausgegangen.


3 Darstellung des Projektablaufs

Das Projekt war in die sechs Projektphasen Projektplanung, Fragebogenkonzeption, Teilnehmerakquise, Testvorbereitung, Testdurchführung und Auswertung gegliedert. Es wurde von April bis August 2015 durchgeführt. Wichtige Phasen werden im Folgenden beschrieben und kritisch analysiert, ein Bereich „Lessons Learned“ gibt jeweils phasenbezogene Vorschläge für Optimierungspotential.

3.1 Projektphase 2: Konzeption des Fragebogens

  • Arbeitsaufwand: Projektleitung mit 50% der täglichen Arbeitszeit.
  • Dauer der Projektphase 2: Die Konzeption des Fragebogens nahm etwa acht Wochen und damit doppelt so lang wie geplant in Anspruch.

Nach Festlegung der Themen in Absprache mit ZB MED wurden erste Entwürfe des Fragebogens an die Software Morae angepasst und nach praktischen Durchläufen immer weiter optimiert, bevor der Fragebogen endgültig fest stand. Der zwölfseitige Fragebogen wurde teilweise im persönlichen Interview, teilweise durch die Software Morae abgefragt und deckte u.a. folgende Themenkomplexe ab: Bewertung des User-Interfaces, Einfache Suche und Suchfilter, Verfügbarkeit und Zugang zu Treffern, Zusatzinformationen zum Treffer und Suchhistorie.

3.1.1 Kritische Analyse: Planung und Realität

Am Fragebogen waren umfangreichere Änderungen notwendig als zunächst einkalkuliert. Zum einen konnten nicht alle von ZB MED gewünschten Themen im Rahmen eines Testdurchlaufs von 60 bis maximal 90 Minuten behandelt werden. Um den Fragebogen optimal in die Software zu integrieren, mussten zum anderen immer wieder Fragen umgestellt und für die Präsentation am Bildschirm angepasst werden. Nach internen, praktischen Tests ergab sich weiterer Änderungsbedarf.

3.1.2 Lessons Learned

In diesem Projektstadium sollte eine größere zeitliche Pufferphase für Anpassungen am Fragebogen vorgesehen werden. Optimierungspotential ergibt sich nach Erfahrungen dieser Untersuchung vor allem nach praktischen Tests des Fragebogens mit Projekt-Unbeteiligten.

Schon bei der Wahl der Themen, vor allem aber bei der Ausformulierung der Fragen, sollte dazu berücksichtigt werden, dass sich nicht alle Fragestellungen für die Abfrage durch die Software eignen. Für die Darstellung am Bildschirm müssen Fragen besonders kurz und präzise formuliert sein, so dass Teilnehmer möglichst beim ersten Überfliegen bereits verstehen, worauf die Aufgabe abzielt. Ein gründliches Lesen findet am Bildschirm nicht statt. Fragestellungen mit mehr als zwei Zeilen führten in dieser Untersuchung dazu, dass die Teilnehmer die Frage falsch bzw. nur teilweise richtig verstanden hatten oder nochmal lesen mussten. Bei zukünftigen weiteren Tests mit dieser Software sollten die Fragen daher noch weiter auf die Darstellung am Bildschirm optimiert werden.

3.2 Projektphase 3: Akquise und Auswahl der Teilnehmer

  • Arbeitsaufwand: Projektleitung mit 10%, Kontaktperson mit 50% der täglichen Arbeitszeit.
  • Dauer der Projektphase 3: Diese Projektphase umfasste etwa vier Wochen (zwei Wochen länger als vorgesehen).

Geplant war, Testteilnehmer über bereits bestehende Kontakte zu Forschenden via E-Mail-Aufruf zu gewinnen. Mit einem E-Mail-Aufruf an Mailinglisten von Studierenden waren beim letzten Test im Jahr 2012 in kurzer Zeit mehr Interessierte als nötig gefunden worden. Als sich jedoch abzeichnete, dass diesmal nach E-Mail-Einladung und Erinnerungs-E-Mails nicht genügend Interessierte zur Verfügung standen, wurden zusätzlich gedruckte Aushänge erstellt, die im näheren Umfeld der Einrichtung ausgehängt wurden. Als letzter Schritt erfolgten Auswahl und Terminvereinbarung mit Teilnehmern. Ausgewählt wurden nur Personen, die bisher über keine Erfahrungen mit dem neuen ZB MED-Suchportal verfügten.

3.2.1 Kritische Analyse: Planung und Realität

Die Teilnehmerakquise gestaltete sich schwieriger als erwartet. Ursachen waren nach Rücksprache mit Eingeladenen Bedenken bezüglich der Länge der Tests (stärkerer Zeitmangel bzw. Zeitdruck in dieser Zielgruppe als bei Studierenden). Damit zusammenhängend wurde die notwendige Anreise nach Köln als festen Standort des Tests als Hindernis empfunden. Als weitere Erschwernis wurde genannt, dass der Test nicht in Englisch angeboten wurde. In der Zielgruppe Wissenschaft und Forschung befand sich ein nicht unwesentlicher Anteil Personen, deren Muttersprache nicht Deutsch war.

Durch einen zusätzlichen gedruckten Aufruf, der in Nähe des Testorts zum Aushang kam, konnten direkter diejenigen Personen vor Ort angesprochen werden, für die weder Sprache noch Anreise eine Hürde darstellte. Durch diese Maßnahmen konnten letztendlich zwölf Teilnehmer gewonnen werden.

3.2.2 Lessons Learned

Der Fall zeigt, dass ein Kommunikationskanal alleine i.d.R. nicht ausreicht, um genügend Testteilnehmer zu finden, zumindest dann nicht, wenn weitere Kriterien vorliegen (in diesem Fall: keine Studierenden, nur Personen aus den ZB MED-Fachgebieten). Zukünftig sollten daher von vornherein immer parallel verschiedene Wege der Akquise beschritten werden.

Des Weiteren könnten Hürden für die Testteilnahme abgebaut werden. Dazu zählt z.B. das Angebot von verschiedenen Test-Standorten, sowie in verschiedenen Sprachen. Der Testzeitraum sollte nach Möglichkeit nicht in der Ferien-/Urlaubszeit liegen. Gegebenenfalls würde auch eine Untersuchung mit anderer Methodik (z.B. kürzere Online-Tests statt Interviews) zu größerer Mitmachbereitschaft führen.

3.3 Projektphase 4: Testvorbereitung

  • Arbeitsaufwand: Technischer Support mit 50% der täglichen Arbeitszeit.
  • Dauer der Projektphase 4: Diese Projektphase umfasste mit zehn Wochen zehn Tage länger als geplant.

Zur Testvorbereitung gehörte zum einen die Einrichtung der Hard- und Software: Für den Usability-Test war der Einsatz zweier Laptops vorgesehen, von denen einer für die eigentliche Testdurchführung, der andere zur Überwachung und Strukturierung der laufenden Interviews dienen sollte. Als Software wurde das Programm Morae des Herstellers TechSmith (https://www.techsmith.de/morae.html) eingesetzt, welches bereits 2012 Verwendung fand und durch intuitive Bedienbarkeit sowie kostengünstige Anschaffung überzeugte. Die drei Programmteile Morae Recorder, Morae Observer und Morae Manager bieten alle notwendigen Funktionalitäten, Usability-Tests mit minimalem personellem und technischem Aufwand durchführen zu können.

In der Vorbereitungsphase wurden die Laptops mit der Software ausgestattet und eine Verbindung beider Geräte konfiguriert. Die Software Morae stand noch vom letzten Usability-Test 2012 mit Versionsstand 3.3 zur Verfügung. Nach eingehender Prüfung der Änderungen und neuen Features durch die aktuelle Version 3.3.3 fiel die Entscheidung gegen ein Update, um die Einarbeitungszeit in eventuell veränderter Oberfläche zu minimieren.

Als Testraum wurde ein Büroraum umfunktioniert, der für die festgelegten Zeiträume reserviert und mit den benötigten Geräten ausgestattet wurde. Im Vorfeld der eigentlichen Tests wurde die Testsituation intern mit Freiwilligen durchgespielt, um dem Test-Team die nötige Praxis zu ermöglichen.

3.3.1 Kritische Analyse: Planung und Realität

Anders als geplant war mehr Nachkonfiguration der Hardware nötig als vorgesehen. Die Verbindung beider Laptops gestaltete sich weniger problemlos als 2012, Ursache waren zuvor unentdeckte Hardwaredefekte an einem der Geräte. Da die Software nicht aktualisiert werden musste, konnte zumindest dort Zeit für Einarbeitung und Vorbereitung gespart werden.

Die Verantwortung für die notwendigen technischen Vorbereitungen lag beim technischen Support und konnte so parallel zu Aufgaben der Projektleitung bzw. anderer Beteiligter durchgeführt werden. Daher wurde diese Teilphase gleichzeitig zum Projektstart begonnen. Die vierte Projektphase konnte so trotz verzögerter Bereitstellung der Hardware (Verzug: 45 Tage) mit nur zehn Tagen Verzögerung abgeschlossen werden.

3.3.2 Lessons Learned

Die Hard- und Software für Usability-Tests sollte nach Erkenntnissen dieses Projekts sehr früh im Projektablauf vorbereitet werden. Wenn sich dort bereits Bedenken einstellen, ob die Geräte für die Durchführung geeignet sind, sollte in Erwägung gezogen werden, die eigentlichen Tests zu verschieben, um Zeit zu gewinnen. Bei veralteten Geräten, die schon bei den Vorbereitungen Ausfallerscheinungen zeigen, ist immer mit einer höheren Ausfall-Rate bzw. Fehlerquote zu rechnen, wie das vorliegende Beispiel zeigt. In diesem Fall hätte ein Wechsel (statt Reparatur) der Hardware schon in einem früheren Stadium des Projekts zahlreiche spätere Fehlerbehebungsmaßnahmen überflüssig gemacht (siehe Kapitel 3.4 und 3.5). Eine Verbindung beider Geräte per W-LAN ist zwar möglich, hat sich in dieser Untersuchung aber nicht bewährt. Um die relativ großen Datenmengen störungsfrei übertragen zu können, ist eine stabile LAN-Verbindung zwischen beiden Geräten vorzuziehen. Zwei Probedurchläufe mit fertig gestelltem Fragebogen sind nach Erkenntnissen dieser Untersuchung ausreichend.

3.4 Projektphase 5: Testdurchführung

  • Arbeitsaufwand: Projektleitung und Interviewer mit je 50% der täglichen Arbeitszeit.
  • Dauer der Projektphase 5: Diese Projektphase wurde wie geplant über einen Zeitraum von zwei Wochen durchgeführt.

Während der Durchführung der eigentlichen Interviews fand (zeitgleich im selben Raum) die Beobachtung der laufenden Tests durch die Projektleitung am Observer-Laptop statt. Während die Testperson über die Software Morae Recorder durch den praktischen Teil am Bildschirm geleitet und dabei aufgezeichnet wurde, hatte der Observer die Möglichkeit, diese Aufzeichnung für die spätere Auswertung mit Hilfe der Software Morae Observer vorzustrukturieren, z.B. Marker an entscheidenden Stellen des Tests zu setzen und Notizen zu erfassen. Nach Abschluss des eigentlichen Tests folgte eine teaminterne Nachbesprechung und Nachbearbeitung, wobei auch nur mündlich gegebene Antworten elektronisch protokolliert wurden.

3.4.1 Kritische Analyse: Planung und Realität

Die fünfte Projektphase war stark von äußeren Einflüssen abhängig. Bei der Terminvergabe wurde flexibel auf die Wünsche der Teilnehmer eingegangen. Das hatte zur Folge, dass zehn von zwölf Tests in der ersten Testwoche stattfanden, zwei weitere Tests von Nachzüglern folgten mit einer Woche Abstand.

Dieser Umstand kann im Nachhinein jedoch als glücklich betrachtet werden, da sich im Laufe der ersten Testwoche Probleme mit der Hardware einstellten. Der zum Testen verwendete Laptop hatte zunehmend Schwierigkeiten, die relativ Arbeitsspeicher-intensiven Testdurchläufe zu bewältigen. Grund hierfür könnte zum einen das Alter des Geräts sein (Baujahr 2009), aber auch äußere Einflüsse wie die Umgebungstemperatur (im genannten Zeitraum herrschten Spitzentemperaturen von bis zu 38 Grad). Aus diesem Grund wurde entschieden, in der zweiten Testwoche vom veralteten Laptop auf einen neueren PC umzusteigen. Der Wechsel der lizenzierten Software war problemlos möglich und auch die Verbindung zum Observer-Laptop konnte schnell hergestellt werden. Die restlichen Tests liefen frei von technischen Störungen.

3.4.2 Lessons Learned

Bei 60- bis 90-minütigen Tests sind inklusive Vor- und Nachbereitung zwei bis drei Stunden anzusetzen. Mehr als zwei Tests pro Tag, mit etwa einer Stunde Pause zwischen den Terminen, sollten daher bei der Terminvergabe nur in Ausnahmefällen angeboten werden. Als positiv hat sich jedoch bewährt, alle Tests in einem relativ eng definierten Zeitraum stattfinden zu lassen. Dadurch kann zum einen der Raum für die angegebene Phase durchgängig als Testraum eingerichtet bleiben. Zum anderen spielt sich beim Test-Team eine gewisse Routine ein, die sich als vorteilhaft für die Durchführung ergeben hat.

Die eigentlichen Tests auf einem PC statt einem dafür eingerichteten Laptop durchzuführen war in diesem Fall notwendig. Positiv für die Probanden waren der größere Bildschirm und die verbesserte Geschwindigkeit. Nachteilig für das Test-Team war jedoch die fehlende Flexibilität des Geräts. Hier müssen Kosten und Nutzen im Einzelfall abgewogen werden.

Für zukünftige Studien bei ZB MED wird empfohlen, entweder einen festen Raum als Usability-Raum zu definieren (mit entsprechend konfiguriertem PC, der jederzeit für Studien verwendet werden kann), oder einen leistungsstarken Laptop mit entsprechend größerem Display eigens für diese Tests anzuschaffen, der nur für Usability-Untersuchungen zur Verfügung steht.

3.5 Projektphase 6: Auswertung

  • Arbeitsaufwand: Projektleitung mit 50% der täglichen Arbeitszeit.
  • Dauer der Projektphase 6: Diese Projektphase umfasste sechs Wochen und damit zwei Wochen länger als geplant.

Mit Hilfe der Software Morae Manager konnten die Mitschnitte der Tests sowie die Protokollierung und Vorstrukturierungen des Observers leicht zusammengefügt werden. Die einzelnen praktischen Aufgaben wurden ausgewertet, dabei wurden auch die mündlichen Kommentare der Testpersonen bei den Eingangs- und Abschlussfragen auf Usability-Probleme bzw. Verbesserungsvorschläge hin geprüft.

Alle aufgetretenen Probleme und Vorschläge wurden anschließend gesammelt, Statistiken über Häufigkeiten angelegt und in eine Gesamtliste zusammengefügt. Um die Schwere jedes Usability-Problems einzuordnen, wurden sie zunächst hinsichtlich ihrer Auswirkung kategorisiert (Kriterien siehe [16], S. 13), sowie in Relation zur Häufigkeit ihres Auftretens und dem Beständigkeitsfaktor (siehe [17], S. 123) gesetzt. Die Gesamtliste wurde in ein Ranking gebracht, woraus sich Kernprobleme ableiten ließen.

3.5.1 Kritische Analyse: Planung und Realität

Verzögerungen wurden beim Auswerten durch technische Probleme mit den Aufzeichnungen verursacht, einzelne Aufnahmen waren unvollständig. Als Ursache dafür werden die bereits bekannten Probleme mit dem Recorder-Laptop vermutet. Der Ausfall betraf jedoch nur einen kleinen Teil der Mitschnitte (ca. 30 Minuten von insgesamt ca. 12 Stunden Videomaterial konnten nicht wieder hergestellt werden) und nur die Videoaufzeichnungen selbst. Die elektronischen Mitschriften des Observers waren auch für die fehlenden Videominuten erhalten geblieben. Das bestätigt den Verdacht, dass das Problem beim Recorder-Laptop lag.

3.5.2 Lessons Learned

Eine gründliche Arbeit des Observers kann die spätere Auswertung stark beschleunigen und erleichtern. Wird schon beim laufenden Test möglichst viel durch den Observer strukturiert, bewertet und mit aussagekräftigen Notizen versehen, kann die Auswertungszeit minimiert und die Notwendigkeit zeitaufwändiger Arbeiten, wie dem erneuten Ansehen kompletter Videoabschnitte, reduziert werden. Wichtige Stationen der einzelnen Tests sind so außerdem auf einen Blick erfassbar und erschließen sich auch für Dritte bzw. nach längerer Zeit. Es wird daher empfohlen, auf den Observer nicht zu verzichten und nach Möglichkeit eine Usability-erfahrene Person für diese Rolle einzusetzen.


4 Projektergebnis: Usability-Probleme und Entwicklung der allgemeinen Bedienfreundlichkeit von LIVIVO

4.1 Aufgedeckte Usability-Probleme und Lösungsansätze

Im Rahmen der Usability-Untersuchung wurden 45 kleinere und größere Usability-Probleme ermittelt. Als Kernproblem eingestuft wurde, was mindestens die Hälfte aller Testpersonen betraf und einer der folgenden Kategorien zuzuordnen war (siehe [16], S. 14):

1.
Eine fehlende Funktion für eine wichtige Aufgabe.
2.
Ein Problem, das dazu führt, dass ein Task von vielen Nutzern nicht ohne Hilfe erfolgreich beendet werden konnte.
3.
Etwas, das störend für viele User ist.

Diese Kriterien trafen in dieser Untersuchung auf fünf Probleme zu, welche im Folgenden näher vorgestellt werden.

4.1.1 Fehlende Funktion: Recherche nach Forschungsdaten

In LIVIVO sind frei verfügbare Forschungsdaten zu Publikationen verlinkt. Die Recherchierenden haben so die Möglichkeit, die Forschungsdaten als Bewertungsgrundlage für Publikationsinhalte zu nutzen oder für eigene Veröffentlichungen zu verwenden. Der Link zu Forschungsdaten befindet sich jedoch recht versteckt am Treffer im Bereich More Links / Zusatzmaterialien (Abbildung 1 [Abb. 1]).

Einzelnen Testpersonen fehlte eine stärkere optische Hervorhebung (17%). Wichtiger war aber die Suchmöglichkeit: 67% wünschten sich, gezielter nach diesen Titeln recherchieren zu können, z.B. über Filter. Diese Funktion war von ZB MED bereits bei der Konzeption der Einbindung von Forschungsdaten bedacht worden und konnte daher im Oktober 2015 freigeschaltet werden [18].

4.1.2 Zu Misserfolg führende Probleme

Des Weiteren traten vereinzelt Probleme auf, die Testpersonen davon abhielten, eine Aufgabe oder Teilaufgabe erfolgreich (ohne Hilfestellung) zu bewältigen.

Suchfilter Verwandte Begriffe: Funktionalität nicht selbsterklärend

Als problematisch offenbarte sich zum einen die Funktion Verwandte Begriffe / Related Terms. Treffer in LIVIVO werden auf Basis der eingebundenen Fachthesauri MeSH, UMTHES und AGROVOC automatisiert verschlagwortet. In der Trefferliste bieten die Verwandten Begriffe dann aus der aktuellen Treffermenge Ergebnisse dieser Verschlagwortung als Vorschlag zur Verfeinerung der Suche an.

Die Verwandten Begriffe sind im Layout bei den sonstigen Filtermöglichkeiten (z.B. Fachgebiet, Jahr, Dokumenttyp oder Sprache) eingeordnet (Abbildung 2 [Abb. 2]), obwohl sie im Grunde kein Filter sind: Zwar beziehen sich alle Funktionen auf die aktuelle Ergebnismenge. Während die sonstigen Filter aber beim Ausführen die aktuelle Ergebnismenge verkleinern, lösen die Verwandten Begriffe eine neue Suche aus, bei der bereits eingegebene Suchbegriffe mit dem Verwandten Begriff in Kombination gesucht werden. Das Ausführen der Funktion kann die Ergebnismenge sogar vergrößern, weil durch das Auslösen einer neuen Suche bereits vorher aktive Filter zurückgesetzt werden. Die Verwandten Begriffe ändern also die Suche, während die anderen Filter die aktuelle Treffermenge einschränken.

50% der Testpersonen hatten auch nach mehrmaligem Ausführen der Funktion nicht verstanden, dass bzw. warum hier etwas anderes passiert, als bei den anderen Filtern. Als Ursache dafür kann gesehen werden, dass die Verwandten Begriffe optisch nicht zu unterscheiden sind von den „normalen“ Filtern.

Es liegt daher auf der Hand, diese Filter optisch von den anderen Filtermöglichkeiten abzusetzen. Hierzu soll von der Medienagentur, die das User-Interface von LIVIVO konzipiert hat, ein Vorschlag erarbeitet werden.

Suchfilter Verwandte Begriffe: Automatische Vorschläge optimierungsbedürftig

Dazu kommt die verbesserungswürdige Qualität der automatischen Vorschläge unter den Verwandten Begriffen. Im Test bemerkten 75% der Testpersonen, dass sich unter den ersten fünf angebotenen Einträgen keine sinnvollen Vorschläge zur Suchanfrage befanden und klappten daher erst mal weitere Einträge aus. Hier ist eine Optimierung durch die Firma Averbis notwendig, die für die Konfiguration der automatischen Verschlagwortung verantwortlich ist.

Suchfilter entfernen nicht intuitiv

Die Bedienung der „normalen“ Filter hingegen bewerteten die Testpersonen durchweg als intuitiv. Jedoch scheiterten noch 50% von ihnen daran, bereits gesetzte Suchfilter wieder zu entfernen. In LIVIVO zeigt nur ein schmaler blauer Rand beim Filter an, dass dieser aktuell aktiv ist (Abbildung 3 [Abb. 3]).

Die Hälfte aller Testpersonen übersah diese Kennzeichnung und konnte die Aufgabe ohne Hilfe nicht beenden. Die Nachhaltigkeit dieses Fehlers ist jedoch als gering einzustufen. Einmal ausgeführt, schätzten diese Testpersonen, würden sie die Funktion zukünftig auch bedienen können.

Dennoch wurde im Anschluss an die Untersuchung ein Konzept durch die Medienagentur Wilder Jäger erarbeitet, wie bereits gesetzte Filter deutlicher dargestellt werden können. Seit Oktober 2015 werden aktive Filter nun auch oberhalb der Ergebnisliste angezeigt, wo sie leichter an- und abgewählt werden können [18].

4.1.3 Störungsfaktor: Nicht scannbare Trefferliste

Als störend empfanden 50% der Testpersonen, dass einzelne Treffer auf der Trefferseite zu viel Platz in Anspruch nehmen. Bei gängiger Auflösung sind aktuell maximal zwei Treffer gleichzeitig zu sehen (siehe auch Abbildung 2 [Abb. 2]), was das Scannen einer ganzen Trefferliste deutlich erschwert. Die einzelnen Treffer sind zwar im Vergleich zu den früheren Suchportalen MEDPILOT und GREENPILOT besser voneinander abgegrenzt und die einzelnen Funktionen am Treffer besser bedienbar – ein Punkt der bei früheren Studien kritisiert wurde ([9], S. 29). Außerdem ist das Layout responsiv, es passt sich also automatisch unterschiedlichen Bildschirmgrößen an. Dies hat jedoch zur Folge, dass die einzelnen Treffer mehr Platz benötigen als bisher.

Abhilfe schaffen könnte eine optional einstellbare Listenansicht der Trefferliste. Damit würden Treffer – mit weniger Informationen und Funktionen – individuell als scannbare Liste dargestellt werden können. Diese Lösung wird aktuell intern einer Machbarkeitsprüfung unterzogen.

4.2 Entwicklung der Bedienfreundlichkeit insgesamt

Einzelne Bereiche des Fragebogens waren im Vergleich zur MEDPILOT-Usability-Studie 2012 identisch gestaltet, um die Wahrnehmung der Nutzerfreundlichkeit durch die Testpersonen beider Untersuchungen vergleichen zu können. Im Folgenden werden die beiden Themen näher beleuchtet, die 2012 am schlechtesten bewertet wurden: Trefferliste und Gesamteindruck.

4.2.1 Eindruck der Trefferliste verbessert

Insbesondere die Trefferliste hatte bei MEDPILOT 2012 in der Bewertung schlecht abgeschnitten. 92% der Testpersonen hatten sich damals negativ geäußert, besonders häufige Punkte waren ([9], S. 29):

  • Zu viele Informationen auf der Seite (54%)
  • Zu schwache Abgrenzung der Seiten-Elemente von einander (54%)
  • Seite wirkt „unübersichtlich“ (54%) bzw. „überladen“ (46%)

Im Gegensatz dazu äußerten sich 2015 bei LIVIVO nun 75% aller Testpersonen positiv über die Trefferseite:

  • Ansprechend, gute Aufteilung, nicht überladen (50%)
  • Die vielen Coverabbildungen sind hilfreich (42%)

Negativ äußerten sich 50%, wobei diesmal andere Kritikpunkte genannt wurden:

  • Einzelner Treffer nimmt zu viel Raum in Anspruch (50%)
  • Treffer nicht spezifisch genug (17%)
  • Dublette Treffer (17%)
4.2.2 Deutlich bessere Noten beim Gesamteindruck

Im Anschluss an die praktischen Aufgaben wurden die Testpersonen gebeten, basierend auf den Erfahrungen des Tests, spontan verschiedene Positiv- und Negativ-Aussagen zu benoten. Auch hier war eine deutliche Verbesserung wahrzunehmen, LIVIVO erhielt in allen Aussagen bessere Bewertungen als MEDPILOT. Im Durchschnitt konnte daher im Vergleich zu 2012 die Bewertung der positiven Aussagen deutlich gesteigert werden, die der negativen Aussagen deutlich verringert (Tabelle 1 [Tab. 1] zeigt den Durchschnitt der Positiv- und Negativ-Aussagen im Vergleich).

Am deutlichsten war der Unterschied bei Aussagen bezüglich der Komplexität bzw. der Einfachheit des Suchportals zu erkennen (Tabelle 2 [Tab. 2] zeigt alle Aussagen mit einer Abweichung um mehr als einen Punkt).

Insgesamt kann also ein Trend zu höherer Nutzerzufriedenheit erkannt werden. Die in der letzten Usability-Untersuchung vordergründlichen Themen wie Layout und fehlender roter Faden bei der Nutzerführung, kamen – mit Ausnahme des Platzbedarfs pro Treffer – diesmal nicht negativ zur Sprache.


5 Resümee

Praktische Usability-Tests im Bibliotheksbereich sind aktuell eher die Ausnahme als die Regel. Häufig sind Nutzer bibliothekarischer Suchportale gezwungen, diese Produkte unabhängig von deren Usability zu nutzen, z.B. weil sich für die Recherche in den Literaturbeständen und Verwaltung ihres Bibliothekskontos wenig Alternativen bieten. Vermehrt setzen Bibliotheken inzwischen auf Discovery Systeme kommerzieller Anbieter [19]. Ob diese in Sachen Usability jedoch die Lösung sind, darf ebenfalls diskutiert werden [20] – handelt es sich doch häufig um Komplettpakete, die wenig flexibel auf die Ansprüche individueller Nutzergruppen anpassbar sind [21].

Das beschriebene Projekt stellt exemplarisch vor, wie Usability-Untersuchungen sinnvoll in die Konzeptionierung und Weiterentwicklung von bibliothekarischen Webangeboten eingebunden werden können. Dabei werden wertvolle Hinweise für die Planung und praktische Ausgestaltung von Usability-Tests gegeben. Beim vorgestellten Beispiel LIVIVO hat sich die Einbeziehung von Usability-Test-Ergebnissen in die Produktneukonzeptionierung tatsächlich als sinnvoll herausgestellt. Praktische Benutzer-Tests haben nur eine Handvoll kritischer Probleme aufgedeckt, die zudem entweder bereits behoben sind oder für die ein Konzept zur Behebung existiert. LIVIVO konnte daher am 10.11.2015 den Beta-Status erfolgreich verlassen [22]. Die subjektive Wahrnehmung der Bedienfreundlichkeit des Portals, bewertet durch die Testpersonen, hat sich im Vergleich zum Vorgängerportal deutlich verbessert.


6 Ausblick

Nach Beseitigung der kritischsten Usability-Probleme sowie schnell zu behebender weniger kritischer Punkte, sollten weitere Untersuchungen tiefer in das Produkt vordringen, um auch abseits der Basis-Funktionalitäten Hürden der Gebrauchstauglichkeit aufzudecken. Weitere Studien könnten zudem helfen, die Ergebnisse der Bewertung der allgemeinen Bedienfreundlichkeit zu bestätigen oder zu entkräften.

Ein mögliches Konzept zur Verstetigung von Usability-Untersuchungen bei ZB MED könnte kürzere Testphasen mit einem kleineren Kreis Testpersonen vorsehen, in denen immer nur einzelne Teilbereiche des Suchportals genauer unter die Lupe genommen werden. Dabei könnte auch eine andere Methodik (z.B. kurze Online-Tests statt langer Interviews) von Vorteil für die Gewinnung von Teilnehmern aus dem Bereich Wissenschaft und Forschung sein. Kurzfristig realisierte Fehlerbehebungen bzw. Verbesserungen auf Basis der Ergebnisse sind Voraussetzung für den Erfolg dieses Konzepts ([3], S. 138).

Zur Optimierung der Planung und Durchführung zukünftiger Studien hat das Projekt wertvolle Erkenntnisse geliefert. Eine wichtige Empfehlung ist, die Observer-Rolle durch einen erfahrenen Usability-Experten zu besetzen, der schon während des Tests so viele Informationen wie möglich erfasst und Vorstrukturierungen des Materials vornimmt. Dadurch kann die sonst langwierige Auswertungszeit minimiert werden. Außerdem würde es sich nach den Erfahrungen dieses Projekts anbieten, bei ZB MED einen festen Raum für Usability-Untersuchungen mit entsprechender Ausstattung einzurichten (zu den Anforderungen an ein Usability-Labor z.B. [23], S. 168f.).

So ausgestattet wäre eine Ausweitung der Usability-Prüfungen auf andere ZB MED-Produkte ebenfalls kein Problem. Neben der ZB MED-Website (http://www.zbmed.de) würden sich dafür weitere Webangebote wie das ZB MED-Publikationsportal PUBLISSO (http://www.publisso.de) oder die ZB MED-Themenportale anbieten.


Anmerkungen

Interessenkonflikte

Die Autorin erklärt, dass sie keine Interessenkonflikte in Zusammenhang mit diesem Artikel hat.


Literatur

1.
Nielsen J. Designing Web Usability. The practice of simplicity. Indianapolis: New Riders Publ.; 2000.
2.
Richter G. Methoden der Usability-Forschung. In: Umlauf K, Fühles-Ubach S, Seadle M, editors. Handbuch Methoden der Bibliotheks- und Informationswissenschaft. Bibliotheks-, Benutzerforschung, Informationsanalyse. Berlin/Boston: De Gruyter; 2013. p. 203-56.
3.
Krug S. Don’t make me think! Web Usability – das intuitive Web. 2nd ed. Heidelberg: Redline; 2006.
4.
Schneider I. User Centered Design bei der Entwicklung von interaktiven Bibliotheksangeboten. 2014 Nov 13. Available from: http://blogs.tib.eu/wp/tib/2014/11/13/user-centered-design-bei-der-entwicklung-von-interaktiven-bibliotheksangeboten External link
5.
Deutsche Zentralbibliothek für Wirtschaftswissenschaften. Arbeitsschwerpunkt Usability. [cited 2016 Jan 17]. Available from: http://www.zbw.eu/de/ueber-uns/arbeitsschwerpunkte/usability External link
6.
ZB MED. Suchportal LIVIVO geht online. 2015 Apr 15. Available from: http://www.zbmed.de/ueber-uns/presse/neuigkeiten-aus-zb-med/artikel/suchportal-livivo-geht-online External link
7.
Hinnenthal K, Pössel J, Schuh D. Die Deutsche Zentralbibliothek für Medizin hat ihr Suchportal für Medizin und Gesundheitswesen um einen entscheidenden Schritt weiterentwickelt: Integration der Bibliothekskontofunktion in MEDPILOT. GMS Med Bibl Inf. 2012;12(1-2):Doc13. DOI: 10.3205/mbi000249 External link
8.
Poley C. Mit MEDPILOT auf dem Weg ins Semantic Web. GMS Med Bibl Inf. 2012;12(3):Doc22. DOI: 10.3205/mbi000258 External link
9.
Pössel J. MEDPILOT Usability-Studie. Bericht 2012 [interner Bericht, unveröffentlicht]. 2012.
10.
Dzyek W. Medizinische Literaturrecherche mit MEDPILOT, PubMed und Google. Leistungstest und Usability-Vergleich. Köln: Verl. Deutsche Zentralbibliothek für Medizin; 2011. DOI: 10.4126/38m-000000379 External link
11.
Dzyek W. Effektiv und nutzerfreundlich. Einsatz von semantischen Technologien und Usability-Methoden zur Verbesserung der medizinischen Literatursuche. Köln: Verl. Deutsche Zentralbibliothek für Medizin; 2010.
12.
El-Menouar Y. Evaluation der Virtuellen Fachbibliothek Medizin „MedPilot“. Ergebnisse einer internetbasierten Nutzerbefragung. Köln: Verl. Deutsche Zentralbibliothek für Medizin; 2004.
13.
Kauke V, Lucht M, Niesner S, Schünhoff L. Evaluation der Virtuellen Fachbibliothek „Greenpilot“ [MALIS-Hausarbeit, unveröffentlicht]. 2014.
14.
Heinold E. Markt- und Zielgruppenstudie. Gap-Analyse und Empfehlungen für die ZB MED – Endbericht. Köln: ZB MED – Leibniz-Informationszentrum Lebenswissenschaften; 2014. DOI: 10.4126/zbmed2014001 External link
15.
ZB MED. ZB MED veröffentlicht Ergebnisse von Markt- und Zielgruppenanalyse. 2015 Feb 04. Available from: http://www.zbmed.de/ueber-uns/presse/pressemitteilungen/artikel/zb-med-veroeffentlicht-ergebnisse-von-markt-und-zielgruppenanalyse-1 External link
16.
Lauesen S. User Interface Design. A Software engineering perspective. Harlow: Pearson/Addison-Wesley; 2005.
17.
Nielsen J, Loranger H. Web Usability. München: Addison Wesley; 2006.
18.
ZB MED. LIVIVO: Gute Noten beim Usability-Test. 2015 Oct 29. Available from: http://www.zbmed.de/ueber-uns/presse/neuigkeiten-aus-zb-med/artikel/livivo-gute-noten-beim-usability-test External link
19.
Herrlich B, Ledl A, Tréfás D. Editorial: Die Farbe des Katalogs. 027.7 Zeitschrift für Bibliothekskultur. 2013;1(2):43-6. DOI: 10.12685/027.7-1-2-25 External link
20.
Fagan JC, Mandernach MA, Nelson CS, Paulo JR, Saunders G. Usability Test Results for a Discovery Tool in an Academic Library 2012. Information Technology and Libraries. 2012 Mar;31(1):83-112. DOI: 10.6017/ital.v31i1.1855 External link
21.
Roscher M. Fachdisziplinäre Bedürfnisse in der Gestaltung von Discovery-Lösungen: Wirklich ein Katalog für alle? Berlin: Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin; 2014. (Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft; 356). Available from: http://edoc.hu-berlin.de/series/berliner-handreichungen/2014-356 External link
22.
ZB MED. Offizieller Start von LIVIVO – dem Suchportal für Lebenswissenschaften. 2015 Nov 10. Available from: http://www.zbmed.de/ueber-uns/presse/neuigkeiten-aus-zb-med/artikel/offizieller-start-von-livivo-dem-suchportal-fuer-lebenswissenschaften External link
23.
Sarodnick F, Brau H. Methoden der Usability Evaluation. Wissenschaftliche Grundlagen und praktische Anwendung. 2., überarb. und aktualisierte Aufl. Bern: Huber; 2011. (Wirtschaftspsychologie in Anwendung).