Wer eine größere Linksammlung hat, stößt mit den klassischen Lesezeichen schnell an die Grenzen des Browsers. Spätestens, wenn dauerhafte Archivierung gewünscht ist. Eine ganze Reihe an quelloffener Software möchte Abhilfe schaffen. Ich habe Readeck, Linkwarden, LinkAce und Linkding angeschaut – die ersten beiden genauer. In diesem Beitrag stelle ich sie zusammen mit meinem Fazit vor.
Nutzungsszenarien: Wofür braucht man das?
Jeder Webbrowser besitzt heute eine Funktion zur Ablage von Lesezeichen. Sie lassen sich in Ordnern gruppieren sowie mit Schlagworten (Tags) versehen. Für viele alltägliche Anwendungszwecke reicht das aus: Interessante Artikel zum später lesen, Recherchen für die Klausur/Prüfung/Abschlussarbeit, Einarbeitung in neue Themen, Dinge die man kaufen möchte usw. Zusätzliche Software entfällt, da ohnehin jeder einen Browser nutzt.
Bei größeren Mengen fängt es an, schwierig zu werden. Insbesondere erweiterte Filter sind nur eingeschränkt oder gar nicht möglich. Beispielsweise das Eingrenzen auf bestimmte Schlagworte, Zeiträume (2022 angelegte Lesezeichen, Inhalt 2019 veröffentlicht usw) oder bestimmte Domains. Ein Stück weit kann man sich mit Workarounds behelfen, etwa „github.com <Suchbegriff>“ eingeben. Das enthält etwas Beifang (z.B. Suchmaschinenanfragen/Filter), ist allerdings dennoch nicht optimal.
Die Grenzen sind jedoch definitiv endgültig ausgeschöpft, wenn man Lesezeichen aus mehreren Browsern (z.B. Firefox und Brave) zusammenführen, bestimmte Ordner mit anderen Teilen oder Inhalte dauerhaft archivieren möchte. Das Teilen kann etwa nützlich sein, wenn man mit anderen an einer Recherche (Gruppenarbeit, Hobbys usw) arbeitet. Letzteres wird essenziell, um Inhalte dauerhaft verfügbar zu halten. Eine 2024 erschienene Studie untersuchte 1 Million Internetseiten über 10 Jahre (2013 – 2023). Die Hälfte stammt von US-Regierungsstellen, der Rest großteils Nachrichtenseiten und ein Teil aus der englischsprachigen Wikipedia. Ernüchterndes Ergebnis: 38% der Seiten, die 2013 noch existierten, sind 2023 nicht mehr erreichbar.1 Diese Feststellung habe ich bei älteren, persönlichen Browser-Lesezeichen ebenfalls bereits gemacht.
Meine Anforderungen
Mir geht es um zwei Szenarien: Das Wichtigste sind die Lesezeichen aus meinen RSS-Feeds Sie bewegen sich mittlerweile im 5-Stelligen Bereich, jedoch ohne Sortierung. Zum Einsatz kommt die Erweiterung NC News.2 Die Integration in Nextcloud ist praktisch und das Lesen funktioniert auf Android/PC problemlos. Ich möchte diese nach Themen, Veröffentlichungszeitpunkt sowie Quelle gruppieren. Ähnliches gilt für zahlreiche klassische Lesezeichen, die sich über die Jahre in Firefox angesammelt haben. Das Ziel ist, alle interessanten Webseiten an einer Stelle zu haben. So kann ich beispielsweise bei neuen Inhalten hier auf U-Labs zukünftig leichter auf ähnliche Ereignisse oder andere Parallelen hinweisen.
Die Archivierung ist ebenfalls notwendig, damit nicht ca. über 1/3 der Inhalte in 10 Jahren unbrauchbar wird. Teils ist eine Integration in das Internet Archiv vorhanden. Finde ich grundsätzlich ein tolles Projekt, leider mit Schwächen. Neben der Geschwindigkeit fehlen oft Medien wie z.B. Bilder. Das kann den Mehrwert einer Quelle deutlich reduzieren, wenn die Bilder wichtige Informationen enthielten, die im Text ggf. nur Teilweise abgebildet sind.
Die vier quelloffenen Werkzeuge zur Archivierung/Linkverwaltung
Es existieren derzeit fünf größere Projekte, um Lesezeichen plattformübergreifend zu pflegen.3 Wallabag hatte ich mir zuvor bereits angeschaut und konnte leider nicht überzeugen. Somit bleiben vier, die ich mir genauer angeschaut habe. Teilweise ist eine öffentliche Demo verfügbar, wie bei Linkding oder Linkace. Readeck und Linkwarden habe ich testweise lokal installiert. Beide wurden mit einigen Test-Links gefüttert, die es einzusortieren galt.
Readeck: Schlank, schnell und dennoch umfangreich
Mein erster Kandidat legt großen Wert auf Freiheit und Unabhängigkeit: Readeck nutzt konsequent die Infrastruktur von Codeberg. Neben dem Git-Repository mit Quellcode liegen dort auch die Docker-Abbilder.4 Die Installation ist sehr einfach und erfordert nur einen einzigen Container. Eine externe Datenbank wird nicht benötigt, da Readeck auf Sqlite setzt. Postgresql ist ebenfalls unterstützt,5 der Entwickler empfiehlt Sqlite. Meine Testinstanz mit knapp 20 Links benötigt im Betrieb nur rund 30 MB Arbeitsspeicher. Im Dateisystem belegt jedes Lesezeichen ca. 100 KB bis 400 KB – dies variiert je nach Inhalt. Die Software speichert Text und Bilder lokal ab.
Das Hinzufügen neuer Links ist hier am einfachsten: Link oben einfügen und rechts auf Save link klicken. Wenige Sekunden später erscheint er (meistens) mit Titel & Favicon der Seite, bei manchen schlägt dies fehl.
Ein Klick darauf zeigt den Inhalt aus dem lokalen Archiv an, d.H. die Seite ist komplett offline gespeichert. Schrift, Größe und Zeilenabstand lassen sich anpassen. Werbung sowie Cookie-Banner bleiben außen vor. In meinen Stichproben funktionierte das meistens gut, teils passabel. Das schlechteste Ergebnis lieferte ein Codeberg-Ticket, bei dem z.B. die Profilbilder der Kommentarschreiber viel zu groß den Lesefluss erheblich stören.
Rechts lassen sich Schlagworte festlegen. Während der Eingabe erscheinen bereits für andere Seiten genutzte Tags. Das Auflisten von z.B. häufig genutzten fehlt leider. Praktisch: Rechts werden die Metadaten (Veröffentlichungszeitpunkt, Autor) aus dem Artikel geladen und angezeigt. Auch die Möglichkeit, markierten Text als „Highlight“ speichern zu können, finde ich nützlich. Readeck zeigt alle markierten Stellen rechts an und erlaubt einen Sprung darauf per Klick, eben so sämtliche enthaltene Links. Auf der Startseite lässt sich sogar nach Markierungen in sämtlichen Artikeln filtern.
Um geöffnete Seiten aus dem Browser direkt speichern zu können, existieren Erweiterungen für Firefox und Chrome.6 Technisch hat es den Vorteil, dass der Abruf aus dem Browser heraus stattfindet, nicht per Readeck-Server. Somit können auch Seiten aus dem deep web archiviert werden: Etwa hinter einer Bezahlschranke, geschlossene Foren, kommerzielle Soziale Netzwerke mit Kontozwang usw. Im Alltag finde ich das sehr praktisch und schneller, als den Link manuell in Readeck einzufügen. Leider gibt es einen entscheidenden Nachteil: Selbst beim Tippen fehlen jegliche Vorschläge zu bereits existierenden Tags. In der Web-Version sind sie vorhanden und verhindern damit, versehentlich relevante Schlagworte zu übersehen oder ggf. ungewollt neue anzulegen.
Neu hinzugefügte Seiten gelten grundsätzlich als „ungelesen“. Archivierte erscheinen in einer eigenen Standard-Gruppe, eben so Favoriten (Herz-Symbol) und Artikel. Letztere grenzt Text-Artikel von beispielsweise YouTube-Videos ab. Bei Videos auf YouTube werden Titel und ein kurzer Anfang der Beschreibung erfasst, mehr jedoch nicht. Sollten Kanalbetreiber oder Plattform es löschen, ist das Video selbst verloren.
Zur Sortierung setzt Readeck auf Schlagworte (Labels). Zugewiesene Schlagworte werden unter jedem Lesezeichen angezeigt. Man sieht daher sofort, ob sie z.B. noch nicht oder unvollständig gepflegt sind. Ein Klick darauf zeigt alle Lesezeichen zu diesem Schlagwort.
Collections bieten mehr Möglichkeiten durch Suchfilter. Es erscheinen die gleichen Kriterien wie nach der Eingabe eines Suchbegriffs links oben. Im Unterschied zur normalen Suche lassen sich die Kriterien speichern. So können mehrere Schlagworte kombiniert werden – allerdings mit Leerzeichen statt Komma. Praktisch: Nach dem erstmaligen Anlegen zeigt die Collection ihre Treffer nach dem Speichern sofort an und hält die Filter geöffnet. Ist man mit den Ergebnissen nicht zufrieden, lassen sich die Kriterien ohne Klick-Orgie anpassen. Die Auswahl ist recht umfangreich: Seiten, Zeiträume, Inhaltsarten, Volltextsuche auf den Inhalt oder nur den Titel ist alles möglich. Nützlich finde ich ebenfalls das ein/ausschließen von Favoriten und archivierten Lesezeichen.
Insgesamt hat mich Readeck überzeugt: Die Oberfläche ist übersichtlich, reagiert schnell, der Funktionsumfang passt. Einstellungsmöglichkeiten gibt es – außer einem Hell/Dunkel Modus – keine. Ich habe sie auch nicht vermisst, bis ich bei meinen Tests einen Artikel doppelt hinzugefügt habe. Das wurde anstandslos durchgeführt, ohne Hinweis oder gar Fehler. Nachträglich habe ich beim ersten (untersten) ein Schlagwort hinzugefügt, um zu prüfen, ob evtl. eine Zusammenführung stattfindet. Doch beide haben sogar unterschiedliche IDs erhalten.
Das ist ein echtes Problem. Duplikate werden früher oder später vorkommen. Sind Seiten mehrfach vorhanden, dient das der Übersicht natürlich absolut nicht, im Gegenteil. In einem Ticket wird das Ignorieren von Duplikaten seit Januar 2024 diskutiert.7 Der Entwickler möchte eine Bestätigung des Nutzers vermeiden, die entscheidet, wie im Konfliktfall vorzugehen ist. Er sieht legitime Gründe dafür, die gleiche URL mehrmals zu speichern. Als Beispiel werden Fehler/Netzwerk-Probleme genannt.
Ansonsten besitzt Readeck noch die Möglichkeit, einzelne Artikel und gesamte Collections als Epub für E-Book Reader zu exportieren. Wer das nutzt findet das ggf. nützlich, für mich ist es uninteressant.
Linkwarden
Eine Nummer größer ist Linkwarden:8 Es versteht Collections anders, nämlich als Ordner zur Gruppierung von Artikeln. Sie können verschachtelt werden und heben sich durch Farben voneinander ab. Collections lassen sich öffentlich für alle stellen, oder man teilt sie mit bestimmten Mitgliedern. Damit eignet es sich z.B. zur gemeinsamen Recherche an Schule und Uni. Schlagworte sind als Ergänzung ebenfalls vorhanden. Jedes Lesezeichen darf sich nur in einer Collection befinden, dagegen sind Tags unbeschränkt.
Durch den möglichen parallelen Zugriff mehrerer Nutzer verbieten sich eingebettete Datenbanken wie Sqlite. Linkwarden verlangt daher nach Postgresql. Die Installation macht das nur minimal umfangreicher, ein paar zusätzliche Zeilen in der docker-compose.yml
genügen. Der Ressourcenverbrauch ist deutlich üppiger: 802 MB Arbeitsspeicher genehmigt sich Linkwarden selbst, dazu kommen noch mal gut ca. 51 MB für die vergleichsweise effiziente Postgresql.
Die Oberfläche wirkt anfangs bei der Anmeldung etwas altbacken, was sich nach der Anmeldung bessert. Insgesamt finde ich sie übersichtlich: Das Dashboard zeigt auf einen Blick, wie viele Links, Collections und Tags man hat. Die letzten Beiden werden links zudem aufgelistet und sind damit sogar schneller erreichbar, als bei Readeck. Leider macht Linkwarden diese Vorteile durch unnötige Klick-Orgien an anderer Stelle zunichte. Das Hinzufügen eines neuen Links erfordert mindestens drei Klicks, weil man rechts oben einen Kombi-Knopf für Links & Collections eingefügt hat. So etwas mag aus Sicht des Designers ästhetisch wirken. In der Praxis ist es jedoch ähnlich unsinnig, wie bei der Anmeldung das Passwort-Dialog auf eine zweite Seite zu verfrachten.
Ähnlich sieht es im Dialogfenster aus, welches sich bei New Link öffnet. Es versteckt die Schlagworte unter More Options und damit hinter einem weiteren Klick. Somit sind es in diesem Falle mindestens vier Klicks, bis der Link endlich gespeichert ist. Auch hier frage ich mich: Wozu? Drei Felder finden sich in den erweiterten Optionen. Die Zeiten von 800×600 Pixeln Auflösungen sind vorbei, dementsprechend könnte man sich diesen weiteren unnötigen Klick sparen.
Sinnvoll finde ich hingegen die Auflistung der bereits angelegten Schlagworte. Auf Wunsch kann im gesamten Tag gesucht werden. Wer z.B. nach „view“ sucht, findet das existierende Schlagwort „javs-viewer“, obwohl sich der Suchbegriff am Ende befindet.
Die Auswahl der Collections funktioniert ähnlich und ist ebenfalls durchdacht. Sie zeigt sogar Verschachtelungen (z.B. „Windows 11“ in „Microsoft“) sowie die Anzahl der bereits enthaltenen Lesezeichen. Schade: Zwar soll es möglich sein, direkt an dieser Stelle neue Kategorien anzulegen. In meinen Tests hat das jedoch nicht funktioniert, der Server schreibt eine Datenbank-Exception ins Log. An der Stelle bricht auch das Anlegen des Links ab und wird nie abgeschlossen.
Nach dem Anlegen wählt Linkwarden ein Bild aus dem Artikel als Vorschau, oder scheint teils selbst Bildschirmfotos zu generieren. Sie sind verschwommen und boten in meiner Stichprobe keinen Mehrwert. Teils sieht man lediglich Cookie-Banner, bei manchen wurde überhaupt kein Bild angezeigt. Insbesondere das Gitter-Layout ist mMn unnötig verschwenderisch: Nur 4 Lesezeichen passen in eine Zeile, bei Readeck sind es dagegen 6 – obwohl die Bildschirmbreite dort nicht ausgereizt wird.
Beide bieten oben rechts auch eine Listenansicht. Die ist deutlich kompakter, kommt dennoch nicht an Readeck heran: Sie enthält weniger Elemente und lässt Informationen wie die Schlagworte vermissen. Man sieht sie erst nach einem Rechtsklick auf Edit Link – wenig übersichtlich. Dafür zeigt Linkwarden als Zeitstempel zumindest an, wann sie hinzugefügt wurden. Den Veröffentlichungszeitpunkt ignoriert man.
Ebenfalls gut versteckt sind die archivierten Fassungen. Während bei Readeck ein Klick auf den Titel genügt, öffnet Linkwarden den originalen Link und verlangt den Umweg über das … Menü rechts auf Preserved Formats. Anschließend sieht man alle Formate, in denen die Seite lokal verfügbar ist.
Standardmäßig sind dies drei Stück: Readable öffnet eine Textversion, die jedoch leider in einigen Fällen durch Cookie-Banner oder Abo-Aufforderungen unbrauchbar ist. PDFs und Screenshots werden auf die gleiche Art erstellt und lassen sich in dem Fall ebenfalls nicht sinnvoll verwenden, wie folgendes Beispiel zeigt. Sehr schade, da sich PDF & Bildschirmfoto sogar direkt herunterladen lassen. Eine praktische Möglichkeit, um veränderte oder nicht mehr existierende Seiten in universellen Formaten weitergeben zu können. Readeck fehlen diese beiden Formate, konnte mit Cookie-Bannern & co. dafür allerdings besser umgehen. Ein funktionierendes Format ist hier mehr Wert, als drei kaputte.
Womit Linkwarden wiederum punkten kann: Ein Haken in den Einstellungen unter Preferences aktiviert das automatische Anlegen eines Snapshots auf Archive.org. Schöner wäre allerdings, dies (zusätzlich) pro Link auszuwählen. Schließlich möchte man ggf. nicht alle Inhalte pauschal dort hin senden, bzw. das Archiv mit beschränkten Inhalten (z.B. Bezahlschranken) zumüllen. Die anzulegenden lokalen Formate PDF & Screenshot lassen sich in den Einstellungen ebenfalls ändern, beide nur global.
Wie man am obigen Beispiel sehen kann, kümmert sich Linkwarden standardmäßig nicht um Duplikate. Wie bei Readeck werden sie normal angelegt, ohne zumindest einen Hinweis. Im Gegensatz dazu bietet Linkwarden in den Einstellungen unter Link Settings die Möglichkeit, das zu ändern. Ist Prevent duplicate links angehakt, verweigert die Software das Hinzufügen von bereits existierenden Links:
Direkt darunter lässt sich übrigens auch das Verhalten beim Klick auf den Titel ändern. Mit der Auswahl Open Readable, if available ist das Verhalten identisch zu Readeck. Dies macht in meinen Augen deutlich mehr Sinn, als die Standardeinstellung. Schließlich linkt der Domainname darunter bereits auf die originale Adresse, warum sollte es der Titel direkt darüber auch tun?
Mit deutschen Sonderzeichen kommt Linkwarden übrigens nicht klar – schei? Encoding!
Die Suche ist deutlich rudimentärer. Man kann lediglich für den gesamten Suchbegriff auswählen, in welchem von 5 Feldern (Titel, Link, Beschreibung, Tags, kompletter Inhalt) gesucht werden soll. Filter auf z.B. den Zeitraum sind gar nicht möglich. Lediglich die Treffer lassen sich danach sortieren. Das würde allerdings ohnehin wenig helfen, weil Linkwarden nur den Zeitstempel des Hinzufügens berücksichtigt. Ein Artikel von 2015, der 2024 hinzugefügt hat, ist hier also mit 2024 hinterlegt.
Wer mehrere Lesezeichen gleichzeitig ändern möchte, freut sich über die eingebaute Stapelverarbeitung. Sie ist nur in der All Links Ansicht vorhanden und wird über den Stift rechts oben aktiviert. Dann klickt man die gewünschten Einträge an und kann sie in eine Collection verschieben, oder Tags hinzufügen. Wahlweise lassen sich die bereits gesetzten Schlagworte löschen. Ansonsten ist der Funktionsumfang vergleichbar, auch Linkwarden bietet Browser-Erweiterungen.
Fazit
Linkwarden bietet einen größeren Funktionsumfang und ist für Mehrbenutzer-Instanzen interessant. Die Ordner (Collections) können beim Sortieren helfen, insbesondere wenn man hierarchisch strukturieren möchte. Durch Tags kommt die Flexibilität trotzdem nicht zu kurz. Dafür muss man an manchen Stellen Abstriche machen. Insbesondere das aufwändige Einpflegen der Links stört mich sehr. Das ist die Kernfunktion, welche man oft benutzt. Wenn ich hier doppelt so viel herum klicken muss, macht sich das schnell (nervig) bemerkbar. Solche Dinge wirken im Gegensatz zu z.B. den Collections weniger durdacht. Dass einige archivierte Seiten unbrauchbar sind, wiegt zudem schwer.
Readeck kann das besser und hat insgesamt im Alltag bei mir die bessere Figur gemacht. Daher sehr schade, dass hier keinerlei Prüfung auf Duplikate erfolgt – so entsteht schnell Chaos. Wenn das verbessert wurde, ist Readeck die wohl bessere Lösung für Einzelpersonen. Wer Lesezeichen teilen möchte, kommt nicht an Linkwarden vorbei – oder komplett auf öffentliches Teilen ausgelegte Plattformen, wie z.B. Shaarli.9
Quellen
- https://www.techbook.de/pc-mac/web-pc-mac/internet-inhalte-verschwunden ↩︎
- https://apps.nextcloud.com/apps/news ↩︎
- https://www.reddit.com/r/selfhosted/comments/15sdk0p/bookmark_and_archiving_solutions/ ↩︎
- https://codeberg.org/readeck/readeck/ ↩︎
- https://codeberg.org/readeck/readeck/src/branch/main/internal/bookmarks/bookmarks.go#L247 ↩︎
- https://addons.mozilla.org/en-US/firefox/addon/readeck/ ↩︎
- https://codeberg.org/readeck/readeck/issues/73 ↩︎
- https://linkwarden.app/ ↩︎
- https://github.com/shaarli/Shaarli ↩︎