1. #1
    Avatar von ZarneXxX
    Registriert seit
    05.04.2012
    Beiträge
    934
    Thanked 1.291 Times in 258 Posts

    Standard Screen zu Text mit Web ausgabe?

    Hallo zusammen,

    wollte mal fragen ob es vielleicht schon so ein Programm gibt das z.B. bei meinen Bildschirm einen bestimmten abschnitt den Text erkennt und ihn dann als Webdatei anzeigt.

    Situationsbeispiel:
    Du möchtest ein Spiel Chat online auf deiner Webseite anzeigen. (Das Spiel erlaubt den Spielern das zutun)
    Also hast du eine Software indem du den Chat bereich makierst.
    Die Software wandelt nun bei jeden Bild update, das Bild in Text um und speichert diese als (z.B.) HTML Datei an die dann Online für jeden erreichbar wäre.

    Um es dann Live zu machen, könnte man mit Websockets arbeiten usw. aber darum gehts ja erstmal nicht

    Gibt es bereits sowas oder etwas ähnliches?
    Und falls nicht, ist es schwer soetwas zu programmieren? (Wert)

    Mit freundlichen Grüßen, ZarneXxX

  2. #2
    Avatar von DMW007
    Registriert seit
    15.11.2011
    Beiträge
    6.081
    Thanked 9.118 Times in 2.995 Posts
    Blog Entries
    5

    Standard

    Hi,
    es gibt Programme wie Capture2Text, mit denen man einen Screenshot aufnehmen und in Klartext umwandeln kann. Das sieht dem ersten Blick nach aber eher nach einer händischen Lösung aus. Sprich der Screenshot wird wohl händisch angefertigt. Müsstest du dir mal genauer anschauen, ob es eine Möglichkeit gibt das zu automatisieren. Eventuell per CLI-Parameter, wenn es keine GUI-Einstellung dafür gibt. Alternativ kann man das dank Open Source auch forken und selbst umbauen.

    Grundsätzlich: Wenns unter Windows laufen soll (wovon ich bei Spielen mal ausgehe, da gibts am wenigsten Arbeit), brauchst du für Screenshots die Win-Api. Die ist ziemlich low level und daher nicht ganz einfach zu handhaben. Allerdings gibt es mächtige Screenshot-Tools wie z.B. ShareX, die ebenfalls Open Source sind. Damit lässt sich bestimmt etwas Arbeit sparen. Problematisch könnte ggf. das Aufnahmen von Screenshots im Vollbildmodus werden. Hab ich aber keine praktischen Erfahrungen dazu.

    Für die Texterkennung selbst gibts Bibliotheken wie z.B. tesseract-ocr. Die nehmen einem auch schon vieles ab. Es kommt allerdings immer drauf an, was für Bilder man als Datenmaterial hat. Hier mal ein in 10 Min erstelltes Beispiel vom Chatverlauf in U-Labs 2.0:
    Code:
    $ sudo apt-get install tesseract-ocr tesseract-ocr-deu
    $ tesseract Bilder/ul-chat-screenshot.png stdout -l deu
    Warning: Invalid resolution 0 dpi. Using 70 instead.
    Estimating resolution as 154
    Hallo. Corona macht den USA gerade ziemlich
    Druck, vor allem Trump
    
    
    OD Guten Morgen.
    Guten Morgen
    <
    OD Guten Morgen.
    Guten Morgen
    <
    OD Guten Morgen.
    Guten Morgen
    <
    CI Guten Morgen
    <
    OD Guten Morgen.
    Guten Morgen
    <
    Die Nachrichten selbst wurden ohne große Konfiguration bereits fehlerfrei erkannt. Es gibt aber noch Rauschen im Bild, die er wohl als OD/CI und < erkennt. Darüber hinaus fehlt Benutzername und Zeitstempel. Vermutlich durch den geringen Kontrast zum Hintergrund verursacht:


    Hier muss man dann etwas experimentieren und Farben ersetzen oder den Kontrast erhöhen, beispielsweise mit ImageMagick:

    Code:
    $ convert Bilder/ul-chat-screenshot.png -channel saturation -fuzz 10% -colorspace RGB Bilder/ul-chat-screenshot-mod.png
    $ tesseract Bilder/ul-chat-screenshot-mod.png stdout -l deu
    Warning: Invalid resolution 0 dpi. Using 70 instead.
    Estimating resolution as 149
    Hallo. Corona macht den USA gerade ziemlich
    
    Druck, vor allem Trump
    ‚Stehsegler - Vor 4 Sekunden
    
    ‚Guten Morgen.
    watermeloN - Vor 3 Stunden
    
    ‚Guten Morgen
    ‚Darkfield - Vor 5 Stunden
    
    ‚Guten Morgen.
    watermeloN - Vor 1 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 1 Tage
    
    ‚Guten Morgen.
    watermeloN - Vor 2 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 2 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 3 Tage
    
    ‚Guten Morgen.
    watermeloN - Vor 4 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 4 Tage
    Nun haben wir schon mal die Benutzernamen und Zeitstempel für OCR einfacher lesbar gestaltet. Das könnte man natürlich noch weiter optimieren, bis auch die Kommas nicht mehr fälschlicherweise erkannt werden. Hängt natürlich immer davon ab, was für Daten man hat. Je mehr Störfaktoren (Verschnörkelungen, schlechter Kontrast, nicht relevante Informationen etc) dort vorhanden sind, um so weniger muss man für gute Ergebnisse anpassen.

  3. The Following User Says Thank You to DMW007 For This Useful Post:

    Darkfield (28.06.2020)

Ähnliche Themen

  1. Antworten: 0
    Letzter Beitrag: 24.09.2016, 13:31
  2. echo Ausgabe abfangen ist doppelt
    Von Essah im Forum PHP
    Antworten: 5
    Letzter Beitrag: 20.04.2014, 00:19
  3. PHP IMDB ausgabe
    Von RiPLEYY im Forum PHP
    Antworten: 8
    Letzter Beitrag: 27.03.2014, 19:43
  4. VB.Net Regex Ausgabe bleibt leer?!
    Von One Way im Forum .Net
    Antworten: 2
    Letzter Beitrag: 05.03.2014, 15:39
  5. Textbox1.Text = Textbox7.Text + keys.enter
    Von gcp im Forum Hochsprachen
    Antworten: 20
    Letzter Beitrag: 22.03.2011, 22:13
Diese Seite nutzt Cookies, um das Nutzererlebnis zu verbessern. Klicken Sie hier, um das Cookie-Tracking zu deaktivieren.