1. #1
    U-Labs Elite
    Avatar von ZarneXxX
    Registriert seit
    05.04.2012
    Beiträge
    932
    Thanked 1.291 Times in 258 Posts

    Standard Screen zu Text mit Web ausgabe?

    Hallo zusammen,

    wollte mal fragen ob es vielleicht schon so ein Programm gibt das z.B. bei meinen Bildschirm einen bestimmten abschnitt den Text erkennt und ihn dann als Webdatei anzeigt.

    Situationsbeispiel:
    Du möchtest ein Spiel Chat online auf deiner Webseite anzeigen. (Das Spiel erlaubt den Spielern das zutun)
    Also hast du eine Software indem du den Chat bereich makierst.
    Die Software wandelt nun bei jeden Bild update, das Bild in Text um und speichert diese als (z.B.) HTML Datei an die dann Online für jeden erreichbar wäre.

    Um es dann Live zu machen, könnte man mit Websockets arbeiten usw. aber darum gehts ja erstmal nicht

    Gibt es bereits sowas oder etwas ähnliches?
    Und falls nicht, ist es schwer soetwas zu programmieren? (Wert)

    Mit freundlichen Grüßen, ZarneXxX

  2. #2
    Projektleitung
    Avatar von DMW007
    Registriert seit
    15.11.2011
    Beiträge
    4.534
    Thanked 8.758 Times in 2.711 Posts
    Blog Entries
    5

    Standard

    Hi,
    es gibt Programme wie Capture2Text, mit denen man einen Screenshot aufnehmen und in Klartext umwandeln kann. Das sieht dem ersten Blick nach aber eher nach einer händischen Lösung aus. Sprich der Screenshot wird wohl händisch angefertigt. Müsstest du dir mal genauer anschauen, ob es eine Möglichkeit gibt das zu automatisieren. Eventuell per CLI-Parameter, wenn es keine GUI-Einstellung dafür gibt. Alternativ kann man das dank Open Source auch forken und selbst umbauen.

    Grundsätzlich: Wenns unter Windows laufen soll (wovon ich bei Spielen mal ausgehe, da gibts am wenigsten Arbeit), brauchst du für Screenshots die Win-Api. Die ist ziemlich low level und daher nicht ganz einfach zu handhaben. Allerdings gibt es mächtige Screenshot-Tools wie z.B. ShareX, die ebenfalls Open Source sind. Damit lässt sich bestimmt etwas Arbeit sparen. Problematisch könnte ggf. das Aufnahmen von Screenshots im Vollbildmodus werden. Hab ich aber keine praktischen Erfahrungen dazu.

    Für die Texterkennung selbst gibts Bibliotheken wie z.B. tesseract-ocr. Die nehmen einem auch schon vieles ab. Es kommt allerdings immer drauf an, was für Bilder man als Datenmaterial hat. Hier mal ein in 10 Min erstelltes Beispiel vom Chatverlauf in U-Labs 2.0:
    Code:
    $ sudo apt-get install tesseract-ocr tesseract-ocr-deu
    $ tesseract Bilder/ul-chat-screenshot.png stdout -l deu
    Warning: Invalid resolution 0 dpi. Using 70 instead.
    Estimating resolution as 154
    Hallo. Corona macht den USA gerade ziemlich
    Druck, vor allem Trump
    
    
    OD Guten Morgen.
    Guten Morgen
    <
    OD Guten Morgen.
    Guten Morgen
    <
    OD Guten Morgen.
    Guten Morgen
    <
    CI Guten Morgen
    <
    OD Guten Morgen.
    Guten Morgen
    <
    Die Nachrichten selbst wurden ohne große Konfiguration bereits fehlerfrei erkannt. Es gibt aber noch Rauschen im Bild, die er wohl als OD/CI und < erkennt. Darüber hinaus fehlt Benutzername und Zeitstempel. Vermutlich durch den geringen Kontrast zum Hintergrund verursacht:


    Hier muss man dann etwas experimentieren und Farben ersetzen oder den Kontrast erhöhen, beispielsweise mit ImageMagick:

    Code:
    $ convert Bilder/ul-chat-screenshot.png -channel saturation -fuzz 10% -colorspace RGB Bilder/ul-chat-screenshot-mod.png
    $ tesseract Bilder/ul-chat-screenshot-mod.png stdout -l deu
    Warning: Invalid resolution 0 dpi. Using 70 instead.
    Estimating resolution as 149
    Hallo. Corona macht den USA gerade ziemlich
    
    Druck, vor allem Trump
    ‚Stehsegler - Vor 4 Sekunden
    
    ‚Guten Morgen.
    watermeloN - Vor 3 Stunden
    
    ‚Guten Morgen
    ‚Darkfield - Vor 5 Stunden
    
    ‚Guten Morgen.
    watermeloN - Vor 1 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 1 Tage
    
    ‚Guten Morgen.
    watermeloN - Vor 2 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 2 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 3 Tage
    
    ‚Guten Morgen.
    watermeloN - Vor 4 Tage
    
    ‚Guten Morgen
    ‚Darkfield- Vor 4 Tage
    Nun haben wir schon mal die Benutzernamen und Zeitstempel für OCR einfacher lesbar gestaltet. Das könnte man natürlich noch weiter optimieren, bis auch die Kommas nicht mehr fälschlicherweise erkannt werden. Hängt natürlich immer davon ab, was für Daten man hat. Je mehr Störfaktoren (Verschnörkelungen, schlechter Kontrast, nicht relevante Informationen etc) dort vorhanden sind, um so weniger muss man für gute Ergebnisse anpassen.

  3. The Following User Says Thank You to DMW007 For This Useful Post:

    Darkfield (28.06.2020)

Ähnliche Themen

  1. Antworten: 0
    Letzter Beitrag: 24.09.2016, 13:31
  2. echo Ausgabe abfangen ist doppelt
    Von Essah im Forum PHP
    Antworten: 5
    Letzter Beitrag: 20.04.2014, 00:19
  3. PHP IMDB ausgabe
    Von RiPLEYY im Forum PHP
    Antworten: 8
    Letzter Beitrag: 27.03.2014, 19:43
  4. VB.Net Regex Ausgabe bleibt leer?!
    Von One Way im Forum .Net
    Antworten: 2
    Letzter Beitrag: 05.03.2014, 15:39
  5. Textbox1.Text = Textbox7.Text + keys.enter
    Von gcp im Forum Hochsprachen
    Antworten: 20
    Letzter Beitrag: 22.03.2011, 22:13
Diese Seite nutzt Cookies, um das Nutzererlebnis zu verbessern. Klicken Sie hier, um das Cookie-Tracking zu deaktivieren.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192