1. #1
    Avatar von DotNet
    Registriert seit
    10.06.2015
    Beiträge
    661
    Thanked 316 Times in 185 Posts

    Standard Wie kann der Überlauf eines 32 Bit Integers verhindert werden?

    Datentypen haben ja Höchstwerte wie z.B. 2147483647 für einen 32 Bit Integer. Beim arbeiten mit vielen Daten, vor allem mathematischen Formeln, kommt es schnell vor, dass dieses Limit erreicht wird. Und nicht immer ist das vorhersehbar, wenn z.B. eine Funktion die etwas potenziert über mehrere Aufrufe anhand einer externen Eingabe sehr große Werte errechnet, die das Limit sprengen. Problematisch finde ich das vor allem darum, weil diese Fehler schwer zu finden sind. Ein ganz einfaches Beispiel:


    int overflow = INT_MAX;
    printf("INT_MAX: %d\nINT_MAX + 1: %d", overflow, ((int)overflow + 1));

    INT_MAX: 2147483647
    INT_MAX + 1: -21474836480
    Wird dieser Wert noch an verschiedenen Stellen weiterverarbeitet kann man sich auf eine lang andauernde Fehlersuche einstellen. Ich sehe keinen Weg das Problem zu beheben als die Berechnung in einem größeren Datentyp durchzuführen und zu prüfen, ob das Ergebnis größer ist als es der Rückgabetyp erlaubt. Beispielhaft habe ich dafür in C++ eine Funktion geschrieben, die den Wert eines Integers um eins erhöht und zurückgeben soll, ohne wegen eines Werteüberlaufes unsinnige Werte zu erzeugen:

    int increment(int in) {
    double real_sum = (double)in + 1;
    if (real_sum > INT_MAX) {
    return -1;
    }
    else {
    return (int)real_sum;
    }
    }

    Aufgerufen wird es zum Testen mit INT_MAX, einer Konstante aus limits.h, die den höchsten Wert angibt, den ein Integer haben kann:

    int result = increment(INT_MAX);
    if (result == -1) {
    printf("'%d' ist groesser als der maximale Wert %d!", result, INT_MAX);
    }
    else {
    printf("Ergebnis: %d", result);
    }

    Das funktioniert. Aber ich finde es von der Logik her unschön, weil das doppelte an Speicher (64 Bit) benötigt wird als es die Funktion mit einem 32 Bit Integer vorsieht. Auch das Handling gefällt mir nicht: Ich muss immer von Hand prüfen, vergesse ich es, habe ich den Salat. Wieso wird keine Exception geworfen, wenn ich etwas wie

    int overflow = INT_MAX + 1;

    mache? Das wäre doch viel besser, besser ein Ende mit Schrecken als wie ein Schrecken ohne Ende.

    Update:
    Zu meiner Verwunderung ist das auch bei modernen Sprachen wie C# nicht anders. Ich hatte dieses Verhalten für ein Relikt von C++ gehalten. Warum wird keine Exception geworfen, wenn ich so etwas wie

    int overflow = INT_MAX + 1;

    mache? Das wäre doch viel besser, besser ein Ende mit Schrecken als wie ein Schrecken ohne Ende. Wenn meine Berechnung derart falsch ist bringt es mir überhaupt nichts, wenn das Programm mit unsinnigen Werten fortfährt!
    Geändert von DotNet (16.02.2016 um 20:36 Uhr)

    Im Krieg gibt es keine Gewinner, nur Verlierer!

  2. The Following User Says Thank You to DotNet For This Useful Post:

    Negok (17.02.2016)

  3. #2
    Avatar von Nuebel
    Registriert seit
    23.11.2013
    Beiträge
    446
    Thanked 361 Times in 236 Posts

    Standard AW: Wie kann der Überlauf eines 32 Bit Integers verhindert werden?

    Grundsätzlich beugt man dem vor, indem man eine Vorstellung davon hat, wie seine Daten ungefähr aussehen, und man (Unit-)Tests schreibt.
    In C/C++ ist das Verhalten nach einem Overflow undefiniert. Zumindest bei signed Datentypen. Der Compiler kann dagegen nichts machen, weil in 99,99% der Fälle ein solcher Overflow zur Laufzeit auftritt und nicht zur Compilezeit. Einige Compiler (wie GCC z.B.) bieten built-in-Funktionen, die einen schnellen Overflow-Test durchführen. Kann man selbst schreiben, wie du es getan hast. Geht aber auch mit Bitpositionen und bisschen Verständnis binärer Mathematik. Weil das Verhalten allerdings undefiniert ist, kann es durchaus vorkommen, dass der Compiler den Overflow-Test weg optimiert.

    Zitat Zitat von DotNet
    Das funktioniert. Aber ich finde es von der Logik her unschön, weil das doppelte an Speicher (64 Bit) benötigt wird als es die Funktion mit einem 32 Bit Integer vorsieht.
    Auch wenn das löblich ist, die Sorgen wären ein paar Jahrzehnte zurück berechtigt gewesen.
    Statt double hättest du aber auch einfach unsigned (kurz für unsigned int) nehmen können. Dann bleibst du bei deinen 32 Bit, hast nur einen geänderten Wertebereich, 0 bis ~4 Millarden.

  4. #3
    Avatar von DotNet
    Registriert seit
    10.06.2015
    Beiträge
    661
    Thanked 316 Times in 185 Posts

    Standard AW: Wie kann der Überlauf eines 32 Bit Integers verhindert werden?

    Dass der Compiler es nicht erkennen kann ist mir bewusst. Aber zur Laufzeit sollte es doch möglich sein zu prüfen, ob das Ergebnis einer Berechnung in den dafür vorgesehenen Datentyp passt, und falls nein eine Exception zu werfen. Die könnte man dann wiederum abfangen und das Programm zumindest kontrolliert abbrechen, was ich besser finde wie wenn es irgendeinen Unsinn berechnet. Mit einem unsigned Integer könnte man den Wertebereich erhöhen, ja. Mir geht es aber nicht nur darum, für diesen einen Fall eine Lösung zu finden, sondern eher eine generelle. Grade wenn man mathematische Formeln anwendet ist es eben schwer eine Vorstellung zu haben, wie die Daten ungefähr aussehen.

    Ein gutes Beispiel ist dafür der vor ein paar Tagen geschriebene Artikel Fibonacci-Zahlen berechnen. Je nachdem was ich da für einen Input habe, kommt am Ende eine sehr kleine Zahl heraus, für die sogar ein short Integer ausreichend wäre. Genau so kann eine größere Zahl den Integer aber auch sprengen. Sicher mag es auf aktuellen PCs bei einfachen Berechnungen keinen spürbaren Unterschied machen, ob das nun ein Integer oder Double ist. Das sieht aber schnell anders aus, wenn man z.B. für den Raspberry programmiert und dazu mehrere Aufrufe dieser Funktion hat. Oder wenn Rekursion verwendet wird. Die alten C und C++ Sprachen haben ja keinen Garbage Collector, d.H. wenn ich rekursiv eine Funktion z.B. 100x aufrufe habe ich 100x Speicher für den jeweiligen Datentyp belegt, oder? Moderne Sprachen wie Java oder C# dürften hier mit dem GC zwischendrin mal aufräumen nehme ich an.

    Im Krieg gibt es keine Gewinner, nur Verlierer!

  5. #4
    Avatar von Nuebel
    Registriert seit
    23.11.2013
    Beiträge
    446
    Thanked 361 Times in 236 Posts

    Standard AW: Wie kann der Überlauf eines 32 Bit Integers verhindert werden?

    Zitat Zitat von DotNet
    Aber zur Laufzeit sollte es doch möglich sein zu prüfen[...]
    Wenn wir von C++/CLI (sog. Managed C++) absehen, gibt es keine Laufzeitumgebung, die das tun könnte. C/C++ kompilieren zu nativen Programmen.
    Das, was du suchst, findest du bei Java und .NET zum Beispiel. In deinem Eingangspost hast du dich darüber gewundert, dass es in C# nicht anders sei. Ist es aber, nur nicht per default.

    int overflow = checked(INT_MAX + 1);

    Google mal nach "checked vs. unchecked exceptions". Da ist ein Krieg zugange mit Hasstiraden auf checked exceptions.
    Zitat Zitat von DotNet
    Mir geht es aber nicht nur darum, für diesen einen Fall eine Lösung zu finden, sondern eher eine generelle.
    Ich weiß, ich kenne das. Geht mir genau so. Egal was ist, ich will immer ein Abstraktionsniveau höher. Eine Generallösung für die Generallösung.

    Zitat Zitat von DotNet
    Grade wenn man mathematische Formeln anwendet ist es eben schwer eine Vorstellung zu haben, wie die Daten ungefähr aussehen.
    Nein, im Gegenteil. Die gesamte Analysis (sehr großer Teilbereich der Mathematik) beschäftigt sich genau damit. Insbesondere die Grenzwertberechnung ist hier von Interesse.

    Zitat Zitat von DotNet
    Die alten C und C++ Sprachen haben ja keinen Garbage Collector, d.H. wenn ich rekursiv eine Funktion z.B. 100x aufrufe habe ich 100x Speicher für den jeweiligen Datentyp belegt, oder? Moderne Sprachen wie Java oder C# dürften hier mit dem GC zwischendrin mal aufräumen nehme ich an.
    Auf die "erste Art" Rekursion, die man lernt, mag das zutreffen, dass dabei sehr viel Stack-Speicher in Anspruch genommen werden kann. Aber es gibt eine "weitere Art" der Rekursion, sie nennt sich Tail Call Recursion (Endrekursion) und die vernünftigen C/C++-Implementierungen bieten auch sogenannte Tail Call Optimization an. Dann verhält sich die Rekursion speichermäßig genau so wie der iterative Ansatz. Und man behält die Eleganz der Rekursion.
    Übrigens: mit dem Garbage Collector hat das nichts zu tun. Der kommt (nur) beim Heap-Speicher zum Einsatz und nicht beim Stack, der bei Rekursionen schnell zum Nadelöhr werden kann. Sonderfall: wenn man in der rekursiven Funktion Speicher auf dem Heap reserviert.
    Mit der Aussage, dass es in C/C++ keinen GC gibt, hast du aber Recht. Ist aber auch nicht weiter schlimm. Es ist nur ein Mythos, dass manuelle Speicherverwaltung schwierig sei. Die Gegenargumente kommen meistens von Leuten, die es nie richtig gelernt hatten (oder wollten). Faustregel: auf jedes (c|m)alloc folgt ein free. Man kann sich auch einen einfachen Referenzzähler schreiben, dann wird das noch einfacher (und besser). Analog dazu für C++: auf jedes new folgt ein delete bzw. ab C++11 bitte Smart Pointer (shared_ptr z.B.) verwenden.

    Da man den iterativen Ansatz im Artikel bereits sehen kann, habe ich hier beide Rekursionsvarianten mal geschrieben:


    #include <stdio.h>
    #include <stdint.h>
    #include <stdlib.h>


    uint32_t fibonacci_tailrec(uint32_t a, uint32_t b, uint32_t n) {
    if (n == 0) {
    return a;
    }
    return fibonacci_tailrec(b, a + b, --n);
    }


    uint32_t fibonacci_rec(uint32_t n) {
    if (n < 2) {
    return n;
    }
    return fibonacci_rec(n - 1) + fibonacci_rec(n - 2);
    }


    int main(int argc, char *argv[]) {
    for (uint32_t i = 1; i <= 10; ++i) {
    uint32_t res_tailrec = fibonacci_tailrec(0, 1, i);
    uint32_t res_rec = fibonacci_rec(i);
    printf("Die %d. Fibonacci-Zahl lautet: %d (%d)\n", i, res_tailrec, res_rec);
    }
    return EXIT_SUCCESS;
    }


    Grafisch wird das noch deutlicher.

    Normale Rekursion:




    Es handelt sich um einen Binärbaum. Die Traversierung (also das Durchlaufen) erfolgt in pre-order (Tiefensuche):
    (man sollte vielleicht anmerken, dass nicht jede Rekursion einen Binärbaum erzeugt. Das ist nur der Fall, wenn zwei Funktionsaufrufe verknüpft werden, wie das zum Beispiel bei den Fibonacci-Zahlen der Fall ist)




    Damit ergibt sich folgende Aufrufreihenfolge:



    Vergleiche dazu Endrekursion:



    15 vs 6 Aufrufe.
    Lässt sich mit folgendem Code auch zeigen:


    #include <stdio.h>
    #include <stdint.h>
    #include <stdlib.h>


    uint32_t fibonacci_tailrec(uint32_t a, uint32_t b, uint32_t n) {
    static uint32_t calls = 0;
    ++calls;
    printf("%d. Aufruf: fibonacci_tailrec(%d, %d, %d)\n", calls, a, b, n);
    if (n == 0) {
    return a;
    }
    return fibonacci_tailrec(b, a + b, --n);
    }


    uint32_t fibonacci_rec(uint32_t n) {
    static uint32_t calls = 0;
    ++calls;
    printf("%d. Aufruf: fibonacci_rec(%d)\n", calls, n);
    if (n < 2) {
    return n;
    }
    return fibonacci_rec(n - 1) + fibonacci_rec(n - 2);
    }


    int main(int argc, char *argv[]) {
    uint32_t res_tailrec = fibonacci_tailrec(0, 1, 5);
    printf("\n");
    uint32_t res_rec = fibonacci_rec(5);

    return EXIT_SUCCESS;
    }





    Ich lerne zur Zeit Clojure. Das ist ein LISP-Dialekt für die JVM. Um zu verdeutlichen wie sehr durch Tail Call optimiert werden kann:
    Code:
    (defn fibonacci
      [a b n]
      (cond (= n 0) (bigint a)
            :else (recur (bigint b) (+ a b) (dec n))))
    (Das Logik-Äquivalent zu fibonacci_tailrec in C)
    Aufruf:
    Code:
    (fibonacci 0 1 100000)
    Ergebnis:
    Code:

    (Ja, das ist eine einzige Zahl. Die 100.000te Fibonacci-Zahl mit 20.899 Ziffern). Das konnte mir meine lahme Kiste in wenigen Millisekunden ohne StackOverflow berechnen. Auf der ach-so langsamen JVM.
    Geändert von Nuebel (21.02.2016 um 02:37 Uhr)

  6. The Following User Says Thank You to Nuebel For This Useful Post:

    DMW007 (13.03.2016)

Ähnliche Themen

  1. Kann Hund von Menschen schwanger werden?
    Von boyrider im Forum RealLife
    Antworten: 11
    Letzter Beitrag: 31.10.2018, 17:57
  2. Kann Tetrapack-Wein schlecht werden?
    Von The Dope Show im Forum Sport & Gesundheit
    Antworten: 6
    Letzter Beitrag: 27.12.2013, 18:31
  3. Kann SSL abgehört werden?
    Von ThunderStorm im Forum Security
    Antworten: 4
    Letzter Beitrag: 11.07.2013, 18:31
  4. Antworten: 0
    Letzter Beitrag: 24.06.2013, 17:29
  5. Speicherkarte kann nicht formatiert werden
    Von Bossover im Forum Hardware
    Antworten: 6
    Letzter Beitrag: 22.04.2012, 13:37
Diese Seite nutzt Cookies, um das Nutzererlebnis zu verbessern. Klicken Sie hier, um das Cookie-Tracking zu deaktivieren.