Perché array [idx++] + =" a " aumenta idx una volta in Java 8 ma due volte in Java 9 e 10?


Per una sfida, un collega codice golfista ha scritto il seguente codice:

import java.util.*;
public class Main {
  public static void main(String[] args) {
    int size = 3;
    String[] array = new String[size];
    Arrays.fill(array, "");
    for(int i = 0; i <= 100; ) {
      array[i++%size] += i + " ";
    }
    for(String element: array) {
      System.out.println(element);
    }
  }
}

Quando si esegue questo codice in Java 8, si ottiene il seguente risultato:

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 
2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101 
3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99 

Quando si esegue questo codice in Java 10, si ottiene il seguente risultato:

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 

La numerazione è completamente disattivata utilizzando Java 10. Quindi cosa sta succedendo qui? È un bug in Java 10?

Seguito dai commenti:

  • Il problema appare quando compilato con Java 9 o versioni successive (l'abbiamo trovato in Java 10). La compilazione di questo codice su Java 8, quindi l'esecuzione in Java 9 o in qualsiasi versione successiva, incluso Java 11 early access, fornisce il risultato atteso.
  • Questo tipo di codice non è standard, ma è valido secondo le specifiche. È stato trovato da Kevin Cruijssen in una discussione in una sfida di golf , da qui lo strano caso d'uso riscontrato.
  • Didier L ha scoperto che il problema può essere riprodotto con il codice molto più piccolo e comprensibile:

    class Main {
      public static void main(String[] args) {
        String[] array = { "" };
        array[test()] += "a";
      }
      static int test() {
        System.out.println("evaluated");
        return 0;
      }
    }
    

    Risultato quando compilato in Java 8:

    evaluated
    

    Risultato quando compilato in Java 9 e 10:

    evaluated
    evaluated
    
  • Il problema sembra essere limitato all'operatore di concatenazione e assegnazione delle stringhe (+=) con un'espressione con effetti collaterali come operando sinistro, come in array[test()]+="a", array[ix++]+="a", test()[index]+="a", oppure test().field+="a". Per abilitare la concatenazione di stringhe, almeno uno dei lati deve avere il tipo String. Il tentativo di riprodurre questo su altri tipi o costrutti non è riuscito.

Author: idmean, 2018-06-04

1 answers

Questo è un bug in javaca partire da JDK 9 (che ha apportato alcune modifiche per quanto riguarda la concatenazione delle stringhe, che sospetto sia parte del problema), come confermato dal team javac sotto l'id bug JDK-8204322. Se si guarda il bytecode corrispondente per la linea:

array[i++%size] += i + " ";

È:

  21: aload_2
  22: iload_3
  23: iinc          3, 1
  26: iload_1
  27: irem
  28: aload_2
  29: iload_3
  30: iinc          3, 1
  33: iload_1
  34: irem
  35: aaload
  36: iload_3
  37: invokedynamic #5,  0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;
  42: aastore

Dove l'ultimo aaload è il carico effettivo dall'array. Tuttavia, la parte

  21: aload_2             // load the array reference
  22: iload_3             // load 'i'
  23: iinc          3, 1  // increment 'i' (doesn't affect the loaded value)
  26: iload_1             // load 'size'
  27: irem                // compute the remainder

Che corrisponde approssimativamente all'espressione array[i++%size] (meno il carico effettivo e negozio), è lì due volte. Questo non è corretto, come dice la specifica in jls-15.26.2:

Un'espressione di assegnazione composta della forma E1 op= E2 è equivalente a E1 = (T) ((E1) op (E2)), dove T è il tipo di E1, tranne che E1 viene valutato solo una volta.

Quindi, per l'espressione array[i++%size] += i + " ";, la parte array[i++%size] dovrebbe essere valutata solo una volta. Ma viene valutato due volte (una volta per il carico e una volta per il negozio).

Quindi sì, questo è un bug.


Alcuni aggiornamenti:

Il bug è stato risolto in JDK 11 e ci sarà un back-port a JDK 10 (ma non JDK 9, poiché non riceve più aggiornamenti pubblici).

Aleksey Shipilev menziona sulla pagina JBS (e @ DidierL nei commenti qui):

Soluzione alternativa: compilare con -XDstringConcat=inline

Che tornerà ad usare StringBuilder per fare la concatenazione, e non ha il bug.

 581
Author: Jorn Vernee, 2018-07-19 13:51:18