aboutsummaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
-rw-r--r--lib/Target/ARM/ARMISelLowering.cpp10
-rw-r--r--lib/Target/ARM/ARMPerfectShuffle.h2683
-rw-r--r--test/CodeGen/ARM/vrev.ll5
-rw-r--r--utils/PerfectShuffle/PerfectShuffle.cpp2
4 files changed, 1353 insertions, 1347 deletions
diff --git a/lib/Target/ARM/ARMISelLowering.cpp b/lib/Target/ARM/ARMISelLowering.cpp
index 18d3008..67cb293 100644
--- a/lib/Target/ARM/ARMISelLowering.cpp
+++ b/lib/Target/ARM/ARMISelLowering.cpp
@@ -4182,7 +4182,15 @@ static SDValue GeneratePerfectShuffle(unsigned PFEntry, SDValue LHS,
switch (OpNum) {
default: llvm_unreachable("Unknown shuffle opcode!");
case OP_VREV:
- return DAG.getNode(ARMISD::VREV64, dl, VT, OpLHS);
+ // VREV divides the vector in half and swaps within the half.
+ if (VT.getVectorElementType() == MVT::i32)
+ return DAG.getNode(ARMISD::VREV64, dl, VT, OpLHS);
+ // vrev <4 x i16> -> VREV32
+ if (VT.getVectorElementType() == MVT::i16)
+ return DAG.getNode(ARMISD::VREV32, dl, VT, OpLHS);
+ // vrev <4 x i8> -> VREV16
+ assert(VT.getVectorElementType() == MVT::i8);
+ return DAG.getNode(ARMISD::VREV16, dl, VT, OpLHS);
case OP_VDUP0:
case OP_VDUP1:
case OP_VDUP2:
diff --git a/lib/Target/ARM/ARMPerfectShuffle.h b/lib/Target/ARM/ARMPerfectShuffle.h
index 13d0f1c..18e1620 100644
--- a/lib/Target/ARM/ARMPerfectShuffle.h
+++ b/lib/Target/ARM/ARMPerfectShuffle.h
@@ -14,21 +14,21 @@
// 31 entries have cost 0
// 242 entries have cost 1
-// 1435 entries have cost 2
-// 3712 entries have cost 3
-// 1140 entries have cost 4
-// 1 entries have cost 5
+// 1447 entries have cost 2
+// 3602 entries have cost 3
+// 1237 entries have cost 4
+// 2 entries have cost 5
// This table is 6561*4 = 26244 bytes in size.
static const unsigned PerfectShuffleTable[6561+1] = {
135053414U, // <0,0,0,0>: Cost 1 vdup0 LHS
1543503974U, // <0,0,0,1>: Cost 2 vext2 <0,0,0,0>, LHS
2618572962U, // <0,0,0,2>: Cost 3 vext2 <0,2,0,0>, <0,2,0,0>
- 2232510603U, // <0,0,0,3>: Cost 3 vrev <3,0,0,0>
+ 2568054923U, // <0,0,0,3>: Cost 3 vext1 <3,0,0,0>, <3,0,0,0>
1476398390U, // <0,0,0,4>: Cost 2 vext1 <0,0,0,0>, RHS
2550140624U, // <0,0,0,5>: Cost 3 vext1 <0,0,0,0>, <5,1,7,3>
2550141434U, // <0,0,0,6>: Cost 3 vext1 <0,0,0,0>, <6,2,7,3>
- 2256401391U, // <0,0,0,7>: Cost 3 vrev <7,0,0,0>
+ 2591945711U, // <0,0,0,7>: Cost 3 vext1 <7,0,0,0>, <7,0,0,0>
135053414U, // <0,0,0,u>: Cost 1 vdup0 LHS
2886516736U, // <0,0,1,0>: Cost 3 vzipl LHS, <0,0,0,0>
1812775014U, // <0,0,1,1>: Cost 2 vzipl LHS, LHS
@@ -50,17 +50,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1946992796U, // <0,0,2,u>: Cost 2 vtrnl LHS, LHS
2635163787U, // <0,0,3,0>: Cost 3 vext2 <3,0,0,0>, <3,0,0,0>
2686419196U, // <0,0,3,1>: Cost 3 vext3 <0,3,1,0>, <0,3,1,0>
- 2691875078U, // <0,0,3,2>: Cost 3 vext3 <1,2,3,0>, <0,3,2,1>
+ 2686492933U, // <0,0,3,2>: Cost 3 vext3 <0,3,2,0>, <0,3,2,0>
2617248156U, // <0,0,3,3>: Cost 3 vext2 <0,0,0,0>, <3,3,3,3>
2617248258U, // <0,0,3,4>: Cost 3 vext2 <0,0,0,0>, <3,4,5,6>
3826551298U, // <0,0,3,5>: Cost 4 vuzpl <0,2,0,2>, <3,4,5,6>
3690990200U, // <0,0,3,6>: Cost 4 vext2 <0,0,0,0>, <3,6,0,7>
3713551042U, // <0,0,3,7>: Cost 4 vext2 <3,7,0,0>, <3,7,0,0>
- 2695856444U, // <0,0,3,u>: Cost 3 vext3 <1,u,3,0>, <0,3,u,1>
+ 2635163787U, // <0,0,3,u>: Cost 3 vext2 <3,0,0,0>, <3,0,0,0>
2617248658U, // <0,0,4,0>: Cost 3 vext2 <0,0,0,0>, <4,0,5,1>
2888450150U, // <0,0,4,1>: Cost 3 vzipl <0,4,1,5>, LHS
3021570150U, // <0,0,4,2>: Cost 3 vtrnl <0,2,4,6>, LHS
- 3772326241U, // <0,0,4,3>: Cost 4 vext3 <2,3,4,0>, <0,4,3,2>
+ 3641829519U, // <0,0,4,3>: Cost 4 vext1 <3,0,0,4>, <3,0,0,4>
3021570252U, // <0,0,4,4>: Cost 3 vtrnl <0,2,4,6>, <0,2,4,6>
1543507254U, // <0,0,4,5>: Cost 2 vext2 <0,0,0,0>, RHS
2752810294U, // <0,0,4,6>: Cost 3 vuzpl <0,2,0,2>, RHS
@@ -68,9 +68,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1543507497U, // <0,0,4,u>: Cost 2 vext2 <0,0,0,0>, RHS
2684354972U, // <0,0,5,0>: Cost 3 vext3 <0,0,0,0>, <0,5,0,7>
2617249488U, // <0,0,5,1>: Cost 3 vext2 <0,0,0,0>, <5,1,7,3>
- 3635865015U, // <0,0,5,2>: Cost 4 vext1 <2,0,0,5>, <2,0,0,5>
+ 3765617070U, // <0,0,5,2>: Cost 4 vext3 <1,2,3,0>, <0,5,2,7>
3635865780U, // <0,0,5,3>: Cost 4 vext1 <2,0,0,5>, <3,0,4,5>
- 3761709497U, // <0,0,5,4>: Cost 4 vext3 <0,5,4,0>, <0,5,4,0>
+ 2617249734U, // <0,0,5,4>: Cost 3 vext2 <0,0,0,0>, <5,4,7,6>
2617249796U, // <0,0,5,5>: Cost 3 vext2 <0,0,0,0>, <5,5,5,5>
2718712274U, // <0,0,5,6>: Cost 3 vext3 <5,6,7,0>, <0,5,6,7>
2617249960U, // <0,0,5,7>: Cost 3 vext2 <0,0,0,0>, <5,7,5,7>
@@ -79,20 +79,20 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3963609190U, // <0,0,6,1>: Cost 4 vzipl <0,6,2,7>, LHS
2617250298U, // <0,0,6,2>: Cost 3 vext2 <0,0,0,0>, <6,2,7,3>
3796435464U, // <0,0,6,3>: Cost 4 vext3 <6,3,7,0>, <0,6,3,7>
- 3773137420U, // <0,0,6,4>: Cost 4 vext3 <2,4,6,0>, <0,6,4,2>
- 3785744919U, // <0,0,6,5>: Cost 4 vext3 <4,5,6,0>, <0,6,5,4>
+ 3659762998U, // <0,0,6,4>: Cost 4 vext1 <6,0,0,6>, RHS
+ 3659763810U, // <0,0,6,5>: Cost 4 vext1 <6,0,0,6>, <5,6,7,0>
2617250616U, // <0,0,6,6>: Cost 3 vext2 <0,0,0,0>, <6,6,6,6>
2657727309U, // <0,0,6,7>: Cost 3 vext2 <6,7,0,0>, <6,7,0,0>
2658390942U, // <0,0,6,u>: Cost 3 vext2 <6,u,0,0>, <6,u,0,0>
2659054575U, // <0,0,7,0>: Cost 3 vext2 <7,0,0,0>, <7,0,0,0>
- 2689073728U, // <0,0,7,1>: Cost 3 vext3 <0,7,1,0>, <0,7,1,0>
+ 3635880854U, // <0,0,7,1>: Cost 4 vext1 <2,0,0,7>, <1,2,3,0>
3635881401U, // <0,0,7,2>: Cost 4 vext1 <2,0,0,7>, <2,0,0,7>
- 3310897858U, // <0,0,7,3>: Cost 4 vrev <3,7,0,0>
+ 3734787298U, // <0,0,7,3>: Cost 4 vext2 <7,3,0,0>, <7,3,0,0>
2617251174U, // <0,0,7,4>: Cost 3 vext2 <0,0,0,0>, <7,4,5,6>
- 3779846759U, // <0,0,7,5>: Cost 4 vext3 <3,5,7,0>, <0,7,5,3>
- 2718712434U, // <0,0,7,6>: Cost 3 vext3 <5,6,7,0>, <0,7,6,5>
+ 3659772002U, // <0,0,7,5>: Cost 4 vext1 <6,0,0,7>, <5,6,7,0>
+ 3659772189U, // <0,0,7,6>: Cost 4 vext1 <6,0,0,7>, <6,0,0,7>
2617251436U, // <0,0,7,7>: Cost 3 vext2 <0,0,0,0>, <7,7,7,7>
- 2720039556U, // <0,0,7,u>: Cost 3 vext3 <5,u,7,0>, <0,7,u,5>
+ 2659054575U, // <0,0,7,u>: Cost 3 vext2 <7,0,0,0>, <7,0,0,0>
135053414U, // <0,0,u,0>: Cost 1 vdup0 LHS
1817419878U, // <0,0,u,1>: Cost 2 vzipl LHS, LHS
1947435110U, // <0,0,u,2>: Cost 2 vtrnl LHS, LHS
@@ -109,7 +109,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2626543954U, // <0,1,0,4>: Cost 3 vext2 <1,5,0,1>, <0,4,1,5>
4094985216U, // <0,1,0,5>: Cost 4 vtrnl <0,2,0,2>, <1,3,5,7>
2592019278U, // <0,1,0,6>: Cost 3 vext1 <7,0,1,0>, <6,7,0,1>
- 2256475128U, // <0,1,0,7>: Cost 3 vrev <7,0,1,0>
+ 2592019448U, // <0,1,0,7>: Cost 3 vext1 <7,0,1,0>, <7,0,1,0>
1557447325U, // <0,1,0,u>: Cost 2 vext2 <2,3,0,1>, LHS
1476476938U, // <0,1,1,0>: Cost 2 vext1 <0,0,1,1>, <0,0,1,1>
2886517556U, // <0,1,1,1>: Cost 3 vzipl LHS, <1,1,1,1>
@@ -147,17 +147,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2754235702U, // <0,1,4,6>: Cost 3 vuzpl <0,4,1,5>, RHS
2592052220U, // <0,1,4,7>: Cost 3 vext1 <7,0,1,4>, <7,0,1,4>
1557450281U, // <0,1,4,u>: Cost 2 vext2 <2,3,0,1>, RHS
- 2217984414U, // <0,1,5,0>: Cost 3 vrev <0,5,1,0>
+ 3765617775U, // <0,1,5,0>: Cost 4 vext3 <1,2,3,0>, <1,5,0,1>
2647781007U, // <0,1,5,1>: Cost 3 vext2 <5,1,0,1>, <5,1,0,1>
3704934138U, // <0,1,5,2>: Cost 4 vext2 <2,3,0,1>, <5,2,3,0>
2691875984U, // <0,1,5,3>: Cost 3 vext3 <1,2,3,0>, <1,5,3,7>
- 2649771906U, // <0,1,5,4>: Cost 3 vext2 <5,4,0,1>, <5,4,0,1>
+ 2657734598U, // <0,1,5,4>: Cost 3 vext2 <6,7,0,1>, <5,4,7,6>
2650435539U, // <0,1,5,5>: Cost 3 vext2 <5,5,0,1>, <5,5,0,1>
2651099172U, // <0,1,5,6>: Cost 3 vext2 <5,6,0,1>, <5,6,0,1>
2651762805U, // <0,1,5,7>: Cost 3 vext2 <5,7,0,1>, <5,7,0,1>
2691876029U, // <0,1,5,u>: Cost 3 vext3 <1,2,3,0>, <1,5,u,7>
2592063590U, // <0,1,6,0>: Cost 3 vext1 <7,0,1,6>, LHS
- 3765322959U, // <0,1,6,1>: Cost 4 vext3 <1,1,u,0>, <1,6,1,7>
+ 3765617871U, // <0,1,6,1>: Cost 4 vext3 <1,2,3,0>, <1,6,1,7>
2654417337U, // <0,1,6,2>: Cost 3 vext2 <6,2,0,1>, <6,2,0,1>
3765617889U, // <0,1,6,3>: Cost 4 vext3 <1,2,3,0>, <1,6,3,7>
2592066870U, // <0,1,6,4>: Cost 3 vext1 <7,0,1,6>, RHS
@@ -170,8 +170,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2631193772U, // <0,1,7,2>: Cost 3 vext2 <2,3,0,1>, <7,2,3,0>
2661053667U, // <0,1,7,3>: Cost 3 vext2 <7,3,0,1>, <7,3,0,1>
2657736038U, // <0,1,7,4>: Cost 3 vext2 <6,7,0,1>, <7,4,5,6>
- 3704935840U, // <0,1,7,5>: Cost 4 vext2 <2,3,0,1>, <7,5,3,1>
- 2657736198U, // <0,1,7,6>: Cost 3 vext2 <6,7,0,1>, <7,6,5,4>
+ 3721524621U, // <0,1,7,5>: Cost 4 vext2 <5,1,0,1>, <7,5,1,0>
+ 2657736158U, // <0,1,7,6>: Cost 3 vext2 <6,7,0,1>, <7,6,1,0>
2657736300U, // <0,1,7,7>: Cost 3 vext2 <6,7,0,1>, <7,7,7,7>
2657736322U, // <0,1,7,u>: Cost 3 vext2 <6,7,0,1>, <7,u,1,2>
1494450278U, // <0,1,u,0>: Cost 2 vext1 <3,0,1,u>, LHS
@@ -190,19 +190,19 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2752340172U, // <0,2,0,4>: Cost 3 vuzpl LHS, <0,2,4,6>
2691876326U, // <0,2,0,5>: Cost 3 vext3 <1,2,3,0>, <2,0,5,7>
2618589695U, // <0,2,0,6>: Cost 3 vext2 <0,2,0,2>, <0,6,2,7>
- 2256548865U, // <0,2,0,7>: Cost 3 vrev <7,0,2,0>
+ 2592093185U, // <0,2,0,7>: Cost 3 vext1 <7,0,2,0>, <7,0,2,0>
1678557340U, // <0,2,0,u>: Cost 2 vuzpl LHS, LHS
- 2703672835U, // <0,2,1,0>: Cost 3 vext3 <3,2,1,0>, <2,1,0,0>
+ 2618589942U, // <0,2,1,0>: Cost 3 vext2 <0,2,0,2>, <1,0,3,2>
2752299828U, // <0,2,1,1>: Cost 3 vuzpl LHS, <1,1,1,1>
2886518376U, // <0,2,1,2>: Cost 3 vzipl LHS, <2,2,2,2>
- 2752299926U, // <0,2,1,3>: Cost 3 vuzpl LHS, <1,2,3,0>
+ 2752299766U, // <0,2,1,3>: Cost 3 vuzpl LHS, <1,0,3,2>
2550295862U, // <0,2,1,4>: Cost 3 vext1 <0,0,2,1>, RHS
2752340992U, // <0,2,1,5>: Cost 3 vuzpl LHS, <1,3,5,7>
2886559674U, // <0,2,1,6>: Cost 3 vzipl LHS, <2,6,3,7>
3934208106U, // <0,2,1,7>: Cost 4 vuzpr <7,0,1,2>, <0,1,2,7>
- 2752340931U, // <0,2,1,u>: Cost 3 vuzpl LHS, <1,2,u,0>
+ 2752340771U, // <0,2,1,u>: Cost 3 vuzpl LHS, <1,0,u,2>
1476558868U, // <0,2,2,0>: Cost 2 vext1 <0,0,2,2>, <0,0,2,2>
- 2550301492U, // <0,2,2,1>: Cost 3 vext1 <0,0,2,2>, <1,1,1,1>
+ 2226628029U, // <0,2,2,1>: Cost 3 vrev <2,0,1,2>
2752300648U, // <0,2,2,2>: Cost 3 vuzpl LHS, <2,2,2,2>
3020736114U, // <0,2,2,3>: Cost 3 vtrnl LHS, <2,2,3,3>
1476562230U, // <0,2,2,4>: Cost 2 vext1 <0,0,2,2>, RHS
@@ -212,7 +212,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1476564782U, // <0,2,2,u>: Cost 2 vext1 <0,0,2,2>, LHS
2618591382U, // <0,2,3,0>: Cost 3 vext2 <0,2,0,2>, <3,0,1,2>
2752301206U, // <0,2,3,1>: Cost 3 vuzpl LHS, <3,0,1,2>
- 2618591542U, // <0,2,3,2>: Cost 3 vext2 <0,2,0,2>, <3,2,1,0>
+ 3826043121U, // <0,2,3,2>: Cost 4 vuzpl LHS, <3,1,2,3>
2752301468U, // <0,2,3,3>: Cost 3 vuzpl LHS, <3,3,3,3>
2618591746U, // <0,2,3,4>: Cost 3 vext2 <0,2,0,2>, <3,4,5,6>
2752301570U, // <0,2,3,5>: Cost 3 vuzpl LHS, <3,4,5,6>
@@ -221,7 +221,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2752301269U, // <0,2,3,u>: Cost 3 vuzpl LHS, <3,0,u,2>
2562261094U, // <0,2,4,0>: Cost 3 vext1 <2,0,2,4>, LHS
4095313828U, // <0,2,4,1>: Cost 4 vtrnl <0,2,4,6>, <2,6,1,3>
- 2562262472U, // <0,2,4,2>: Cost 3 vext1 <2,0,2,4>, <2,0,2,4>
+ 2226718152U, // <0,2,4,2>: Cost 3 vrev <2,0,2,4>
2568235169U, // <0,2,4,3>: Cost 3 vext1 <3,0,2,4>, <3,0,2,4>
2562264374U, // <0,2,4,4>: Cost 3 vext1 <2,0,2,4>, RHS
1544850742U, // <0,2,4,5>: Cost 2 vext2 <0,2,0,2>, RHS
@@ -232,11 +232,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2618592976U, // <0,2,5,1>: Cost 3 vext2 <0,2,0,2>, <5,1,7,3>
3765618528U, // <0,2,5,2>: Cost 4 vext3 <1,2,3,0>, <2,5,2,7>
3765618536U, // <0,2,5,3>: Cost 4 vext3 <1,2,3,0>, <2,5,3,6>
- 3696316340U, // <0,2,5,4>: Cost 4 vext2 <0,u,0,2>, <5,4,5,6>
+ 2618593222U, // <0,2,5,4>: Cost 3 vext2 <0,2,0,2>, <5,4,7,6>
2752303108U, // <0,2,5,5>: Cost 3 vuzpl LHS, <5,5,5,5>
2618593378U, // <0,2,5,6>: Cost 3 vext2 <0,2,0,2>, <5,6,7,0>
- 2836581686U, // <0,2,5,7>: Cost 3 vuzpr <3,0,1,2>, RHS
- 2836581687U, // <0,2,5,u>: Cost 3 vuzpr <3,0,1,2>, RHS
+ 2824785206U, // <0,2,5,7>: Cost 3 vuzpr <1,0,3,2>, RHS
+ 2824785207U, // <0,2,5,u>: Cost 3 vuzpr <1,0,3,2>, RHS
2752303950U, // <0,2,6,0>: Cost 3 vuzpl LHS, <6,7,0,1>
3830690081U, // <0,2,6,1>: Cost 4 vuzpl LHS, <6,0,1,2>
2618593786U, // <0,2,6,2>: Cost 3 vext2 <0,2,0,2>, <6,2,7,3>
@@ -252,7 +252,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2701166596U, // <0,2,7,3>: Cost 3 vext3 <2,7,3,0>, <2,7,3,0>
2662389094U, // <0,2,7,4>: Cost 3 vext2 <7,5,0,2>, <7,4,5,6>
2662389126U, // <0,2,7,5>: Cost 3 vext2 <7,5,0,2>, <7,5,0,2>
- 2618594822U, // <0,2,7,6>: Cost 3 vext2 <0,2,0,2>, <7,6,5,4>
+ 3736794583U, // <0,2,7,6>: Cost 4 vext2 <7,6,0,2>, <7,6,0,2>
2752304748U, // <0,2,7,7>: Cost 3 vuzpl LHS, <7,7,7,7>
2659070961U, // <0,2,7,u>: Cost 3 vext2 <7,0,0,2>, <7,0,0,2>
1476608026U, // <0,2,u,0>: Cost 2 vext1 <0,0,2,u>, <0,0,2,u>
@@ -262,7 +262,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1476611382U, // <0,2,u,4>: Cost 2 vext1 <0,0,2,u>, RHS
1544853658U, // <0,2,u,5>: Cost 2 vext2 <0,2,0,2>, RHS
1678563482U, // <0,2,u,6>: Cost 2 vuzpl LHS, RHS
- 2836581929U, // <0,2,u,7>: Cost 3 vuzpr <3,0,1,2>, RHS
+ 2824785449U, // <0,2,u,7>: Cost 3 vuzpr <1,0,3,2>, RHS
1678563172U, // <0,2,u,u>: Cost 2 vuzpl LHS, LHS
2556329984U, // <0,3,0,0>: Cost 3 vext1 <1,0,3,0>, <0,0,0,0>
2686421142U, // <0,3,0,1>: Cost 3 vext3 <0,3,1,0>, <3,0,1,2>
@@ -275,84 +275,84 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2556335918U, // <0,3,0,u>: Cost 3 vext1 <1,0,3,0>, LHS
2886518934U, // <0,3,1,0>: Cost 3 vzipl LHS, <3,0,1,2>
2556338933U, // <0,3,1,1>: Cost 3 vext1 <1,0,3,1>, <1,0,3,1>
- 2886519094U, // <0,3,1,2>: Cost 3 vzipl LHS, <3,2,1,0>
+ 2691877105U, // <0,3,1,2>: Cost 3 vext3 <1,2,3,0>, <3,1,2,3>
2886519196U, // <0,3,1,3>: Cost 3 vzipl LHS, <3,3,3,3>
2886519298U, // <0,3,1,4>: Cost 3 vzipl LHS, <3,4,5,6>
4095740418U, // <0,3,1,5>: Cost 4 vtrnl <0,3,1,4>, <3,4,5,6>
3659944242U, // <0,3,1,6>: Cost 4 vext1 <6,0,3,1>, <6,0,3,1>
3769600286U, // <0,3,1,7>: Cost 4 vext3 <1,u,3,0>, <3,1,7,3>
2886519582U, // <0,3,1,u>: Cost 3 vzipl LHS, <3,u,1,2>
- 2556346388U, // <0,3,2,0>: Cost 3 vext1 <1,0,3,2>, <0,0,2,2>
- 1148371862U, // <0,3,2,1>: Cost 2 vrev <1,2,3,0>
- 2562319823U, // <0,3,2,2>: Cost 3 vext1 <2,0,3,2>, <2,0,3,2>
+ 1482604646U, // <0,3,2,0>: Cost 2 vext1 <1,0,3,2>, LHS
+ 1482605302U, // <0,3,2,1>: Cost 2 vext1 <1,0,3,2>, <1,0,3,2>
+ 2556348008U, // <0,3,2,2>: Cost 3 vext1 <1,0,3,2>, <2,2,2,2>
3020736924U, // <0,3,2,3>: Cost 3 vtrnl LHS, <3,3,3,3>
- 2556349750U, // <0,3,2,4>: Cost 3 vext1 <1,0,3,2>, RHS
+ 1482607926U, // <0,3,2,4>: Cost 2 vext1 <1,0,3,2>, RHS
3020737026U, // <0,3,2,5>: Cost 3 vtrnl LHS, <3,4,5,6>
- 4099123558U, // <0,3,2,6>: Cost 4 vtrnl LHS, <3,2,6,3>
- 2257949868U, // <0,3,2,7>: Cost 3 vrev <7,2,3,0>
- 1630447989U, // <0,3,2,u>: Cost 2 vext3 <3,2,u,0>, <3,2,u,0>
- 2665711772U, // <0,3,3,0>: Cost 3 vext2 <u,1,0,3>, <3,0,1,u>
- 2222777319U, // <0,3,3,1>: Cost 3 vrev <1,3,3,0>
- 2228750016U, // <0,3,3,2>: Cost 3 vrev <2,3,3,0>
+ 2598154746U, // <0,3,2,6>: Cost 3 vext1 <u,0,3,2>, <6,2,7,3>
+ 2598155258U, // <0,3,2,7>: Cost 3 vext1 <u,0,3,2>, <7,0,1,2>
+ 1482610478U, // <0,3,2,u>: Cost 2 vext1 <1,0,3,2>, LHS
+ 3692341398U, // <0,3,3,0>: Cost 4 vext2 <0,2,0,3>, <3,0,1,2>
+ 2635851999U, // <0,3,3,1>: Cost 3 vext2 <3,1,0,3>, <3,1,0,3>
+ 3636069840U, // <0,3,3,2>: Cost 4 vext1 <2,0,3,3>, <2,0,3,3>
2691877276U, // <0,3,3,3>: Cost 3 vext3 <1,2,3,0>, <3,3,3,3>
3961522690U, // <0,3,3,4>: Cost 4 vzipl <0,3,1,4>, <3,4,5,6>
3826797058U, // <0,3,3,5>: Cost 4 vuzpl <0,2,3,5>, <3,4,5,6>
- 3765619124U, // <0,3,3,6>: Cost 4 vext3 <1,2,3,0>, <3,3,6,0>
+ 3703622282U, // <0,3,3,6>: Cost 4 vext2 <2,1,0,3>, <3,6,2,7>
3769600452U, // <0,3,3,7>: Cost 4 vext3 <1,u,3,0>, <3,3,7,7>
- 2707655111U, // <0,3,3,u>: Cost 3 vext3 <3,u,1,0>, <3,3,u,1>
+ 2640497430U, // <0,3,3,u>: Cost 3 vext2 <3,u,0,3>, <3,u,0,3>
3962194070U, // <0,3,4,0>: Cost 4 vzipl <0,4,1,5>, <3,0,1,2>
- 4095314070U, // <0,3,4,1>: Cost 4 vtrnl <0,2,4,6>, <3,0,1,2>
- 2703673830U, // <0,3,4,2>: Cost 3 vext3 <3,2,1,0>, <3,4,2,5>
+ 2232617112U, // <0,3,4,1>: Cost 3 vrev <3,0,1,4>
+ 2232690849U, // <0,3,4,2>: Cost 3 vrev <3,0,2,4>
4095314332U, // <0,3,4,3>: Cost 4 vtrnl <0,2,4,6>, <3,3,3,3>
3962194434U, // <0,3,4,4>: Cost 4 vzipl <0,4,1,5>, <3,4,5,6>
2691877378U, // <0,3,4,5>: Cost 3 vext3 <1,2,3,0>, <3,4,5,6>
3826765110U, // <0,3,4,6>: Cost 4 vuzpl <0,2,3,1>, RHS
3665941518U, // <0,3,4,7>: Cost 4 vext1 <7,0,3,4>, <7,0,3,4>
2691877405U, // <0,3,4,u>: Cost 3 vext3 <1,2,3,0>, <3,4,u,6>
- 3636084838U, // <0,3,5,0>: Cost 4 vext1 <2,0,3,5>, LHS
- 3765619248U, // <0,3,5,1>: Cost 4 vext3 <1,2,3,0>, <3,5,1,7>
- 3636086226U, // <0,3,5,2>: Cost 4 vext1 <2,0,3,5>, <2,0,3,5>
+ 3630112870U, // <0,3,5,0>: Cost 4 vext1 <1,0,3,5>, LHS
+ 3630113526U, // <0,3,5,1>: Cost 4 vext1 <1,0,3,5>, <1,0,3,2>
+ 4035199734U, // <0,3,5,2>: Cost 4 vzipr <1,4,0,5>, <1,0,3,2>
3769600578U, // <0,3,5,3>: Cost 4 vext3 <1,u,3,0>, <3,5,3,7>
- 3636088118U, // <0,3,5,4>: Cost 4 vext1 <2,0,3,5>, RHS
- 3777415764U, // <0,3,5,5>: Cost 4 vext3 <3,2,1,0>, <3,5,5,7>
- 2653769826U, // <0,3,5,6>: Cost 3 vext2 <6,1,0,3>, <5,6,7,0>
+ 2232846516U, // <0,3,5,4>: Cost 3 vrev <3,0,4,5>
+ 3779037780U, // <0,3,5,5>: Cost 4 vext3 <3,4,5,0>, <3,5,5,7>
+ 2718714461U, // <0,3,5,6>: Cost 3 vext3 <5,6,7,0>, <3,5,6,7>
2706106975U, // <0,3,5,7>: Cost 3 vext3 <3,5,7,0>, <3,5,7,0>
- 2706180712U, // <0,3,5,u>: Cost 3 vext3 <3,5,u,0>, <3,5,u,0>
+ 2233141464U, // <0,3,5,u>: Cost 3 vrev <3,0,u,5>
2691877496U, // <0,3,6,0>: Cost 3 vext3 <1,2,3,0>, <3,6,0,7>
- 2653770090U, // <0,3,6,1>: Cost 3 vext2 <6,1,0,3>, <6,1,0,3>
- 3636094419U, // <0,3,6,2>: Cost 4 vext1 <2,0,3,6>, <2,0,3,6>
+ 3727511914U, // <0,3,6,1>: Cost 4 vext2 <6,1,0,3>, <6,1,0,3>
+ 3765619338U, // <0,3,6,2>: Cost 4 vext3 <1,2,3,0>, <3,6,2,7>
3765619347U, // <0,3,6,3>: Cost 4 vext3 <1,2,3,0>, <3,6,3,7>
3765987996U, // <0,3,6,4>: Cost 4 vext3 <1,2,u,0>, <3,6,4,7>
- 3322400830U, // <0,3,6,5>: Cost 4 vrev <5,6,3,0>
+ 3306670270U, // <0,3,6,5>: Cost 4 vrev <3,0,5,6>
3792456365U, // <0,3,6,6>: Cost 4 vext3 <5,6,7,0>, <3,6,6,6>
2706770608U, // <0,3,6,7>: Cost 3 vext3 <3,6,7,0>, <3,6,7,0>
- 2653770090U, // <0,3,6,u>: Cost 3 vext2 <6,1,0,3>, <6,1,0,3>
+ 2706844345U, // <0,3,6,u>: Cost 3 vext3 <3,6,u,0>, <3,6,u,0>
3769600707U, // <0,3,7,0>: Cost 4 vext3 <1,u,3,0>, <3,7,0,1>
- 2225431851U, // <0,3,7,1>: Cost 3 vrev <1,7,3,0>
- 2231404548U, // <0,3,7,2>: Cost 3 vrev <2,7,3,0>
+ 2659742787U, // <0,3,7,1>: Cost 3 vext2 <7,1,0,3>, <7,1,0,3>
+ 3636102612U, // <0,3,7,2>: Cost 4 vext1 <2,0,3,7>, <2,0,3,7>
3769600740U, // <0,3,7,3>: Cost 4 vext3 <1,u,3,0>, <3,7,3,7>
3769600747U, // <0,3,7,4>: Cost 4 vext3 <1,u,3,0>, <3,7,4,5>
3769600758U, // <0,3,7,5>: Cost 4 vext3 <1,u,3,0>, <3,7,5,7>
- 2255295336U, // <0,3,7,6>: Cost 3 vrev <6,7,3,0>
+ 3659993400U, // <0,3,7,6>: Cost 4 vext1 <6,0,3,7>, <6,0,3,7>
3781176065U, // <0,3,7,7>: Cost 4 vext3 <3,7,7,0>, <3,7,7,0>
- 2267240730U, // <0,3,7,u>: Cost 3 vrev <u,7,3,0>
- 2891163798U, // <0,3,u,0>: Cost 3 vzipl LHS, <3,0,1,2>
- 1152353660U, // <0,3,u,1>: Cost 2 vrev <1,u,3,0>
- 2891163958U, // <0,3,u,2>: Cost 3 vzipl LHS, <3,2,1,0>
+ 2664388218U, // <0,3,7,u>: Cost 3 vext2 <7,u,0,3>, <7,u,0,3>
+ 1482653798U, // <0,3,u,0>: Cost 2 vext1 <1,0,3,u>, LHS
+ 1482654460U, // <0,3,u,1>: Cost 2 vext1 <1,0,3,u>, <1,0,3,u>
+ 2556397160U, // <0,3,u,2>: Cost 3 vext1 <1,0,3,u>, <2,2,2,2>
3021179292U, // <0,3,u,3>: Cost 3 vtrnl LHS, <3,3,3,3>
- 2891164162U, // <0,3,u,4>: Cost 3 vzipl LHS, <3,4,5,6>
+ 1482657078U, // <0,3,u,4>: Cost 2 vext1 <1,0,3,u>, RHS
3021179394U, // <0,3,u,5>: Cost 3 vtrnl LHS, <3,4,5,6>
- 2255958969U, // <0,3,u,6>: Cost 3 vrev <6,u,3,0>
+ 2598203898U, // <0,3,u,6>: Cost 3 vext1 <u,0,3,u>, <6,2,7,3>
2708097874U, // <0,3,u,7>: Cost 3 vext3 <3,u,7,0>, <3,u,7,0>
- 1634429787U, // <0,3,u,u>: Cost 2 vext3 <3,u,u,0>, <3,u,u,0>
+ 1482659630U, // <0,3,u,u>: Cost 2 vext1 <1,0,3,u>, LHS
2617278468U, // <0,4,0,0>: Cost 3 vext2 <0,0,0,4>, <0,0,0,4>
2618605670U, // <0,4,0,1>: Cost 3 vext2 <0,2,0,4>, LHS
2618605734U, // <0,4,0,2>: Cost 3 vext2 <0,2,0,4>, <0,2,0,4>
- 3306547375U, // <0,4,0,3>: Cost 4 vrev <3,0,4,0>
+ 3642091695U, // <0,4,0,3>: Cost 4 vext1 <3,0,4,0>, <3,0,4,0>
2753134796U, // <0,4,0,4>: Cost 3 vuzpl <0,2,4,6>, <0,2,4,6>
2718714770U, // <0,4,0,5>: Cost 3 vext3 <5,6,7,0>, <4,0,5,1>
3021245750U, // <0,4,0,6>: Cost 3 vtrnl <0,2,0,2>, RHS
- 3330438163U, // <0,4,0,7>: Cost 4 vrev <7,0,4,0>
+ 3665982483U, // <0,4,0,7>: Cost 4 vext1 <7,0,4,0>, <7,0,4,0>
3021245768U, // <0,4,0,u>: Cost 3 vtrnl <0,2,0,2>, RHS
2568355942U, // <0,4,1,0>: Cost 3 vext1 <3,0,4,1>, LHS
3692348212U, // <0,4,1,1>: Cost 4 vext2 <0,2,0,4>, <1,1,1,1>
@@ -364,7 +364,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2592248852U, // <0,4,1,7>: Cost 3 vext1 <7,0,4,1>, <7,0,4,1>
1812778537U, // <0,4,1,u>: Cost 2 vzipl LHS, RHS
2568364134U, // <0,4,2,0>: Cost 3 vext1 <3,0,4,2>, LHS
- 2629887495U, // <0,4,2,1>: Cost 3 vext2 <2,1,0,4>, <2,1,0,4>
+ 2238573423U, // <0,4,2,1>: Cost 3 vrev <4,0,1,2>
3692349032U, // <0,4,2,2>: Cost 4 vext2 <0,2,0,4>, <2,2,2,2>
2631214761U, // <0,4,2,3>: Cost 3 vext2 <2,3,0,4>, <2,3,0,4>
2568367414U, // <0,4,2,4>: Cost 3 vext1 <3,0,4,2>, RHS
@@ -374,13 +374,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1946996040U, // <0,4,2,u>: Cost 2 vtrnl LHS, RHS
3692349590U, // <0,4,3,0>: Cost 4 vext2 <0,2,0,4>, <3,0,1,2>
3826878614U, // <0,4,3,1>: Cost 4 vuzpl <0,2,4,6>, <3,0,1,2>
- 2228823753U, // <0,4,3,2>: Cost 3 vrev <2,3,4,0>
+ 3826878625U, // <0,4,3,2>: Cost 4 vuzpl <0,2,4,6>, <3,0,2,4>
3692349852U, // <0,4,3,3>: Cost 4 vext2 <0,2,0,4>, <3,3,3,3>
3692349954U, // <0,4,3,4>: Cost 4 vext2 <0,2,0,4>, <3,4,5,6>
3826878978U, // <0,4,3,5>: Cost 4 vuzpl <0,2,4,6>, <3,4,5,6>
4095200566U, // <0,4,3,6>: Cost 4 vtrnl <0,2,3,1>, RHS
3713583814U, // <0,4,3,7>: Cost 4 vext2 <3,7,0,4>, <3,7,0,4>
- 2665720604U, // <0,4,3,u>: Cost 3 vext2 <u,1,0,4>, <3,u,1,0>
+ 3692350238U, // <0,4,3,u>: Cost 4 vext2 <0,2,0,4>, <3,u,1,2>
2550464552U, // <0,4,4,0>: Cost 3 vext1 <0,0,4,4>, <0,0,4,4>
3962194914U, // <0,4,4,1>: Cost 4 vzipl <0,4,1,5>, <4,1,5,0>
3693677631U, // <0,4,4,2>: Cost 4 vext2 <0,4,0,4>, <4,2,6,3>
@@ -401,8 +401,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1618136392U, // <0,4,5,u>: Cost 2 vext3 <1,2,3,0>, RHS
2550480938U, // <0,4,6,0>: Cost 3 vext1 <0,0,4,6>, <0,0,4,6>
3826880801U, // <0,4,6,1>: Cost 4 vuzpl <0,2,4,6>, <6,0,1,2>
- 2712374620U, // <0,4,6,2>: Cost 3 vext3 <4,6,2,0>, <4,6,2,0>
- 3777416551U, // <0,4,6,3>: Cost 4 vext3 <3,2,1,0>, <4,6,3,2>
+ 2562426332U, // <0,4,6,2>: Cost 3 vext1 <2,0,4,6>, <2,0,4,6>
+ 3786190181U, // <0,4,6,3>: Cost 4 vext3 <4,6,3,0>, <4,6,3,0>
2718715252U, // <0,4,6,4>: Cost 3 vext3 <5,6,7,0>, <4,6,4,6>
3826881165U, // <0,4,6,5>: Cost 4 vuzpl <0,2,4,6>, <6,4,5,6>
2712669568U, // <0,4,6,6>: Cost 3 vext3 <4,6,6,0>, <4,6,6,0>
@@ -414,9 +414,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3734820070U, // <0,4,7,3>: Cost 4 vext2 <7,3,0,4>, <7,3,0,4>
3654094134U, // <0,4,7,4>: Cost 4 vext1 <5,0,4,7>, RHS
2713259464U, // <0,4,7,5>: Cost 3 vext3 <4,7,5,0>, <4,7,5,0>
- 2255369073U, // <0,4,7,6>: Cost 3 vrev <6,7,4,0>
+ 2713333201U, // <0,4,7,6>: Cost 3 vext3 <4,7,6,0>, <4,7,6,0>
3654095866U, // <0,4,7,7>: Cost 4 vext1 <5,0,4,7>, <7,0,1,2>
- 2267314467U, // <0,4,7,u>: Cost 3 vrev <u,7,4,0>
+ 2713259464U, // <0,4,7,u>: Cost 3 vext3 <4,7,5,0>, <4,7,5,0>
2568413286U, // <0,4,u,0>: Cost 3 vext1 <3,0,4,u>, LHS
2618611502U, // <0,4,u,1>: Cost 3 vext2 <0,2,0,4>, LHS
2753140526U, // <0,4,u,2>: Cost 3 vuzpl <0,2,4,6>, LHS
@@ -427,14 +427,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2592306203U, // <0,4,u,7>: Cost 3 vext1 <7,0,4,u>, <7,0,4,u>
1947438408U, // <0,4,u,u>: Cost 2 vtrnl LHS, RHS
3630219264U, // <0,5,0,0>: Cost 4 vext1 <1,0,5,0>, <0,0,0,0>
- 2637856870U, // <0,5,0,1>: Cost 3 vext2 <3,4,0,5>, LHS
+ 2625912934U, // <0,5,0,1>: Cost 3 vext2 <1,4,0,5>, LHS
3692355748U, // <0,5,0,2>: Cost 4 vext2 <0,2,0,5>, <0,2,0,2>
3693019384U, // <0,5,0,3>: Cost 4 vext2 <0,3,0,5>, <0,3,0,5>
3630222646U, // <0,5,0,4>: Cost 4 vext1 <1,0,5,0>, RHS
- 3910568116U, // <0,5,0,5>: Cost 4 vuzpr <3,0,4,5>, <3,0,4,5>
+ 3699655062U, // <0,5,0,5>: Cost 4 vext2 <1,4,0,5>, <0,5,0,1>
2718715508U, // <0,5,0,6>: Cost 3 vext3 <5,6,7,0>, <5,0,6,1>
3087011126U, // <0,5,0,7>: Cost 3 vtrnr <0,0,0,0>, RHS
- 2637857437U, // <0,5,0,u>: Cost 3 vext2 <3,4,0,5>, LHS
+ 2625913501U, // <0,5,0,u>: Cost 3 vext2 <1,4,0,5>, LHS
1500659814U, // <0,5,1,0>: Cost 2 vext1 <4,0,5,1>, LHS
2886520528U, // <0,5,1,1>: Cost 3 vzipl LHS, <5,1,7,3>
2574403176U, // <0,5,1,2>: Cost 3 vext1 <4,0,5,1>, <2,2,2,2>
@@ -445,48 +445,48 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2718715600U, // <0,5,1,7>: Cost 3 vext3 <5,6,7,0>, <5,1,7,3>
1500665646U, // <0,5,1,u>: Cost 2 vext1 <4,0,5,1>, LHS
2556493926U, // <0,5,2,0>: Cost 3 vext1 <1,0,5,2>, LHS
- 2556494600U, // <0,5,2,1>: Cost 3 vext1 <1,0,5,2>, <1,0,5,2>
+ 2244546120U, // <0,5,2,1>: Cost 3 vrev <5,0,1,2>
3692357256U, // <0,5,2,2>: Cost 4 vext2 <0,2,0,5>, <2,2,5,7>
2568439994U, // <0,5,2,3>: Cost 3 vext1 <3,0,5,2>, <3,0,5,2>
2556497206U, // <0,5,2,4>: Cost 3 vext1 <1,0,5,2>, RHS
3020738564U, // <0,5,2,5>: Cost 3 vtrnl LHS, <5,5,5,5>
4027877161U, // <0,5,2,6>: Cost 4 vzipr <0,2,0,2>, <2,4,5,6>
- 3105017142U, // <0,5,2,7>: Cost 3 vtrnr <3,0,1,2>, RHS
- 3105017143U, // <0,5,2,u>: Cost 3 vtrnr <3,0,1,2>, RHS
- 2637858966U, // <0,5,3,0>: Cost 3 vext2 <3,4,0,5>, <3,0,1,2>
- 3711600902U, // <0,5,3,1>: Cost 4 vext2 <3,4,0,5>, <3,1,4,6>
- 3302639314U, // <0,5,3,2>: Cost 4 vrev <2,3,5,0>
- 3308612011U, // <0,5,3,3>: Cost 4 vrev <3,3,5,0>
+ 3093220662U, // <0,5,2,7>: Cost 3 vtrnr <1,0,3,2>, RHS
+ 3093220663U, // <0,5,2,u>: Cost 3 vtrnr <1,0,3,2>, RHS
+ 3699656854U, // <0,5,3,0>: Cost 4 vext2 <1,4,0,5>, <3,0,1,2>
+ 3699656927U, // <0,5,3,1>: Cost 4 vext2 <1,4,0,5>, <3,1,0,3>
+ 3699657006U, // <0,5,3,2>: Cost 4 vext2 <1,4,0,5>, <3,2,0,1>
+ 3699657116U, // <0,5,3,3>: Cost 4 vext2 <1,4,0,5>, <3,3,3,3>
2637859284U, // <0,5,3,4>: Cost 3 vext2 <3,4,0,5>, <3,4,0,5>
- 3320557405U, // <0,5,3,5>: Cost 4 vrev <5,3,5,0>
- 3790393190U, // <0,5,3,6>: Cost 4 vext3 <5,3,6,0>, <5,3,6,0>
+ 3790319453U, // <0,5,3,5>: Cost 4 vext3 <5,3,5,0>, <5,3,5,0>
+ 3699657354U, // <0,5,3,6>: Cost 4 vext2 <1,4,0,5>, <3,6,2,7>
2716725103U, // <0,5,3,7>: Cost 3 vext3 <5,3,7,0>, <5,3,7,0>
- 2640513816U, // <0,5,3,u>: Cost 3 vext2 <3,u,0,5>, <3,u,0,5>
+ 2716798840U, // <0,5,3,u>: Cost 3 vext3 <5,3,u,0>, <5,3,u,0>
2661747602U, // <0,5,4,0>: Cost 3 vext2 <7,4,0,5>, <4,0,5,1>
- 3962195634U, // <0,5,4,1>: Cost 4 vzipl <0,4,1,5>, <5,1,4,0>
- 3303302947U, // <0,5,4,2>: Cost 4 vrev <2,4,5,0>
- 2235533820U, // <0,5,4,3>: Cost 3 vrev <3,4,5,0>
+ 3630252810U, // <0,5,4,1>: Cost 4 vext1 <1,0,5,4>, <1,0,5,4>
+ 3636225507U, // <0,5,4,2>: Cost 4 vext1 <2,0,5,4>, <2,0,5,4>
+ 3716910172U, // <0,5,4,3>: Cost 4 vext2 <4,3,0,5>, <4,3,0,5>
3962195892U, // <0,5,4,4>: Cost 4 vzipl <0,4,1,5>, <5,4,5,6>
- 2637860150U, // <0,5,4,5>: Cost 3 vext2 <3,4,0,5>, RHS
- 3791056823U, // <0,5,4,6>: Cost 4 vext3 <5,4,6,0>, <5,4,6,0>
- 2259424608U, // <0,5,4,7>: Cost 3 vrev <7,4,5,0>
- 2637860393U, // <0,5,4,u>: Cost 3 vext2 <3,4,0,5>, RHS
+ 2625916214U, // <0,5,4,5>: Cost 3 vext2 <1,4,0,5>, RHS
+ 3718901071U, // <0,5,4,6>: Cost 4 vext2 <4,6,0,5>, <4,6,0,5>
+ 2718715846U, // <0,5,4,7>: Cost 3 vext3 <5,6,7,0>, <5,4,7,6>
+ 2625916457U, // <0,5,4,u>: Cost 3 vext2 <1,4,0,5>, RHS
3791278034U, // <0,5,5,0>: Cost 4 vext3 <5,5,0,0>, <5,5,0,0>
- 3297993883U, // <0,5,5,1>: Cost 4 vrev <1,5,5,0>
- 3303966580U, // <0,5,5,2>: Cost 4 vrev <2,5,5,0>
- 3309939277U, // <0,5,5,3>: Cost 4 vrev <3,5,5,0>
- 2242170150U, // <0,5,5,4>: Cost 3 vrev <4,5,5,0>
+ 3791351771U, // <0,5,5,1>: Cost 4 vext3 <5,5,1,0>, <5,5,1,0>
+ 3318386260U, // <0,5,5,2>: Cost 4 vrev <5,0,2,5>
+ 3791499245U, // <0,5,5,3>: Cost 4 vext3 <5,5,3,0>, <5,5,3,0>
+ 3318533734U, // <0,5,5,4>: Cost 4 vrev <5,0,4,5>
2718715908U, // <0,5,5,5>: Cost 3 vext3 <5,6,7,0>, <5,5,5,5>
2657767522U, // <0,5,5,6>: Cost 3 vext2 <6,7,0,5>, <5,6,7,0>
2718715928U, // <0,5,5,7>: Cost 3 vext3 <5,6,7,0>, <5,5,7,7>
2718715937U, // <0,5,5,u>: Cost 3 vext3 <5,6,7,0>, <5,5,u,7>
2592358502U, // <0,5,6,0>: Cost 3 vext1 <7,0,5,6>, LHS
- 3792457779U, // <0,5,6,1>: Cost 4 vext3 <5,6,7,0>, <5,6,1,7>
+ 3792015404U, // <0,5,6,1>: Cost 4 vext3 <5,6,1,0>, <5,6,1,0>
3731509754U, // <0,5,6,2>: Cost 4 vext2 <6,7,0,5>, <6,2,7,3>
- 3781398594U, // <0,5,6,3>: Cost 4 vext3 <3,u,1,0>, <5,6,3,4>
+ 3785748546U, // <0,5,6,3>: Cost 4 vext3 <4,5,6,0>, <5,6,3,4>
2592361782U, // <0,5,6,4>: Cost 3 vext1 <7,0,5,6>, RHS
2592362594U, // <0,5,6,5>: Cost 3 vext1 <7,0,5,6>, <5,6,7,0>
- 3781398624U, // <0,5,6,6>: Cost 4 vext3 <3,u,1,0>, <5,6,6,7>
+ 3785748576U, // <0,5,6,6>: Cost 4 vext3 <4,5,6,0>, <5,6,6,7>
1644974178U, // <0,5,6,7>: Cost 2 vext3 <5,6,7,0>, <5,6,7,0>
1645047915U, // <0,5,6,u>: Cost 2 vext3 <5,6,u,0>, <5,6,u,0>
2562506854U, // <0,5,7,0>: Cost 3 vext1 <2,0,5,7>, LHS
@@ -499,11 +499,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2719379635U, // <0,5,7,7>: Cost 3 vext3 <5,7,7,0>, <5,7,7,0>
2562512686U, // <0,5,7,u>: Cost 3 vext1 <2,0,5,7>, LHS
1500717158U, // <0,5,u,0>: Cost 2 vext1 <4,0,5,u>, LHS
- 2562515862U, // <0,5,u,1>: Cost 3 vext1 <2,0,5,u>, <1,2,3,0>
- 2562516455U, // <0,5,u,2>: Cost 3 vext1 <2,0,5,u>, <2,0,5,u>
- 2238188352U, // <0,5,u,3>: Cost 3 vrev <3,u,5,0>
+ 2625918766U, // <0,5,u,1>: Cost 3 vext2 <1,4,0,5>, LHS
+ 2719674583U, // <0,5,u,2>: Cost 3 vext3 <5,u,2,0>, <5,u,2,0>
+ 2568489152U, // <0,5,u,3>: Cost 3 vext1 <3,0,5,u>, <3,0,5,u>
1500720025U, // <0,5,u,4>: Cost 2 vext1 <4,0,5,u>, <4,0,5,u>
- 2637863066U, // <0,5,u,5>: Cost 3 vext2 <3,4,0,5>, RHS
+ 2625919130U, // <0,5,u,5>: Cost 3 vext2 <1,4,0,5>, RHS
2586407243U, // <0,5,u,6>: Cost 3 vext1 <6,0,5,u>, <6,0,5,u>
1646301444U, // <0,5,u,7>: Cost 2 vext3 <5,u,7,0>, <5,u,7,0>
1646375181U, // <0,5,u,u>: Cost 2 vext3 <5,u,u,0>, <5,u,u,0>
@@ -526,7 +526,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2966736182U, // <0,6,1,7>: Cost 3 vzipr <2,3,0,1>, RHS
2966736183U, // <0,6,1,u>: Cost 3 vzipr <2,3,0,1>, RHS
1500741734U, // <0,6,2,0>: Cost 2 vext1 <4,0,6,2>, LHS
- 2574484276U, // <0,6,2,1>: Cost 3 vext1 <4,0,6,2>, <1,1,1,1>
+ 2250518817U, // <0,6,2,1>: Cost 3 vrev <6,0,1,2>
2574485096U, // <0,6,2,2>: Cost 3 vext1 <4,0,6,2>, <2,2,2,2>
2631894694U, // <0,6,2,3>: Cost 3 vext2 <2,4,0,6>, <2,3,0,1>
1500744604U, // <0,6,2,4>: Cost 2 vext1 <4,0,6,2>, <4,0,6,2>
@@ -536,97 +536,97 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1500747566U, // <0,6,2,u>: Cost 2 vext1 <4,0,6,2>, LHS
3693693078U, // <0,6,3,0>: Cost 4 vext2 <0,4,0,6>, <3,0,1,2>
3705637136U, // <0,6,3,1>: Cost 4 vext2 <2,4,0,6>, <3,1,5,7>
- 3693693238U, // <0,6,3,2>: Cost 4 vext2 <0,4,0,6>, <3,2,1,0>
+ 3705637192U, // <0,6,3,2>: Cost 4 vext2 <2,4,0,6>, <3,2,3,0>
3693693340U, // <0,6,3,3>: Cost 4 vext2 <0,4,0,6>, <3,3,3,3>
2637867477U, // <0,6,3,4>: Cost 3 vext2 <3,4,0,6>, <3,4,0,6>
3705637424U, // <0,6,3,5>: Cost 4 vext2 <2,4,0,6>, <3,5,1,7>
3666154056U, // <0,6,3,6>: Cost 4 vext1 <7,0,6,3>, <6,3,7,0>
2722697800U, // <0,6,3,7>: Cost 3 vext3 <6,3,7,0>, <6,3,7,0>
2722771537U, // <0,6,3,u>: Cost 3 vext3 <6,3,u,0>, <6,3,u,0>
- 2661755804U, // <0,6,4,0>: Cost 3 vext2 <7,4,0,6>, <4,0,6,2>
+ 2562556006U, // <0,6,4,0>: Cost 3 vext1 <2,0,6,4>, LHS
4095316257U, // <0,6,4,1>: Cost 4 vtrnl <0,2,4,6>, <6,0,1,2>
- 2229634860U, // <0,6,4,2>: Cost 3 vrev <2,4,6,0>
- 3309349381U, // <0,6,4,3>: Cost 4 vrev <3,4,6,0>
- 3636301110U, // <0,6,4,4>: Cost 4 vext1 <2,0,6,4>, RHS
+ 2562557420U, // <0,6,4,2>: Cost 3 vext1 <2,0,6,4>, <2,0,6,4>
+ 3636299926U, // <0,6,4,3>: Cost 4 vext1 <2,0,6,4>, <3,0,1,2>
+ 2562559286U, // <0,6,4,4>: Cost 3 vext1 <2,0,6,4>, RHS
2619952438U, // <0,6,4,5>: Cost 3 vext2 <0,4,0,6>, RHS
- 2253525648U, // <0,6,4,6>: Cost 3 vrev <6,4,6,0>
+ 2723287696U, // <0,6,4,6>: Cost 3 vext3 <6,4,6,0>, <6,4,6,0>
4027895094U, // <0,6,4,7>: Cost 4 vzipr <0,2,0,4>, RHS
2619952681U, // <0,6,4,u>: Cost 3 vext2 <0,4,0,6>, RHS
2718716594U, // <0,6,5,0>: Cost 3 vext3 <5,6,7,0>, <6,5,0,7>
- 3735498448U, // <0,6,5,1>: Cost 4 vext2 <7,4,0,6>, <5,1,7,3>
+ 3648250774U, // <0,6,5,1>: Cost 4 vext1 <4,0,6,5>, <1,2,3,0>
3792458436U, // <0,6,5,2>: Cost 4 vext3 <5,6,7,0>, <6,5,2,7>
- 3672140290U, // <0,6,5,3>: Cost 4 vext1 <u,0,6,5>, <3,4,5,6>
- 2242243887U, // <0,6,5,4>: Cost 3 vrev <4,5,6,0>
+ 3705638767U, // <0,6,5,3>: Cost 5 vext2 <2,4,0,6>, <5,3,7,0>
+ 3648252831U, // <0,6,5,4>: Cost 4 vext1 <4,0,6,5>, <4,0,6,5>
3797619416U, // <0,6,5,5>: Cost 4 vext3 <6,5,5,0>, <6,5,5,0>
3792458472U, // <0,6,5,6>: Cost 4 vext3 <5,6,7,0>, <6,5,6,7>
- 3777417969U, // <0,6,5,7>: Cost 4 vext3 <3,2,1,0>, <6,5,7,7>
- 2266134675U, // <0,6,5,u>: Cost 3 vrev <u,5,6,0>
+ 4035202358U, // <0,6,5,7>: Cost 4 vzipr <1,4,0,5>, RHS
+ 2718716594U, // <0,6,5,u>: Cost 3 vext3 <5,6,7,0>, <6,5,0,7>
3786412796U, // <0,6,6,0>: Cost 4 vext3 <4,6,6,0>, <6,6,0,0>
3792458504U, // <0,6,6,1>: Cost 4 vext3 <5,6,7,0>, <6,6,1,3>
- 3304703950U, // <0,6,6,2>: Cost 4 vrev <2,6,6,0>
+ 3728200126U, // <0,6,6,2>: Cost 4 vext2 <6,2,0,6>, <6,2,0,6>
3798135575U, // <0,6,6,3>: Cost 4 vext3 <6,6,3,0>, <6,6,3,0>
- 2242907520U, // <0,6,6,4>: Cost 3 vrev <4,6,6,0>
- 3322622041U, // <0,6,6,5>: Cost 4 vrev <5,6,6,0>
+ 3786412836U, // <0,6,6,4>: Cost 4 vext3 <4,6,6,0>, <6,6,4,4>
+ 3792458543U, // <0,6,6,5>: Cost 4 vext3 <5,6,7,0>, <6,6,5,6>
2718716728U, // <0,6,6,6>: Cost 3 vext3 <5,6,7,0>, <6,6,6,6>
2718716738U, // <0,6,6,7>: Cost 3 vext3 <5,6,7,0>, <6,6,7,7>
2718716747U, // <0,6,6,u>: Cost 3 vext3 <5,6,7,0>, <6,6,u,7>
2718716750U, // <0,6,7,0>: Cost 3 vext3 <5,6,7,0>, <6,7,0,1>
- 2691879768U, // <0,6,7,1>: Cost 3 vext3 <1,2,3,0>, <6,7,1,2>
+ 2724909910U, // <0,6,7,1>: Cost 3 vext3 <6,7,1,0>, <6,7,1,0>
3636323823U, // <0,6,7,2>: Cost 4 vext1 <2,0,6,7>, <2,0,6,7>
2725057384U, // <0,6,7,3>: Cost 3 vext3 <6,7,3,0>, <6,7,3,0>
2718716790U, // <0,6,7,4>: Cost 3 vext3 <5,6,7,0>, <6,7,4,5>
2718716800U, // <0,6,7,5>: Cost 3 vext3 <5,6,7,0>, <6,7,5,6>
- 3777418122U, // <0,6,7,6>: Cost 4 vext3 <3,2,1,0>, <6,7,6,7>
+ 3792458629U, // <0,6,7,6>: Cost 4 vext3 <5,6,7,0>, <6,7,6,2>
2725352332U, // <0,6,7,7>: Cost 3 vext3 <6,7,7,0>, <6,7,7,0>
2718716822U, // <0,6,7,u>: Cost 3 vext3 <5,6,7,0>, <6,7,u,1>
1500790886U, // <0,6,u,0>: Cost 2 vext1 <4,0,6,u>, LHS
2619954990U, // <0,6,u,1>: Cost 3 vext2 <0,4,0,6>, LHS
- 2232289392U, // <0,6,u,2>: Cost 3 vrev <2,u,6,0>
+ 2562590192U, // <0,6,u,2>: Cost 3 vext1 <2,0,6,u>, <2,0,6,u>
2725721017U, // <0,6,u,3>: Cost 3 vext3 <6,u,3,0>, <6,u,3,0>
1500793762U, // <0,6,u,4>: Cost 2 vext1 <4,0,6,u>, <4,0,6,u>
2619955354U, // <0,6,u,5>: Cost 3 vext2 <0,4,0,6>, RHS
- 2256180180U, // <0,6,u,6>: Cost 3 vrev <6,u,6,0>
+ 2725942228U, // <0,6,u,6>: Cost 3 vext3 <6,u,6,0>, <6,u,6,0>
2954186038U, // <0,6,u,7>: Cost 3 vzipr <0,2,0,u>, RHS
1500796718U, // <0,6,u,u>: Cost 2 vext1 <4,0,6,u>, LHS
- 2726163439U, // <0,7,0,0>: Cost 3 vext3 <7,0,0,0>, <7,0,0,0>
+ 2256401391U, // <0,7,0,0>: Cost 3 vrev <7,0,0,0>
2632564838U, // <0,7,0,1>: Cost 3 vext2 <2,5,0,7>, LHS
- 2726310913U, // <0,7,0,2>: Cost 3 vext3 <7,0,2,0>, <7,0,2,0>
+ 2256548865U, // <0,7,0,2>: Cost 3 vrev <7,0,2,0>
3700998396U, // <0,7,0,3>: Cost 4 vext2 <1,6,0,7>, <0,3,1,0>
2718716952U, // <0,7,0,4>: Cost 3 vext3 <5,6,7,0>, <7,0,4,5>
2718716962U, // <0,7,0,5>: Cost 3 vext3 <5,6,7,0>, <7,0,5,6>
2621284845U, // <0,7,0,6>: Cost 3 vext2 <0,6,0,7>, <0,6,0,7>
3904685542U, // <0,7,0,7>: Cost 4 vuzpr <2,0,5,7>, <2,0,5,7>
2632565405U, // <0,7,0,u>: Cost 3 vext2 <2,5,0,7>, LHS
- 2886521850U, // <0,7,1,0>: Cost 3 vzipl LHS, <7,0,1,2>
- 3700335474U, // <0,7,1,1>: Cost 4 vext2 <1,5,0,7>, <1,1,u,0>
+ 2256409584U, // <0,7,1,0>: Cost 3 vrev <7,0,0,1>
+ 3706307380U, // <0,7,1,1>: Cost 4 vext2 <2,5,0,7>, <1,1,1,1>
2632565654U, // <0,7,1,2>: Cost 3 vext2 <2,5,0,7>, <1,2,3,0>
3769603168U, // <0,7,1,3>: Cost 4 vext3 <1,u,3,0>, <7,1,3,5>
- 2886522214U, // <0,7,1,4>: Cost 3 vzipl LHS, <7,4,5,6>
- 3700335733U, // <0,7,1,5>: Cost 4 vext2 <1,5,0,7>, <1,5,0,7>
- 2886522374U, // <0,7,1,6>: Cost 3 vzipl LHS, <7,6,5,4>
+ 2256704532U, // <0,7,1,4>: Cost 3 vrev <7,0,4,1>
+ 3769603184U, // <0,7,1,5>: Cost 4 vext3 <1,u,3,0>, <7,1,5,3>
+ 3700999366U, // <0,7,1,6>: Cost 4 vext2 <1,6,0,7>, <1,6,0,7>
2886522476U, // <0,7,1,7>: Cost 3 vzipl LHS, <7,7,7,7>
- 2668397948U, // <0,7,1,u>: Cost 3 vext2 <u,5,0,7>, <1,u,3,0>
+ 2256999480U, // <0,7,1,u>: Cost 3 vrev <7,0,u,1>
2586501222U, // <0,7,2,0>: Cost 3 vext1 <6,0,7,2>, LHS
- 3020739578U, // <0,7,2,1>: Cost 3 vtrnl LHS, <7,0,1,2>
+ 1182749690U, // <0,7,2,1>: Cost 2 vrev <7,0,1,2>
3636356595U, // <0,7,2,2>: Cost 4 vext1 <2,0,7,2>, <2,0,7,2>
2727711916U, // <0,7,2,3>: Cost 3 vext3 <7,2,3,0>, <7,2,3,0>
2586504502U, // <0,7,2,4>: Cost 3 vext1 <6,0,7,2>, RHS
2632566606U, // <0,7,2,5>: Cost 3 vext2 <2,5,0,7>, <2,5,0,7>
2586505559U, // <0,7,2,6>: Cost 3 vext1 <6,0,7,2>, <6,0,7,2>
3020740204U, // <0,7,2,7>: Cost 3 vtrnl LHS, <7,7,7,7>
- 2634557505U, // <0,7,2,u>: Cost 3 vext2 <2,u,0,7>, <2,u,0,7>
+ 1183265849U, // <0,7,2,u>: Cost 2 vrev <7,0,u,2>
3701000342U, // <0,7,3,0>: Cost 4 vext2 <1,6,0,7>, <3,0,1,2>
3706308849U, // <0,7,3,1>: Cost 4 vext2 <2,5,0,7>, <3,1,2,3>
- 2627258678U, // <0,7,3,2>: Cost 3 vext2 <1,6,0,7>, <3,2,1,0>
+ 3330315268U, // <0,7,3,2>: Cost 4 vrev <7,0,2,3>
3706309020U, // <0,7,3,3>: Cost 4 vext2 <2,5,0,7>, <3,3,3,3>
3706309122U, // <0,7,3,4>: Cost 4 vext2 <2,5,0,7>, <3,4,5,6>
- 2246963055U, // <0,7,3,5>: Cost 3 vrev <5,3,7,0>
+ 3712281127U, // <0,7,3,5>: Cost 4 vext2 <3,5,0,7>, <3,5,0,7>
2639202936U, // <0,7,3,6>: Cost 3 vext2 <3,6,0,7>, <3,6,0,7>
- 3332650273U, // <0,7,3,7>: Cost 4 vrev <7,3,7,0>
+ 3802412321U, // <0,7,3,7>: Cost 4 vext3 <7,3,7,0>, <7,3,7,0>
2640530202U, // <0,7,3,u>: Cost 3 vext2 <3,u,0,7>, <3,u,0,7>
3654287462U, // <0,7,4,0>: Cost 4 vext1 <5,0,7,4>, LHS
- 3654288278U, // <0,7,4,1>: Cost 4 vext1 <5,0,7,4>, <1,2,3,0>
- 3654289230U, // <0,7,4,2>: Cost 4 vext1 <5,0,7,4>, <2,5,0,7>
+ 2256507900U, // <0,7,4,1>: Cost 3 vrev <7,0,1,4>
+ 2256581637U, // <0,7,4,2>: Cost 3 vrev <7,0,2,4>
3660262008U, // <0,7,4,3>: Cost 4 vext1 <6,0,7,4>, <3,6,0,7>
3786413405U, // <0,7,4,4>: Cost 4 vext3 <4,6,6,0>, <7,4,4,6>
2632568118U, // <0,7,4,5>: Cost 3 vext2 <2,5,0,7>, RHS
@@ -634,75 +634,75 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3787003255U, // <0,7,4,7>: Cost 4 vext3 <4,7,5,0>, <7,4,7,5>
2632568361U, // <0,7,4,u>: Cost 3 vext2 <2,5,0,7>, RHS
3706310268U, // <0,7,5,0>: Cost 4 vext2 <2,5,0,7>, <5,0,7,0>
- 3298141357U, // <0,7,5,1>: Cost 4 vrev <1,5,7,0>
- 3304114054U, // <0,7,5,2>: Cost 4 vrev <2,5,7,0>
- 2236344927U, // <0,7,5,3>: Cost 3 vrev <3,5,7,0>
- 3316059448U, // <0,7,5,4>: Cost 4 vrev <4,5,7,0>
+ 3792459156U, // <0,7,5,1>: Cost 4 vext3 <5,6,7,0>, <7,5,1,7>
+ 3330331654U, // <0,7,5,2>: Cost 4 vrev <7,0,2,5>
+ 3722899255U, // <0,7,5,3>: Cost 4 vext2 <5,3,0,7>, <5,3,0,7>
+ 2256737304U, // <0,7,5,4>: Cost 3 vrev <7,0,4,5>
3724226521U, // <0,7,5,5>: Cost 4 vext2 <5,5,0,7>, <5,5,0,7>
2718717377U, // <0,7,5,6>: Cost 3 vext3 <5,6,7,0>, <7,5,6,7>
- 2260235715U, // <0,7,5,7>: Cost 3 vrev <7,5,7,0>
+ 2729997763U, // <0,7,5,7>: Cost 3 vext3 <7,5,7,0>, <7,5,7,0>
2720044499U, // <0,7,5,u>: Cost 3 vext3 <5,u,7,0>, <7,5,u,7>
- 2598477926U, // <0,7,6,0>: Cost 3 vext1 <u,0,7,6>, LHS
- 2556674846U, // <0,7,6,1>: Cost 3 vext1 <1,0,7,6>, <1,0,7,6>
+ 3712946517U, // <0,7,6,0>: Cost 4 vext2 <3,6,0,7>, <6,0,7,0>
+ 2256524286U, // <0,7,6,1>: Cost 3 vrev <7,0,1,6>
3792459246U, // <0,7,6,2>: Cost 4 vext3 <5,6,7,0>, <7,6,2,7>
- 2237008560U, // <0,7,6,3>: Cost 3 vrev <3,6,7,0>
- 2598481206U, // <0,7,6,4>: Cost 3 vext1 <u,0,7,6>, RHS
- 1175212130U, // <0,7,6,5>: Cost 2 vrev <5,6,7,0>
- 2598482773U, // <0,7,6,6>: Cost 3 vext1 <u,0,7,6>, <6,7,0,u>
- 2260899348U, // <0,7,6,7>: Cost 3 vrev <7,6,7,0>
- 1193130221U, // <0,7,6,u>: Cost 2 vrev <u,6,7,0>
- 2665747456U, // <0,7,7,0>: Cost 3 vext2 <u,1,0,7>, <7,0,1,u>
+ 3796440567U, // <0,7,6,3>: Cost 4 vext3 <6,3,7,0>, <7,6,3,7>
+ 3654307126U, // <0,7,6,4>: Cost 4 vext1 <5,0,7,6>, RHS
+ 2656457394U, // <0,7,6,5>: Cost 3 vext2 <6,5,0,7>, <6,5,0,7>
+ 3792459281U, // <0,7,6,6>: Cost 4 vext3 <5,6,7,0>, <7,6,6,6>
+ 2730661396U, // <0,7,6,7>: Cost 3 vext3 <7,6,7,0>, <7,6,7,0>
+ 2658448293U, // <0,7,6,u>: Cost 3 vext2 <6,u,0,7>, <6,u,0,7>
+ 3787003431U, // <0,7,7,0>: Cost 4 vext3 <4,7,5,0>, <7,7,0,1>
3654312854U, // <0,7,7,1>: Cost 4 vext1 <5,0,7,7>, <1,2,3,0>
3654313446U, // <0,7,7,2>: Cost 4 vext1 <5,0,7,7>, <2,0,5,7>
- 3311414017U, // <0,7,7,3>: Cost 4 vrev <3,7,7,0>
+ 3804771905U, // <0,7,7,3>: Cost 4 vext3 <7,7,3,0>, <7,7,3,0>
3654315318U, // <0,7,7,4>: Cost 4 vext1 <5,0,7,7>, RHS
- 2249617587U, // <0,7,7,5>: Cost 3 vrev <5,7,7,0>
- 2255590284U, // <0,7,7,6>: Cost 3 vrev <6,7,7,0>
+ 3654315651U, // <0,7,7,5>: Cost 4 vext1 <5,0,7,7>, <5,0,7,7>
+ 3660288348U, // <0,7,7,6>: Cost 4 vext1 <6,0,7,7>, <6,0,7,7>
2718717548U, // <0,7,7,7>: Cost 3 vext3 <5,6,7,0>, <7,7,7,7>
2664420990U, // <0,7,7,u>: Cost 3 vext2 <7,u,0,7>, <7,u,0,7>
- 2726163439U, // <0,7,u,0>: Cost 3 vext3 <7,0,0,0>, <7,0,0,0>
- 2632570670U, // <0,7,u,1>: Cost 3 vext2 <2,5,0,7>, LHS
- 2733536906U, // <0,7,u,2>: Cost 3 vext3 <u,2,1,0>, <7,u,2,1>
- 2238335826U, // <0,7,u,3>: Cost 3 vrev <3,u,7,0>
- 2718716952U, // <0,7,u,4>: Cost 3 vext3 <5,6,7,0>, <7,0,4,5>
- 1176539396U, // <0,7,u,5>: Cost 2 vrev <5,u,7,0>
- 2256253917U, // <0,7,u,6>: Cost 3 vrev <6,u,7,0>
- 2262226614U, // <0,7,u,7>: Cost 3 vrev <7,u,7,0>
- 1194457487U, // <0,7,u,u>: Cost 2 vrev <u,u,7,0>
+ 2256466935U, // <0,7,u,0>: Cost 3 vrev <7,0,0,u>
+ 1182798848U, // <0,7,u,1>: Cost 2 vrev <7,0,1,u>
+ 2256614409U, // <0,7,u,2>: Cost 3 vrev <7,0,2,u>
+ 2731693714U, // <0,7,u,3>: Cost 3 vext3 <7,u,3,0>, <7,u,3,0>
+ 2256761883U, // <0,7,u,4>: Cost 3 vrev <7,0,4,u>
+ 2632571034U, // <0,7,u,5>: Cost 3 vext2 <2,5,0,7>, RHS
+ 2669066421U, // <0,7,u,6>: Cost 3 vext2 <u,6,0,7>, <u,6,0,7>
+ 2731988662U, // <0,7,u,7>: Cost 3 vext3 <7,u,7,0>, <7,u,7,0>
+ 1183315007U, // <0,7,u,u>: Cost 2 vrev <7,0,u,u>
135053414U, // <0,u,0,0>: Cost 1 vdup0 LHS
1544896614U, // <0,u,0,1>: Cost 2 vext2 <0,2,0,u>, LHS
1678999654U, // <0,u,0,2>: Cost 2 vuzpl LHS, LHS
- 2233100499U, // <0,u,0,3>: Cost 3 vrev <3,0,u,0>
+ 2691880677U, // <0,u,0,3>: Cost 3 vext3 <1,2,3,0>, <u,0,3,2>
1476988214U, // <0,u,0,4>: Cost 2 vext1 <0,0,u,0>, RHS
2718791419U, // <0,u,0,5>: Cost 3 vext3 <5,6,u,0>, <u,0,5,6>
3021248666U, // <0,u,0,6>: Cost 3 vtrnl <0,2,0,2>, RHS
- 2256991287U, // <0,u,0,7>: Cost 3 vrev <7,0,u,0>
+ 2592535607U, // <0,u,0,7>: Cost 3 vext1 <7,0,u,0>, <7,0,u,0>
135053414U, // <0,u,0,u>: Cost 1 vdup0 LHS
1476993097U, // <0,u,1,0>: Cost 2 vext1 <0,0,u,1>, <0,0,u,1>
1812780846U, // <0,u,1,1>: Cost 2 vzipl LHS, LHS
1618138926U, // <0,u,1,2>: Cost 2 vext3 <1,2,3,0>, LHS
- 2752742216U, // <0,u,1,3>: Cost 3 vuzpl LHS, <1,1,3,3>
+ 2752742134U, // <0,u,1,3>: Cost 3 vuzpl LHS, <1,0,3,2>
1476996406U, // <0,u,1,4>: Cost 2 vext1 <0,0,u,1>, RHS
1812781210U, // <0,u,1,5>: Cost 2 vzipl LHS, RHS
2887006416U, // <0,u,1,6>: Cost 3 vzipl LHS, <u,6,3,7>
2966736200U, // <0,u,1,7>: Cost 3 vzipr <2,3,0,1>, RHS
1812781413U, // <0,u,1,u>: Cost 2 vzipl LHS, LHS
- 1494917222U, // <0,u,2,0>: Cost 2 vext1 <3,0,u,2>, LHS
- 1148740547U, // <0,u,2,1>: Cost 2 vrev <1,2,u,0>
+ 1482973286U, // <0,u,2,0>: Cost 2 vext1 <1,0,u,2>, LHS
+ 1482973987U, // <0,u,2,1>: Cost 2 vext1 <1,0,u,2>, <1,0,u,2>
1946998574U, // <0,u,2,2>: Cost 2 vtrnl LHS, LHS
835584U, // <0,u,2,3>: Cost 0 copy LHS
- 1494920502U, // <0,u,2,4>: Cost 2 vext1 <3,0,u,2>, RHS
+ 1482976566U, // <0,u,2,4>: Cost 2 vext1 <1,0,u,2>, RHS
3020781631U, // <0,u,2,5>: Cost 3 vtrnl LHS, <u,4,5,6>
1946998938U, // <0,u,2,6>: Cost 2 vtrnl LHS, RHS
1518810169U, // <0,u,2,7>: Cost 2 vext1 <7,0,u,2>, <7,0,u,2>
835584U, // <0,u,2,u>: Cost 0 copy LHS
2618640534U, // <0,u,3,0>: Cost 3 vext2 <0,2,0,u>, <3,0,1,2>
2752743574U, // <0,u,3,1>: Cost 3 vuzpl LHS, <3,0,1,2>
- 2618640694U, // <0,u,3,2>: Cost 3 vext2 <0,2,0,u>, <3,2,1,0>
+ 2636556597U, // <0,u,3,2>: Cost 3 vext2 <3,2,0,u>, <3,2,0,u>
2752743836U, // <0,u,3,3>: Cost 3 vuzpl LHS, <3,3,3,3>
2618640898U, // <0,u,3,4>: Cost 3 vext2 <0,2,0,u>, <3,4,5,6>
2752743938U, // <0,u,3,5>: Cost 3 vuzpl LHS, <3,4,5,6>
- 2253009489U, // <0,u,3,6>: Cost 3 vrev <6,3,u,0>
+ 2639202936U, // <0,u,3,6>: Cost 3 vext2 <3,6,0,7>, <3,6,0,7>
2639874762U, // <0,u,3,7>: Cost 3 vext2 <3,7,0,u>, <3,7,0,u>
2752743637U, // <0,u,3,u>: Cost 3 vuzpl LHS, <3,0,u,2>
2562703462U, // <0,u,4,0>: Cost 3 vext1 <2,0,u,4>, LHS
@@ -712,7 +712,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2562706742U, // <0,u,4,4>: Cost 3 vext1 <2,0,u,4>, RHS
1544899894U, // <0,u,4,5>: Cost 2 vext2 <0,2,0,u>, RHS
1679002934U, // <0,u,4,6>: Cost 2 vuzpl LHS, RHS
- 2592568379U, // <0,u,4,7>: Cost 3 vext1 <7,0,u,4>, <7,0,u,4>
+ 2718718033U, // <0,u,4,7>: Cost 3 vext3 <5,6,7,0>, <u,4,7,6>
1679002952U, // <0,u,4,u>: Cost 2 vuzpl LHS, RHS
2568683622U, // <0,u,5,0>: Cost 3 vext1 <3,0,u,5>, LHS
2568684438U, // <0,u,5,1>: Cost 3 vext1 <3,0,u,5>, <1,2,3,0>
@@ -721,14 +721,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2568686902U, // <0,u,5,4>: Cost 3 vext1 <3,0,u,5>, RHS
2650492890U, // <0,u,5,5>: Cost 3 vext2 <5,5,0,u>, <5,5,0,u>
1618139290U, // <0,u,5,6>: Cost 2 vext3 <1,2,3,0>, RHS
- 2836630838U, // <0,u,5,7>: Cost 3 vuzpr <3,0,1,u>, RHS
+ 2824834358U, // <0,u,5,7>: Cost 3 vuzpr <1,0,3,u>, RHS
1618139308U, // <0,u,5,u>: Cost 2 vext3 <1,2,3,0>, RHS
2592579686U, // <0,u,6,0>: Cost 3 vext1 <7,0,u,6>, LHS
- 2653770090U, // <0,u,6,1>: Cost 3 vext2 <6,1,0,3>, <6,1,0,3>
+ 2262496983U, // <0,u,6,1>: Cost 3 vrev <u,0,1,6>
2654474688U, // <0,u,6,2>: Cost 3 vext2 <6,2,0,u>, <6,2,0,u>
2691881168U, // <0,u,6,3>: Cost 3 vext3 <1,2,3,0>, <u,6,3,7>
2592582966U, // <0,u,6,4>: Cost 3 vext1 <7,0,u,6>, RHS
- 1175285867U, // <0,u,6,5>: Cost 2 vrev <5,6,u,0>
+ 2656465587U, // <0,u,6,5>: Cost 3 vext2 <6,5,0,u>, <6,5,0,u>
2657129220U, // <0,u,6,6>: Cost 3 vext2 <6,6,0,u>, <6,6,0,u>
1584051029U, // <0,u,6,7>: Cost 2 vext2 <6,7,0,u>, <6,7,0,u>
1584714662U, // <0,u,6,u>: Cost 2 vext2 <6,u,0,u>, <6,u,0,u>
@@ -745,100 +745,100 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1544902446U, // <0,u,u,1>: Cost 2 vext2 <0,2,0,u>, LHS
1679005486U, // <0,u,u,2>: Cost 2 vuzpl LHS, LHS
835584U, // <0,u,u,3>: Cost 0 copy LHS
- 1494969654U, // <0,u,u,4>: Cost 2 vext1 <3,0,u,u>, RHS
+ 1483025718U, // <0,u,u,4>: Cost 2 vext1 <1,0,u,u>, RHS
1544902810U, // <0,u,u,5>: Cost 2 vext2 <0,2,0,u>, RHS
1679005850U, // <0,u,u,6>: Cost 2 vuzpl LHS, RHS
1518859327U, // <0,u,u,7>: Cost 2 vext1 <7,0,u,u>, <7,0,u,u>
835584U, // <0,u,u,u>: Cost 0 copy LHS
2689744896U, // <1,0,0,0>: Cost 3 vext3 <0,u,1,1>, <0,0,0,0>
- 1562820710U, // <1,0,0,1>: Cost 2 vext2 <3,2,1,0>, LHS
+ 1610694666U, // <1,0,0,1>: Cost 2 vext3 <0,0,1,1>, <0,0,1,1>
2689744916U, // <1,0,0,2>: Cost 3 vext3 <0,u,1,1>, <0,0,2,2>
2619310332U, // <1,0,0,3>: Cost 3 vext2 <0,3,1,0>, <0,3,1,0>
- 2636562770U, // <1,0,0,4>: Cost 3 vext2 <3,2,1,0>, <0,4,1,5>
+ 2684657701U, // <1,0,0,4>: Cost 3 vext3 <0,0,4,1>, <0,0,4,1>
2620637598U, // <1,0,0,5>: Cost 3 vext2 <0,5,1,0>, <0,5,1,0>
3708977654U, // <1,0,0,6>: Cost 4 vext2 <3,0,1,0>, <0,6,1,7>
- 2256409584U, // <1,0,0,7>: Cost 3 vrev <7,0,0,1>
- 1562821277U, // <1,0,0,u>: Cost 2 vext2 <3,2,1,0>, LHS
+ 3666351168U, // <1,0,0,7>: Cost 4 vext1 <7,1,0,0>, <7,1,0,0>
+ 1611210825U, // <1,0,0,u>: Cost 2 vext3 <0,0,u,1>, <0,0,u,1>
2556780646U, // <1,0,1,0>: Cost 3 vext1 <1,1,0,1>, LHS
- 2221237035U, // <1,0,1,1>: Cost 3 vrev <1,1,0,1>
+ 2556781355U, // <1,0,1,1>: Cost 3 vext1 <1,1,0,1>, <1,1,0,1>
1616003174U, // <1,0,1,2>: Cost 2 vext3 <0,u,1,1>, LHS
- 2636563416U, // <1,0,1,3>: Cost 3 vext2 <3,2,1,0>, <1,3,1,3>
+ 3693052888U, // <1,0,1,3>: Cost 4 vext2 <0,3,1,0>, <1,3,1,3>
2556783926U, // <1,0,1,4>: Cost 3 vext1 <1,1,0,1>, RHS
- 2636563600U, // <1,0,1,5>: Cost 3 vext2 <3,2,1,0>, <1,5,3,7>
+ 2580672143U, // <1,0,1,5>: Cost 3 vext1 <5,1,0,1>, <5,1,0,1>
2724839566U, // <1,0,1,6>: Cost 3 vext3 <6,7,0,1>, <0,1,6,7>
3654415354U, // <1,0,1,7>: Cost 4 vext1 <5,1,0,1>, <7,0,1,2>
1616003228U, // <1,0,1,u>: Cost 2 vext3 <0,u,1,1>, LHS
2685690019U, // <1,0,2,0>: Cost 3 vext3 <0,2,0,1>, <0,2,0,1>
2685763756U, // <1,0,2,1>: Cost 3 vext3 <0,2,1,1>, <0,2,1,1>
- 2227873365U, // <1,0,2,2>: Cost 3 vrev <2,2,0,1>
+ 2698297524U, // <1,0,2,2>: Cost 3 vext3 <2,3,0,1>, <0,2,2,0>
2685911230U, // <1,0,2,3>: Cost 3 vext3 <0,2,3,1>, <0,2,3,1>
2689745100U, // <1,0,2,4>: Cost 3 vext3 <0,u,1,1>, <0,2,4,6>
- 4044540372U, // <1,0,2,5>: Cost 4 vzipr <3,0,1,2>, <3,4,0,5>
- 2636564410U, // <1,0,2,6>: Cost 3 vext2 <3,2,1,0>, <2,6,3,7>
+ 3764814038U, // <1,0,2,5>: Cost 4 vext3 <1,1,1,1>, <0,2,5,7>
+ 2724839640U, // <1,0,2,6>: Cost 3 vext3 <6,7,0,1>, <0,2,6,0>
2592625658U, // <1,0,2,7>: Cost 3 vext1 <7,1,0,2>, <7,0,1,2>
2686279915U, // <1,0,2,u>: Cost 3 vext3 <0,2,u,1>, <0,2,u,1>
3087843328U, // <1,0,3,0>: Cost 3 vtrnr LHS, <0,0,0,0>
3087843338U, // <1,0,3,1>: Cost 3 vtrnr LHS, <0,0,1,1>
- 1154795174U, // <1,0,3,2>: Cost 2 vrev <2,3,0,1>
- 2636564881U, // <1,0,3,3>: Cost 3 vext2 <3,2,1,0>, <3,3,2,1>
- 2636564994U, // <1,0,3,4>: Cost 3 vext2 <3,2,1,0>, <3,4,5,6>
- 2586660962U, // <1,0,3,5>: Cost 3 vext1 <6,1,0,3>, <5,6,7,0>
- 2586661226U, // <1,0,3,6>: Cost 3 vext1 <6,1,0,3>, <6,1,0,3>
- 2258400483U, // <1,0,3,7>: Cost 3 vrev <7,3,0,1>
- 1566804764U, // <1,0,3,u>: Cost 2 vext2 <3,u,1,0>, <3,u,1,0>
- 2598608998U, // <1,0,4,0>: Cost 3 vext1 <u,1,0,4>, LHS
+ 67944550U, // <1,0,3,2>: Cost 1 vrev LHS
+ 2568743135U, // <1,0,3,3>: Cost 3 vext1 <3,1,0,3>, <3,1,0,3>
+ 2562772278U, // <1,0,3,4>: Cost 3 vext1 <2,1,0,3>, RHS
+ 4099850454U, // <1,0,3,5>: Cost 4 vtrnl <1,0,3,2>, <0,2,5,7>
+ 3704998538U, // <1,0,3,6>: Cost 4 vext2 <2,3,1,0>, <3,6,2,7>
+ 2592633923U, // <1,0,3,7>: Cost 3 vext1 <7,1,0,3>, <7,1,0,3>
+ 68386972U, // <1,0,3,u>: Cost 1 vrev LHS
+ 2620640146U, // <1,0,4,0>: Cost 3 vext2 <0,5,1,0>, <4,0,5,1>
2689745234U, // <1,0,4,1>: Cost 3 vext3 <0,u,1,1>, <0,4,1,5>
2689745244U, // <1,0,4,2>: Cost 3 vext3 <0,u,1,1>, <0,4,2,6>
- 2235173328U, // <1,0,4,3>: Cost 3 vrev <3,4,0,1>
- 2598612278U, // <1,0,4,4>: Cost 3 vext1 <u,1,0,4>, RHS
- 1562823990U, // <1,0,4,5>: Cost 2 vext2 <3,2,1,0>, RHS
- 2666425716U, // <1,0,4,6>: Cost 3 vext2 <u,2,1,0>, <4,6,4,6>
- 2259064116U, // <1,0,4,7>: Cost 3 vrev <7,4,0,1>
- 1562824233U, // <1,0,4,u>: Cost 2 vext2 <3,2,1,0>, RHS
+ 3760980320U, // <1,0,4,3>: Cost 4 vext3 <0,4,3,1>, <0,4,3,1>
+ 3761054057U, // <1,0,4,4>: Cost 4 vext3 <0,4,4,1>, <0,4,4,1>
+ 2619313462U, // <1,0,4,5>: Cost 3 vext2 <0,3,1,0>, RHS
+ 3761201531U, // <1,0,4,6>: Cost 4 vext3 <0,4,6,1>, <0,4,6,1>
+ 3666383940U, // <1,0,4,7>: Cost 4 vext1 <7,1,0,4>, <7,1,0,4>
+ 2619313705U, // <1,0,4,u>: Cost 3 vext2 <0,3,1,0>, RHS
4029300736U, // <1,0,5,0>: Cost 4 vzipr <0,4,1,5>, <0,0,0,0>
- 2223891567U, // <1,0,5,1>: Cost 3 vrev <1,5,0,1>
+ 2895249510U, // <1,0,5,1>: Cost 3 vzipl <1,5,3,7>, LHS
3028287590U, // <1,0,5,2>: Cost 3 vtrnl <1,3,5,7>, LHS
- 3710308163U, // <1,0,5,3>: Cost 4 vext2 <3,2,1,0>, <5,3,2,1>
- 2241809658U, // <1,0,5,4>: Cost 3 vrev <4,5,0,1>
- 2247782355U, // <1,0,5,5>: Cost 3 vrev <5,5,0,1>
- 2666426466U, // <1,0,5,6>: Cost 3 vext2 <u,2,1,0>, <5,6,7,0>
- 2666426536U, // <1,0,5,7>: Cost 3 vext2 <u,2,1,0>, <5,7,5,7>
+ 3642501345U, // <1,0,5,3>: Cost 4 vext1 <3,1,0,5>, <3,1,0,5>
+ 2215592058U, // <1,0,5,4>: Cost 3 vrev <0,1,4,5>
+ 3724242907U, // <1,0,5,5>: Cost 4 vext2 <5,5,1,0>, <5,5,1,0>
+ 3724906540U, // <1,0,5,6>: Cost 4 vext2 <5,6,1,0>, <5,6,1,0>
+ 3911118134U, // <1,0,5,7>: Cost 4 vuzpr <3,1,3,0>, RHS
3028287644U, // <1,0,5,u>: Cost 3 vtrnl <1,3,5,7>, LHS
- 3292324327U, // <1,0,6,0>: Cost 4 vrev <0,6,0,1>
+ 3762086375U, // <1,0,6,0>: Cost 4 vext3 <0,6,0,1>, <0,6,0,1>
2698297846U, // <1,0,6,1>: Cost 3 vext3 <2,3,0,1>, <0,6,1,7>
- 2230527897U, // <1,0,6,2>: Cost 3 vrev <2,6,0,1>
+ 3760022015U, // <1,0,6,2>: Cost 4 vext3 <0,2,u,1>, <0,6,2,7>
3642509538U, // <1,0,6,3>: Cost 4 vext1 <3,1,0,6>, <3,1,0,6>
- 2242473291U, // <1,0,6,4>: Cost 3 vrev <4,6,0,1>
- 2248445988U, // <1,0,6,5>: Cost 3 vrev <5,6,0,1>
- 2254418685U, // <1,0,6,6>: Cost 3 vrev <6,6,0,1>
- 2659128142U, // <1,0,6,7>: Cost 3 vext2 <7,0,1,0>, <6,7,0,1>
- 2666427295U, // <1,0,6,u>: Cost 3 vext2 <u,2,1,0>, <6,u,0,1>
+ 3762381323U, // <1,0,6,4>: Cost 4 vext3 <0,6,4,1>, <0,6,4,1>
+ 3730215604U, // <1,0,6,5>: Cost 4 vext2 <6,5,1,0>, <6,5,1,0>
+ 3730879237U, // <1,0,6,6>: Cost 4 vext2 <6,6,1,0>, <6,6,1,0>
+ 2657801046U, // <1,0,6,7>: Cost 3 vext2 <6,7,1,0>, <6,7,1,0>
+ 2658464679U, // <1,0,6,u>: Cost 3 vext2 <6,u,1,0>, <6,u,1,0>
2659128312U, // <1,0,7,0>: Cost 3 vext2 <7,0,1,0>, <7,0,1,0>
- 3298960657U, // <1,0,7,1>: Cost 4 vrev <1,7,0,1>
- 2689155658U, // <1,0,7,2>: Cost 3 vext3 <0,7,2,1>, <0,7,2,1>
- 2237164227U, // <1,0,7,3>: Cost 3 vrev <3,7,0,1>
- 2598636854U, // <1,0,7,4>: Cost 3 vext1 <u,1,0,7>, RHS
- 2249109621U, // <1,0,7,5>: Cost 3 vrev <5,7,0,1>
- 1181340494U, // <1,0,7,6>: Cost 2 vrev <6,7,0,1>
- 2261055015U, // <1,0,7,7>: Cost 3 vrev <7,7,0,1>
- 1193285888U, // <1,0,7,u>: Cost 2 vrev <u,7,0,1>
+ 4047898278U, // <1,0,7,1>: Cost 4 vzipr <3,5,1,7>, <2,3,0,1>
+ 2215460970U, // <1,0,7,2>: Cost 3 vrev <0,1,2,7>
+ 3734861035U, // <1,0,7,3>: Cost 4 vext2 <7,3,1,0>, <7,3,1,0>
+ 3731543398U, // <1,0,7,4>: Cost 4 vext2 <6,7,1,0>, <7,4,5,6>
+ 3736188301U, // <1,0,7,5>: Cost 4 vext2 <7,5,1,0>, <7,5,1,0>
+ 2663110110U, // <1,0,7,6>: Cost 3 vext2 <7,6,1,0>, <7,6,1,0>
+ 3731543660U, // <1,0,7,7>: Cost 4 vext2 <6,7,1,0>, <7,7,7,7>
+ 2664437376U, // <1,0,7,u>: Cost 3 vext2 <7,u,1,0>, <7,u,1,0>
3087884288U, // <1,0,u,0>: Cost 3 vtrnr LHS, <0,0,0,0>
1616003730U, // <1,0,u,1>: Cost 2 vext3 <0,u,1,1>, <0,u,1,1>
- 1616003741U, // <1,0,u,2>: Cost 2 vext3 <0,u,1,1>, LHS
+ 67985515U, // <1,0,u,2>: Cost 1 vrev LHS
2689893028U, // <1,0,u,3>: Cost 3 vext3 <0,u,3,1>, <0,u,3,1>
2689745586U, // <1,0,u,4>: Cost 3 vext3 <0,u,1,1>, <0,u,4,6>
- 1562826906U, // <1,0,u,5>: Cost 2 vext2 <3,2,1,0>, RHS
- 1182004127U, // <1,0,u,6>: Cost 2 vrev <6,u,0,1>
- 2261718648U, // <1,0,u,7>: Cost 3 vrev <7,u,0,1>
- 1616003795U, // <1,0,u,u>: Cost 2 vext3 <0,u,1,1>, LHS
+ 2619316378U, // <1,0,u,5>: Cost 3 vext2 <0,3,1,0>, RHS
+ 2669082807U, // <1,0,u,6>: Cost 3 vext2 <u,6,1,0>, <u,6,1,0>
+ 2592674888U, // <1,0,u,7>: Cost 3 vext1 <7,1,0,u>, <7,1,0,u>
+ 68427937U, // <1,0,u,u>: Cost 1 vrev LHS
1543585802U, // <1,1,0,0>: Cost 2 vext2 <0,0,1,1>, <0,0,1,1>
1548894310U, // <1,1,0,1>: Cost 2 vext2 <0,u,1,1>, LHS
2618654892U, // <1,1,0,2>: Cost 3 vext2 <0,2,1,1>, <0,2,1,1>
- 2690556661U, // <1,1,0,3>: Cost 3 vext3 <1,0,3,1>, <1,0,3,1>
+ 2689745654U, // <1,1,0,3>: Cost 3 vext3 <0,u,1,1>, <1,0,3,2>
2622636370U, // <1,1,0,4>: Cost 3 vext2 <0,u,1,1>, <0,4,1,5>
2620645791U, // <1,1,0,5>: Cost 3 vext2 <0,5,1,1>, <0,5,1,1>
3696378367U, // <1,1,0,6>: Cost 4 vext2 <0,u,1,1>, <0,6,2,7>
- 2724840222U, // <1,1,0,7>: Cost 3 vext3 <6,7,0,1>, <1,0,7,6>
+ 3666424905U, // <1,1,0,7>: Cost 4 vext1 <7,1,1,0>, <7,1,1,0>
1548894866U, // <1,1,0,u>: Cost 2 vext2 <0,u,1,1>, <0,u,1,1>
1483112550U, // <1,1,1,0>: Cost 2 vext1 <1,1,1,1>, LHS
202162278U, // <1,1,1,1>: Cost 1 vdup1 LHS
@@ -847,7 +847,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1483115830U, // <1,1,1,4>: Cost 2 vext1 <1,1,1,1>, RHS
2622637200U, // <1,1,1,5>: Cost 3 vext2 <0,u,1,1>, <1,5,3,7>
2622637263U, // <1,1,1,6>: Cost 3 vext2 <0,u,1,1>, <1,6,1,7>
- 2257146954U, // <1,1,1,7>: Cost 3 vrev <7,1,1,1>
+ 2592691274U, // <1,1,1,7>: Cost 3 vext1 <7,1,1,1>, <7,1,1,1>
202162278U, // <1,1,1,u>: Cost 1 vdup1 LHS
2550890588U, // <1,1,2,0>: Cost 3 vext1 <0,1,1,2>, <0,1,1,2>
2617329183U, // <1,1,2,1>: Cost 3 vext2 <0,0,1,1>, <2,1,3,1>
@@ -860,7 +860,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2622638139U, // <1,1,2,u>: Cost 3 vext2 <0,u,1,1>, <2,u,0,1>
2622638230U, // <1,1,3,0>: Cost 3 vext2 <0,u,1,1>, <3,0,1,2>
3087844148U, // <1,1,3,1>: Cost 3 vtrnr LHS, <1,1,1,1>
- 2622638390U, // <1,1,3,2>: Cost 3 vext2 <0,u,1,1>, <3,2,1,0>
+ 4161585244U, // <1,1,3,2>: Cost 4 vtrnr LHS, <0,1,1,2>
2014101606U, // <1,1,3,3>: Cost 2 vtrnr LHS, LHS
2622638594U, // <1,1,3,4>: Cost 3 vext2 <0,u,1,1>, <3,4,5,6>
2689745920U, // <1,1,3,5>: Cost 3 vext3 <0,u,1,1>, <1,3,5,7>
@@ -868,7 +868,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2592707660U, // <1,1,3,7>: Cost 3 vext1 <7,1,1,3>, <7,1,1,3>
2014101611U, // <1,1,3,u>: Cost 2 vtrnr LHS, LHS
2556878950U, // <1,1,4,0>: Cost 3 vext1 <1,1,1,4>, LHS
- 2556879671U, // <1,1,4,1>: Cost 3 vext1 <1,1,1,4>, <1,1,1,4>
+ 2221335351U, // <1,1,4,1>: Cost 3 vrev <1,1,1,4>
3696380988U, // <1,1,4,2>: Cost 4 vext2 <0,u,1,1>, <4,2,6,0>
3763487805U, // <1,1,4,3>: Cost 4 vext3 <0,u,1,1>, <1,4,3,5>
2556882230U, // <1,1,4,4>: Cost 3 vext1 <1,1,1,4>, RHS
@@ -880,7 +880,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2617331408U, // <1,1,5,1>: Cost 3 vext2 <0,0,1,1>, <5,1,7,3>
4029302934U, // <1,1,5,2>: Cost 4 vzipr <0,4,1,5>, <3,0,1,2>
2689746064U, // <1,1,5,3>: Cost 3 vext3 <0,u,1,1>, <1,5,3,7>
- 2550918454U, // <1,1,5,4>: Cost 3 vext1 <0,1,1,5>, RHS
+ 2221564755U, // <1,1,5,4>: Cost 3 vrev <1,1,4,5>
2955559250U, // <1,1,5,5>: Cost 3 vzipr <0,4,1,5>, <0,4,1,5>
2617331810U, // <1,1,5,6>: Cost 3 vext2 <0,0,1,1>, <5,6,7,0>
2825293110U, // <1,1,5,7>: Cost 3 vuzpr <1,1,1,1>, RHS
@@ -889,23 +889,23 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689746127U, // <1,1,6,1>: Cost 3 vext3 <0,u,1,1>, <1,6,1,7>
2617332218U, // <1,1,6,2>: Cost 3 vext2 <0,0,1,1>, <6,2,7,3>
3763487969U, // <1,1,6,3>: Cost 4 vext3 <0,u,1,1>, <1,6,3,7>
- 3696382572U, // <1,1,6,4>: Cost 4 vext2 <0,u,1,1>, <6,4,2,0>
+ 3696382605U, // <1,1,6,4>: Cost 4 vext2 <0,u,1,1>, <6,4,5,6>
4029309266U, // <1,1,6,5>: Cost 4 vzipr <0,4,1,6>, <0,4,1,5>
2617332536U, // <1,1,6,6>: Cost 3 vext2 <0,0,1,1>, <6,6,6,6>
2724840702U, // <1,1,6,7>: Cost 3 vext3 <6,7,0,1>, <1,6,7,0>
2725504263U, // <1,1,6,u>: Cost 3 vext3 <6,u,0,1>, <1,6,u,0>
2617332720U, // <1,1,7,0>: Cost 3 vext2 <0,0,1,1>, <7,0,0,1>
2659800138U, // <1,1,7,1>: Cost 3 vext2 <7,1,1,1>, <7,1,1,1>
- 3691074725U, // <1,1,7,2>: Cost 4 vext2 <0,0,1,1>, <7,2,2,2>
+ 3691074717U, // <1,1,7,2>: Cost 4 vext2 <0,0,1,1>, <7,2,1,3>
4167811174U, // <1,1,7,3>: Cost 4 vtrnr <1,1,5,7>, LHS
2617333094U, // <1,1,7,4>: Cost 3 vext2 <0,0,1,1>, <7,4,5,6>
- 3769091390U, // <1,1,7,5>: Cost 4 vext3 <1,7,5,1>, <1,7,5,1>
- 2255156055U, // <1,1,7,6>: Cost 3 vrev <6,7,1,1>
+ 3295396702U, // <1,1,7,5>: Cost 4 vrev <1,1,5,7>
+ 3803891014U, // <1,1,7,6>: Cost 4 vext3 <7,6,0,1>, <1,7,6,0>
2617333356U, // <1,1,7,7>: Cost 3 vext2 <0,0,1,1>, <7,7,7,7>
- 2267101449U, // <1,1,7,u>: Cost 3 vrev <u,7,1,1>
+ 2659800138U, // <1,1,7,u>: Cost 3 vext2 <7,1,1,1>, <7,1,1,1>
1483112550U, // <1,1,u,0>: Cost 2 vext1 <1,1,1,1>, LHS
202162278U, // <1,1,u,1>: Cost 1 vdup1 LHS
- 2622642035U, // <1,1,u,2>: Cost 3 vext2 <0,u,1,1>, <u,2,1,0>
+ 2622642056U, // <1,1,u,2>: Cost 3 vext2 <0,u,1,1>, <u,2,3,3>
2014142566U, // <1,1,u,3>: Cost 2 vtrnr LHS, LHS
1483115830U, // <1,1,u,4>: Cost 2 vext1 <1,1,1,1>, RHS
1548900506U, // <1,1,u,5>: Cost 2 vext2 <0,u,1,1>, RHS
@@ -915,11 +915,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2635251712U, // <1,2,0,0>: Cost 3 vext2 <3,0,1,2>, <0,0,0,0>
1561509990U, // <1,2,0,1>: Cost 2 vext2 <3,0,1,2>, LHS
2618663085U, // <1,2,0,2>: Cost 3 vext2 <0,2,1,2>, <0,2,1,2>
- 2619326718U, // <1,2,0,3>: Cost 3 vext2 <0,3,1,2>, <0,3,1,2>
+ 2696529358U, // <1,2,0,3>: Cost 3 vext3 <2,0,3,1>, <2,0,3,1>
2635252050U, // <1,2,0,4>: Cost 3 vext2 <3,0,1,2>, <0,4,1,5>
- 2635252142U, // <1,2,0,5>: Cost 3 vext2 <3,0,1,2>, <0,5,2,7>
+ 3769533926U, // <1,2,0,5>: Cost 4 vext3 <1,u,2,1>, <2,0,5,7>
2621317617U, // <1,2,0,6>: Cost 3 vext2 <0,6,1,2>, <0,6,1,2>
- 2659140160U, // <1,2,0,7>: Cost 3 vext2 <7,0,1,2>, <0,7,1,0>
+ 2659140170U, // <1,2,0,7>: Cost 3 vext2 <7,0,1,2>, <0,7,2,1>
1561510557U, // <1,2,0,u>: Cost 2 vext2 <3,0,1,2>, LHS
2623308516U, // <1,2,1,0>: Cost 3 vext2 <1,0,1,2>, <1,0,1,2>
2635252532U, // <1,2,1,1>: Cost 3 vext2 <3,0,1,2>, <1,1,1,1>
@@ -931,7 +931,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3732882731U, // <1,2,1,7>: Cost 4 vext2 <7,0,1,2>, <1,7,3,0>
2958180459U, // <1,2,1,u>: Cost 3 vzipr <0,u,1,1>, LHS
2629281213U, // <1,2,2,0>: Cost 3 vext2 <2,0,1,2>, <2,0,1,2>
- 2635253254U, // <1,2,2,1>: Cost 3 vext2 <3,0,1,2>, <2,1,0,3>
+ 2635253280U, // <1,2,2,1>: Cost 3 vext2 <3,0,1,2>, <2,1,3,2>
2618664552U, // <1,2,2,2>: Cost 3 vext2 <0,2,1,2>, <2,2,2,2>
2689746546U, // <1,2,2,3>: Cost 3 vext3 <0,u,1,1>, <2,2,3,3>
3764815485U, // <1,2,2,4>: Cost 4 vext3 <1,1,1,1>, <2,2,4,5>
@@ -940,9 +940,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2659141610U, // <1,2,2,7>: Cost 3 vext2 <7,0,1,2>, <2,7,0,1>
2689746591U, // <1,2,2,u>: Cost 3 vext3 <0,u,1,1>, <2,2,u,3>
403488870U, // <1,2,3,0>: Cost 1 vext1 LHS, LHS
- 1477231412U, // <1,2,3,1>: Cost 2 vext1 LHS, <1,1,1,1>
+ 1477231350U, // <1,2,3,1>: Cost 2 vext1 LHS, <1,0,3,2>
1477232232U, // <1,2,3,2>: Cost 2 vext1 LHS, <2,2,2,2>
- 1477232950U, // <1,2,3,3>: Cost 2 vext1 LHS, <3,2,1,0>
+ 1477233052U, // <1,2,3,3>: Cost 2 vext1 LHS, <3,3,3,3>
403492150U, // <1,2,3,4>: Cost 1 vext1 LHS, RHS
1525010128U, // <1,2,3,5>: Cost 2 vext1 LHS, <5,1,7,3>
1525010938U, // <1,2,3,6>: Cost 2 vext1 LHS, <6,2,7,3>
@@ -950,7 +950,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
403494702U, // <1,2,3,u>: Cost 1 vext1 LHS, LHS
2641226607U, // <1,2,4,0>: Cost 3 vext2 <4,0,1,2>, <4,0,1,2>
3624723446U, // <1,2,4,1>: Cost 4 vext1 <0,1,2,4>, <1,3,4,6>
- 3636667929U, // <1,2,4,2>: Cost 4 vext1 <2,1,2,4>, <2,1,2,4>
+ 3301123609U, // <1,2,4,2>: Cost 4 vrev <2,1,2,4>
2598759198U, // <1,2,4,3>: Cost 3 vext1 <u,1,2,4>, <3,u,1,2>
2659142864U, // <1,2,4,4>: Cost 3 vext2 <7,0,1,2>, <4,4,4,4>
1561513270U, // <1,2,4,5>: Cost 2 vext2 <3,0,1,2>, RHS
@@ -980,12 +980,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3708998858U, // <1,2,7,2>: Cost 4 vext2 <3,0,1,2>, <7,2,6,3>
2635257059U, // <1,2,7,3>: Cost 3 vext2 <3,0,1,2>, <7,3,0,1>
2659145062U, // <1,2,7,4>: Cost 3 vext2 <7,0,1,2>, <7,4,5,6>
- 3708999072U, // <1,2,7,5>: Cost 4 vext2 <3,0,1,2>, <7,5,3,1>
- 2659145222U, // <1,2,7,6>: Cost 3 vext2 <7,0,1,2>, <7,6,5,4>
+ 3732886916U, // <1,2,7,5>: Cost 4 vext2 <7,0,1,2>, <7,5,0,0>
+ 3732886998U, // <1,2,7,6>: Cost 4 vext2 <7,0,1,2>, <7,6,0,1>
2659145255U, // <1,2,7,7>: Cost 3 vext2 <7,0,1,2>, <7,7,0,1>
1590711938U, // <1,2,7,u>: Cost 2 vext2 <7,u,1,2>, <7,u,1,2>
403529835U, // <1,2,u,0>: Cost 1 vext1 LHS, LHS
- 1477272372U, // <1,2,u,1>: Cost 2 vext1 LHS, <1,1,1,1>
+ 1477272310U, // <1,2,u,1>: Cost 2 vext1 LHS, <1,0,3,2>
1477273192U, // <1,2,u,2>: Cost 2 vext1 LHS, <2,2,2,2>
1477273750U, // <1,2,u,3>: Cost 2 vext1 LHS, <3,0,1,2>
403533110U, // <1,2,u,4>: Cost 1 vext1 LHS, RHS
@@ -995,24 +995,24 @@ static const unsigned PerfectShuffleTable[6561+1] = {
403535662U, // <1,2,u,u>: Cost 1 vext1 LHS, LHS
2819407872U, // <1,3,0,0>: Cost 3 vuzpr LHS, <0,0,0,0>
1551564902U, // <1,3,0,1>: Cost 2 vext2 <1,3,1,3>, LHS
- 2819410070U, // <1,3,0,2>: Cost 3 vuzpr LHS, <3,0,1,2>
+ 2819408630U, // <1,3,0,2>: Cost 3 vuzpr LHS, <1,0,3,2>
2619334911U, // <1,3,0,3>: Cost 3 vext2 <0,3,1,3>, <0,3,1,3>
2625306962U, // <1,3,0,4>: Cost 3 vext2 <1,3,1,3>, <0,4,1,5>
3832725879U, // <1,3,0,5>: Cost 4 vuzpl <1,2,3,0>, <0,4,5,6>
3699048959U, // <1,3,0,6>: Cost 4 vext2 <1,3,1,3>, <0,6,2,7>
3776538827U, // <1,3,0,7>: Cost 4 vext3 <3,0,7,1>, <3,0,7,1>
1551565469U, // <1,3,0,u>: Cost 2 vext2 <1,3,1,3>, LHS
- 2557001830U, // <1,3,1,0>: Cost 3 vext1 <1,1,3,1>, LHS
+ 2618671862U, // <1,3,1,0>: Cost 3 vext2 <0,2,1,3>, <1,0,3,2>
2819408692U, // <1,3,1,1>: Cost 3 vuzpr LHS, <1,1,1,1>
- 2618672022U, // <1,3,1,2>: Cost 3 vext2 <0,2,1,3>, <1,2,3,0>
+ 2624643975U, // <1,3,1,2>: Cost 3 vext2 <1,2,1,3>, <1,2,1,3>
1745666150U, // <1,3,1,3>: Cost 2 vuzpr LHS, LHS
2557005110U, // <1,3,1,4>: Cost 3 vext1 <1,1,3,1>, RHS
2625307792U, // <1,3,1,5>: Cost 3 vext2 <1,3,1,3>, <1,5,3,7>
3698386127U, // <1,3,1,6>: Cost 4 vext2 <1,2,1,3>, <1,6,1,7>
- 2257294428U, // <1,3,1,7>: Cost 3 vrev <7,1,3,1>
+ 2592838748U, // <1,3,1,7>: Cost 3 vext1 <7,1,3,1>, <7,1,3,1>
1745666155U, // <1,3,1,u>: Cost 2 vuzpr LHS, LHS
2819408790U, // <1,3,2,0>: Cost 3 vuzpr LHS, <1,2,3,0>
- 2689747254U, // <1,3,2,1>: Cost 3 vext3 <0,u,1,1>, <3,2,1,0>
+ 2625308193U, // <1,3,2,1>: Cost 3 vext2 <1,3,1,3>, <2,1,3,3>
2819408036U, // <1,3,2,2>: Cost 3 vuzpr LHS, <0,2,0,2>
2819851890U, // <1,3,2,3>: Cost 3 vuzpr LHS, <2,2,3,3>
2819408794U, // <1,3,2,4>: Cost 3 vuzpr LHS, <1,2,3,4>
@@ -1032,16 +1032,16 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2568970342U, // <1,3,4,0>: Cost 3 vext1 <3,1,3,4>, LHS
2568971224U, // <1,3,4,1>: Cost 3 vext1 <3,1,3,4>, <1,3,1,3>
3832761290U, // <1,3,4,2>: Cost 4 vuzpl <1,2,3,4>, <4,1,2,3>
- 2568972539U, // <1,3,4,3>: Cost 3 vext1 <3,1,3,4>, <3,1,3,4>
+ 2233428219U, // <1,3,4,3>: Cost 3 vrev <3,1,3,4>
2568973622U, // <1,3,4,4>: Cost 3 vext1 <3,1,3,4>, RHS
1551568182U, // <1,3,4,5>: Cost 2 vext2 <1,3,1,3>, RHS
2819410434U, // <1,3,4,6>: Cost 3 vuzpr LHS, <3,4,5,6>
- 3729575382U, // <1,3,4,7>: Cost 4 vext2 <6,4,1,3>, <4,7,6,5>
+ 3666605151U, // <1,3,4,7>: Cost 4 vext1 <7,1,3,4>, <7,1,3,4>
1551568425U, // <1,3,4,u>: Cost 2 vext2 <1,3,1,3>, RHS
2563006566U, // <1,3,5,0>: Cost 3 vext1 <2,1,3,5>, LHS
2568979456U, // <1,3,5,1>: Cost 3 vext1 <3,1,3,5>, <1,3,5,7>
2563008035U, // <1,3,5,2>: Cost 3 vext1 <2,1,3,5>, <2,1,3,5>
- 2568980732U, // <1,3,5,3>: Cost 3 vext1 <3,1,3,5>, <3,1,3,5>
+ 2233436412U, // <1,3,5,3>: Cost 3 vrev <3,1,3,5>
2563009846U, // <1,3,5,4>: Cost 3 vext1 <2,1,3,5>, RHS
2867187716U, // <1,3,5,5>: Cost 3 vuzpr LHS, <5,5,5,5>
2655834214U, // <1,3,5,6>: Cost 3 vext2 <6,4,1,3>, <5,6,7,4>
@@ -1061,8 +1061,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3636766245U, // <1,3,7,2>: Cost 4 vext1 <2,1,3,7>, <2,1,3,7>
2867187903U, // <1,3,7,3>: Cost 3 vuzpr LHS, <5,7,u,3>
2625312102U, // <1,3,7,4>: Cost 3 vext2 <1,3,1,3>, <7,4,5,6>
- 2662471056U, // <1,3,7,5>: Cost 3 vext2 <7,5,1,3>, <7,5,1,3>
- 2625312262U, // <1,3,7,6>: Cost 3 vext2 <1,3,1,3>, <7,6,5,4>
+ 2867188598U, // <1,3,7,5>: Cost 3 vuzpr LHS, <6,7,4,5>
+ 3728250344U, // <1,3,7,6>: Cost 4 vext2 <6,2,1,3>, <7,6,2,1>
2867187880U, // <1,3,7,7>: Cost 3 vuzpr LHS, <5,7,5,7>
2707516171U, // <1,3,7,u>: Cost 3 vext3 <3,7,u,1>, <3,7,u,1>
1483317350U, // <1,3,u,0>: Cost 2 vext1 <1,1,3,u>, LHS
@@ -1074,16 +1074,16 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2819410758U, // <1,3,u,6>: Cost 3 vuzpr LHS, <3,u,5,6>
1745669673U, // <1,3,u,7>: Cost 2 vuzpr LHS, RHS
1745666722U, // <1,3,u,u>: Cost 2 vuzpr LHS, LHS
- 2580955238U, // <1,4,0,0>: Cost 3 vext1 <5,1,4,0>, LHS
+ 2617352205U, // <1,4,0,0>: Cost 3 vext2 <0,0,1,4>, <0,0,1,4>
2619342950U, // <1,4,0,1>: Cost 3 vext2 <0,3,1,4>, LHS
3692421295U, // <1,4,0,2>: Cost 4 vext2 <0,2,1,4>, <0,2,1,4>
2619343104U, // <1,4,0,3>: Cost 3 vext2 <0,3,1,4>, <0,3,1,4>
- 2580958518U, // <1,4,0,4>: Cost 3 vext1 <5,1,4,0>, RHS
+ 2617352530U, // <1,4,0,4>: Cost 3 vext2 <0,0,1,4>, <0,4,1,5>
1634880402U, // <1,4,0,5>: Cost 2 vext3 <4,0,5,1>, <4,0,5,1>
2713930652U, // <1,4,0,6>: Cost 3 vext3 <4,u,5,1>, <4,0,6,2>
- 2256704532U, // <1,4,0,7>: Cost 3 vrev <7,0,4,1>
+ 3732898396U, // <1,4,0,7>: Cost 4 vext2 <7,0,1,4>, <0,7,4,1>
1635101613U, // <1,4,0,u>: Cost 2 vext3 <4,0,u,1>, <4,0,u,1>
- 3763710902U, // <1,4,1,0>: Cost 4 vext3 <0,u,4,1>, <4,1,0,1>
+ 3693085430U, // <1,4,1,0>: Cost 4 vext2 <0,3,1,4>, <1,0,3,2>
2623988535U, // <1,4,1,1>: Cost 3 vext2 <1,1,1,4>, <1,1,1,4>
3693085590U, // <1,4,1,2>: Cost 4 vext2 <0,3,1,4>, <1,2,3,0>
3692422134U, // <1,4,1,3>: Cost 4 vext2 <0,2,1,4>, <1,3,4,6>
@@ -1111,8 +1111,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3666670695U, // <1,4,3,7>: Cost 4 vext1 <7,1,4,3>, <7,1,4,3>
3087843669U, // <1,4,3,u>: Cost 3 vtrnr LHS, <0,4,1,u>
2620672914U, // <1,4,4,0>: Cost 3 vext2 <0,5,1,4>, <4,0,5,1>
- 3693087696U, // <1,4,4,1>: Cost 4 vext2 <0,3,1,4>, <4,1,3,0>
- 3624871590U, // <1,4,4,2>: Cost 4 vext1 <0,1,4,4>, <2,3,0,1>
+ 3630842706U, // <1,4,4,1>: Cost 4 vext1 <1,1,4,4>, <1,1,4,4>
+ 3313069003U, // <1,4,4,2>: Cost 4 vrev <4,1,2,4>
3642788100U, // <1,4,4,3>: Cost 4 vext1 <3,1,4,4>, <3,1,4,4>
2713930960U, // <1,4,4,4>: Cost 3 vext3 <4,u,5,1>, <4,4,4,4>
2619346230U, // <1,4,4,5>: Cost 3 vext2 <0,3,1,4>, RHS
@@ -1130,7 +1130,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1616006472U, // <1,4,5,u>: Cost 2 vext3 <0,u,1,1>, RHS
2557116518U, // <1,4,6,0>: Cost 3 vext1 <1,1,4,6>, LHS
2557117236U, // <1,4,6,1>: Cost 3 vext1 <1,1,4,6>, <1,1,1,1>
- 2698300764U, // <1,4,6,2>: Cost 3 vext3 <2,3,0,1>, <4,6,2,0>
+ 3630859880U, // <1,4,6,2>: Cost 4 vext1 <1,1,4,6>, <2,2,2,2>
2569062550U, // <1,4,6,3>: Cost 3 vext1 <3,1,4,6>, <3,0,1,2>
2557119798U, // <1,4,6,4>: Cost 3 vext1 <1,1,4,6>, RHS
3763490174U, // <1,4,6,5>: Cost 4 vext3 <0,u,1,1>, <4,6,5,7>
@@ -1141,19 +1141,19 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3732903040U, // <1,4,7,1>: Cost 4 vext2 <7,0,1,4>, <7,1,7,1>
3734230174U, // <1,4,7,2>: Cost 4 vext2 <7,2,1,4>, <7,2,1,4>
3734893807U, // <1,4,7,3>: Cost 4 vext2 <7,3,1,4>, <7,3,1,4>
- 2622002534U, // <1,4,7,4>: Cost 3 vext2 <0,7,1,4>, <7,4,5,6>
+ 3660729654U, // <1,4,7,4>: Cost 4 vext1 <6,1,4,7>, RHS
3786493384U, // <1,4,7,5>: Cost 4 vext3 <4,6,7,1>, <4,7,5,0>
2713341394U, // <1,4,7,6>: Cost 3 vext3 <4,7,6,1>, <4,7,6,1>
3660731386U, // <1,4,7,7>: Cost 4 vext1 <6,1,4,7>, <7,0,1,2>
2664470148U, // <1,4,7,u>: Cost 3 vext2 <7,u,1,4>, <7,u,1,4>
2557132902U, // <1,4,u,0>: Cost 3 vext1 <1,1,4,u>, LHS
2619348782U, // <1,4,u,1>: Cost 3 vext2 <0,3,1,4>, LHS
- 2232150111U, // <1,4,u,2>: Cost 3 vrev <2,u,4,1>
- 2619343104U, // <1,4,u,3>: Cost 3 vext2 <0,3,1,4>, <0,3,1,4>
+ 2563106351U, // <1,4,u,2>: Cost 3 vext1 <2,1,4,u>, <2,1,4,u>
+ 2713783816U, // <1,4,u,3>: Cost 3 vext3 <4,u,3,1>, <4,u,3,1>
2622666815U, // <1,4,u,4>: Cost 3 vext2 <0,u,1,4>, <u,4,5,6>
1640189466U, // <1,4,u,5>: Cost 2 vext3 <4,u,5,1>, <4,u,5,1>
1616006697U, // <1,4,u,6>: Cost 2 vext3 <0,u,1,1>, RHS
- 2256704532U, // <1,4,u,7>: Cost 3 vrev <7,0,4,1>
+ 2712751498U, // <1,4,u,7>: Cost 3 vext3 <4,6,7,1>, <4,6,7,1>
1616006715U, // <1,4,u,u>: Cost 2 vext3 <0,u,1,1>, RHS
2620014592U, // <1,5,0,0>: Cost 3 vext2 <0,4,1,5>, <0,0,0,0>
1546272870U, // <1,5,0,1>: Cost 2 vext2 <0,4,1,5>, LHS
@@ -1162,9 +1162,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1546273106U, // <1,5,0,4>: Cost 2 vext2 <0,4,1,5>, <0,4,1,5>
2620678563U, // <1,5,0,5>: Cost 3 vext2 <0,5,1,5>, <0,5,1,5>
2714668660U, // <1,5,0,6>: Cost 3 vext3 <5,0,6,1>, <5,0,6,1>
- 4167978294U, // <1,5,0,7>: Cost 4 vtrnr <1,1,u,0>, RHS
+ 3772042877U, // <1,5,0,7>: Cost 4 vext3 <2,3,0,1>, <5,0,7,1>
1546273437U, // <1,5,0,u>: Cost 2 vext2 <0,4,1,5>, LHS
- 2713931407U, // <1,5,1,0>: Cost 3 vext3 <4,u,5,1>, <5,1,0,1>
+ 2620015350U, // <1,5,1,0>: Cost 3 vext2 <0,4,1,5>, <1,0,3,2>
2620015412U, // <1,5,1,1>: Cost 3 vext2 <0,4,1,5>, <1,1,1,1>
2620015510U, // <1,5,1,2>: Cost 3 vext2 <0,4,1,5>, <1,2,3,0>
2618688512U, // <1,5,1,3>: Cost 3 vext2 <0,2,1,5>, <1,3,5,7>
@@ -1173,7 +1173,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2620015859U, // <1,5,1,6>: Cost 3 vext2 <0,4,1,5>, <1,6,5,7>
3093728566U, // <1,5,1,7>: Cost 3 vtrnr <1,1,1,1>, RHS
2620015981U, // <1,5,1,u>: Cost 3 vext2 <0,4,1,5>, <1,u,1,3>
- 3693757885U, // <1,5,2,0>: Cost 4 vext2 <0,4,1,5>, <2,0,1,2>
+ 3692430816U, // <1,5,2,0>: Cost 4 vext2 <0,2,1,5>, <2,0,5,1>
2620016163U, // <1,5,2,1>: Cost 3 vext2 <0,4,1,5>, <2,1,3,5>
2620016232U, // <1,5,2,2>: Cost 3 vext2 <0,4,1,5>, <2,2,2,2>
2620016294U, // <1,5,2,3>: Cost 3 vext2 <0,4,1,5>, <2,3,0,1>
@@ -1184,24 +1184,24 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2620016699U, // <1,5,2,u>: Cost 3 vext2 <0,4,1,5>, <2,u,0,1>
2620016790U, // <1,5,3,0>: Cost 3 vext2 <0,4,1,5>, <3,0,1,2>
2569110672U, // <1,5,3,1>: Cost 3 vext1 <3,1,5,3>, <1,5,3,7>
- 2620016950U, // <1,5,3,2>: Cost 3 vext2 <0,4,1,5>, <3,2,1,0>
+ 3693758785U, // <1,5,3,2>: Cost 4 vext2 <0,4,1,5>, <3,2,2,2>
2620017052U, // <1,5,3,3>: Cost 3 vext2 <0,4,1,5>, <3,3,3,3>
2620017154U, // <1,5,3,4>: Cost 3 vext2 <0,4,1,5>, <3,4,5,6>
3135623172U, // <1,5,3,5>: Cost 3 vtrnr LHS, <5,5,5,5>
4161587048U, // <1,5,3,6>: Cost 4 vtrnr LHS, <2,5,3,6>
2014104886U, // <1,5,3,7>: Cost 2 vtrnr LHS, RHS
2014104887U, // <1,5,3,u>: Cost 2 vtrnr LHS, RHS
- 2575089766U, // <1,5,4,0>: Cost 3 vext1 <4,1,5,4>, LHS
+ 2620017554U, // <1,5,4,0>: Cost 3 vext2 <0,4,1,5>, <4,0,5,1>
2620017634U, // <1,5,4,1>: Cost 3 vext2 <0,4,1,5>, <4,1,5,0>
3693759551U, // <1,5,4,2>: Cost 4 vext2 <0,4,1,5>, <4,2,6,3>
- 3772632990U, // <1,5,4,3>: Cost 4 vext3 <2,3,u,1>, <5,4,3,2>
+ 3642861837U, // <1,5,4,3>: Cost 4 vext1 <3,1,5,4>, <3,1,5,4>
2575092710U, // <1,5,4,4>: Cost 3 vext1 <4,1,5,4>, <4,1,5,4>
1546276150U, // <1,5,4,5>: Cost 2 vext2 <0,4,1,5>, RHS
2759855414U, // <1,5,4,6>: Cost 3 vuzpl <1,3,5,7>, RHS
- 4167494966U, // <1,5,4,7>: Cost 4 vtrnr <1,1,1,4>, RHS
+ 2713931718U, // <1,5,4,7>: Cost 3 vext3 <4,u,5,1>, <5,4,7,6>
1546276393U, // <1,5,4,u>: Cost 2 vext2 <0,4,1,5>, RHS
2557182054U, // <1,5,5,0>: Cost 3 vext1 <1,1,5,5>, LHS
- 2620018354U, // <1,5,5,1>: Cost 3 vext2 <0,4,1,5>, <5,1,4,0>
+ 2557182812U, // <1,5,5,1>: Cost 3 vext1 <1,1,5,5>, <1,1,5,5>
3630925347U, // <1,5,5,2>: Cost 4 vext1 <1,1,5,5>, <2,1,3,5>
4029301675U, // <1,5,5,3>: Cost 4 vzipr <0,4,1,5>, <1,2,5,3>
2557185334U, // <1,5,5,4>: Cost 3 vext1 <1,1,5,5>, RHS
@@ -1213,8 +1213,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2620019115U, // <1,5,6,1>: Cost 3 vext2 <0,4,1,5>, <6,1,7,5>
2667794938U, // <1,5,6,2>: Cost 3 vext2 <u,4,1,5>, <6,2,7,3>
3787673666U, // <1,5,6,3>: Cost 4 vext3 <4,u,5,1>, <5,6,3,4>
- 3693761132U, // <1,5,6,4>: Cost 4 vext2 <0,4,1,5>, <6,4,2,0>
- 3654823617U, // <1,5,6,5>: Cost 4 vext1 <5,1,5,6>, <5,1,5,6>
+ 3693761165U, // <1,5,6,4>: Cost 4 vext2 <0,4,1,5>, <6,4,5,6>
+ 3319279297U, // <1,5,6,5>: Cost 4 vrev <5,1,5,6>
2667795256U, // <1,5,6,6>: Cost 3 vext2 <u,4,1,5>, <6,6,6,6>
2713931874U, // <1,5,6,7>: Cost 3 vext3 <4,u,5,1>, <5,6,7,0>
2713931883U, // <1,5,6,u>: Cost 3 vext3 <4,u,5,1>, <5,6,u,0>
@@ -1224,12 +1224,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2569144592U, // <1,5,7,3>: Cost 3 vext1 <3,1,5,7>, <3,1,5,7>
2557201718U, // <1,5,7,4>: Cost 3 vext1 <1,1,5,7>, RHS
2713931944U, // <1,5,7,5>: Cost 3 vext3 <4,u,5,1>, <5,7,5,7>
- 2255451003U, // <1,5,7,6>: Cost 3 vrev <6,7,5,1>
+ 3787673770U, // <1,5,7,6>: Cost 4 vext3 <4,u,5,1>, <5,7,6,0>
2719387828U, // <1,5,7,7>: Cost 3 vext3 <5,7,7,1>, <5,7,7,1>
2557204270U, // <1,5,7,u>: Cost 3 vext1 <1,1,5,7>, LHS
2620020435U, // <1,5,u,0>: Cost 3 vext2 <0,4,1,5>, <u,0,1,2>
1546278702U, // <1,5,u,1>: Cost 2 vext2 <0,4,1,5>, LHS
- 2620020595U, // <1,5,u,2>: Cost 3 vext2 <0,4,1,5>, <u,2,1,0>
+ 2620020616U, // <1,5,u,2>: Cost 3 vext2 <0,4,1,5>, <u,2,3,3>
2620020668U, // <1,5,u,3>: Cost 3 vext2 <0,4,1,5>, <u,3,0,1>
1594054682U, // <1,5,u,4>: Cost 2 vext2 <u,4,1,5>, <u,4,1,5>
1546279066U, // <1,5,u,5>: Cost 2 vext2 <0,4,1,5>, RHS
@@ -1243,9 +1243,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2620023122U, // <1,6,0,4>: Cost 3 vext2 <0,4,1,6>, <0,4,1,5>
2620686756U, // <1,6,0,5>: Cost 3 vext2 <0,5,1,6>, <0,5,1,6>
2621350389U, // <1,6,0,6>: Cost 3 vext2 <0,6,1,6>, <0,6,1,6>
- 2972110134U, // <1,6,0,7>: Cost 3 vzipr <3,2,1,0>, RHS
+ 4028599606U, // <1,6,0,7>: Cost 4 vzipr <0,3,1,0>, RHS
2618696349U, // <1,6,0,u>: Cost 3 vext2 <0,2,1,6>, LHS
- 3642908774U, // <1,6,1,0>: Cost 4 vext1 <3,1,6,1>, LHS
+ 3692438262U, // <1,6,1,0>: Cost 4 vext2 <0,2,1,6>, <1,0,3,2>
2625995572U, // <1,6,1,1>: Cost 3 vext2 <1,4,1,6>, <1,1,1,1>
3692438422U, // <1,6,1,2>: Cost 4 vext2 <0,2,1,6>, <1,2,3,0>
3692438488U, // <1,6,1,3>: Cost 4 vext2 <0,2,1,6>, <1,3,1,3>
@@ -1258,7 +1258,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3692439097U, // <1,6,2,1>: Cost 4 vext2 <0,2,1,6>, <2,1,6,0>
3692439144U, // <1,6,2,2>: Cost 4 vext2 <0,2,1,6>, <2,2,2,2>
3692439206U, // <1,6,2,3>: Cost 4 vext2 <0,2,1,6>, <2,3,0,1>
- 3763491292U, // <1,6,2,4>: Cost 4 vext3 <0,u,1,1>, <6,2,4,0>
+ 3636948278U, // <1,6,2,4>: Cost 4 vext1 <2,1,6,2>, RHS
3787674092U, // <1,6,2,5>: Cost 4 vext3 <4,u,5,1>, <6,2,5,7>
2618697658U, // <1,6,2,6>: Cost 3 vext2 <0,2,1,6>, <2,6,3,7>
2970799414U, // <1,6,2,7>: Cost 3 vzipr <3,0,1,2>, RHS
@@ -1272,26 +1272,26 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2587103648U, // <1,6,3,6>: Cost 3 vext1 <6,1,6,3>, <6,1,6,3>
3087845306U, // <1,6,3,7>: Cost 3 vtrnr LHS, <2,6,3,7>
3087845307U, // <1,6,3,u>: Cost 3 vtrnr LHS, <2,6,3,u>
- 3636961382U, // <1,6,4,0>: Cost 4 vext1 <2,1,6,4>, LHS
+ 3693767570U, // <1,6,4,0>: Cost 4 vext2 <0,4,1,6>, <4,0,5,1>
3693767650U, // <1,6,4,1>: Cost 4 vext2 <0,4,1,6>, <4,1,5,0>
- 3763491436U, // <1,6,4,2>: Cost 4 vext3 <0,u,1,1>, <6,4,2,0>
- 3309357574U, // <1,6,4,3>: Cost 4 vrev <3,4,6,1>
+ 3636962877U, // <1,6,4,2>: Cost 4 vext1 <2,1,6,4>, <2,1,6,4>
+ 3325088134U, // <1,6,4,3>: Cost 4 vrev <6,1,3,4>
3693767898U, // <1,6,4,4>: Cost 4 vext2 <0,4,1,6>, <4,4,5,5>
2618699062U, // <1,6,4,5>: Cost 3 vext2 <0,2,1,6>, RHS
3833670966U, // <1,6,4,6>: Cost 4 vuzpl <1,3,6,7>, RHS
4028632374U, // <1,6,4,7>: Cost 4 vzipr <0,3,1,4>, RHS
2618699305U, // <1,6,4,u>: Cost 3 vext2 <0,2,1,6>, RHS
- 2575171686U, // <1,6,5,0>: Cost 3 vext1 <4,1,6,5>, LHS
- 2575172608U, // <1,6,5,1>: Cost 3 vext1 <4,1,6,5>, <1,3,5,7>
+ 3693768264U, // <1,6,5,0>: Cost 4 vext2 <0,4,1,6>, <5,0,1,2>
+ 3630998373U, // <1,6,5,1>: Cost 4 vext1 <1,1,6,5>, <1,1,6,5>
3636971070U, // <1,6,5,2>: Cost 4 vext1 <2,1,6,5>, <2,1,6,5>
3642943767U, // <1,6,5,3>: Cost 4 vext1 <3,1,6,5>, <3,1,6,5>
- 2575174640U, // <1,6,5,4>: Cost 3 vext1 <4,1,6,5>, <4,1,6,5>
+ 3693768628U, // <1,6,5,4>: Cost 4 vext2 <0,4,1,6>, <5,4,5,6>
3732918276U, // <1,6,5,5>: Cost 4 vext2 <7,0,1,6>, <5,5,5,5>
2620690530U, // <1,6,5,6>: Cost 3 vext2 <0,5,1,6>, <5,6,7,0>
2955562294U, // <1,6,5,7>: Cost 3 vzipr <0,4,1,5>, RHS
2955562295U, // <1,6,5,u>: Cost 3 vzipr <0,4,1,5>, RHS
2724180733U, // <1,6,6,0>: Cost 3 vext3 <6,6,0,1>, <6,6,0,1>
- 3692441977U, // <1,6,6,1>: Cost 4 vext2 <0,2,1,6>, <6,1,2,0>
+ 3631006566U, // <1,6,6,1>: Cost 4 vext1 <1,1,6,6>, <1,1,6,6>
3631007674U, // <1,6,6,2>: Cost 4 vext1 <1,1,6,6>, <2,6,3,7>
3692442184U, // <1,6,6,3>: Cost 4 vext2 <0,2,1,6>, <6,3,7,0>
3631009078U, // <1,6,6,4>: Cost 4 vext1 <1,1,6,6>, RHS
@@ -1322,14 +1322,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3695100067U, // <1,7,0,2>: Cost 4 vext2 <0,6,1,7>, <0,2,0,1>
3707044102U, // <1,7,0,3>: Cost 4 vext2 <2,6,1,7>, <0,3,2,1>
2726466580U, // <1,7,0,4>: Cost 3 vext3 <7,0,4,1>, <7,0,4,1>
- 3318722173U, // <1,7,0,5>: Cost 4 vrev <5,0,7,1>
+ 3654921933U, // <1,7,0,5>: Cost 4 vext1 <5,1,7,0>, <5,1,7,0>
2621358582U, // <1,7,0,6>: Cost 3 vext2 <0,6,1,7>, <0,6,1,7>
2622022215U, // <1,7,0,7>: Cost 3 vext2 <0,7,1,7>, <0,7,1,7>
2626667165U, // <1,7,0,u>: Cost 3 vext2 <1,5,1,7>, LHS
2593128550U, // <1,7,1,0>: Cost 3 vext1 <7,1,7,1>, LHS
2626667316U, // <1,7,1,1>: Cost 3 vext2 <1,5,1,7>, <1,1,1,1>
3700409238U, // <1,7,1,2>: Cost 4 vext2 <1,5,1,7>, <1,2,3,0>
- 2727056476U, // <1,7,1,3>: Cost 3 vext3 <7,1,3,1>, <7,1,3,1>
+ 2257294428U, // <1,7,1,3>: Cost 3 vrev <7,1,3,1>
2593131830U, // <1,7,1,4>: Cost 3 vext1 <7,1,7,1>, RHS
2626667646U, // <1,7,1,5>: Cost 3 vext2 <1,5,1,7>, <1,5,1,7>
2627331279U, // <1,7,1,6>: Cost 3 vext2 <1,6,1,7>, <1,6,1,7>
@@ -1355,38 +1355,38 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1507465006U, // <1,7,3,u>: Cost 2 vext1 <5,1,7,3>, LHS
2728826164U, // <1,7,4,0>: Cost 3 vext3 <7,4,0,1>, <7,4,0,1>
3654951732U, // <1,7,4,1>: Cost 4 vext1 <5,1,7,4>, <1,1,1,1>
- 3772044616U, // <1,7,4,2>: Cost 4 vext3 <2,3,0,1>, <7,4,2,3>
- 3784136016U, // <1,7,4,3>: Cost 4 vext3 <4,3,2,1>, <7,4,3,2>
+ 3330987094U, // <1,7,4,2>: Cost 4 vrev <7,1,2,4>
+ 3331060831U, // <1,7,4,3>: Cost 4 vrev <7,1,3,4>
3787674971U, // <1,7,4,4>: Cost 4 vext3 <4,u,5,1>, <7,4,4,4>
2626669878U, // <1,7,4,5>: Cost 3 vext2 <1,5,1,7>, RHS
3785979241U, // <1,7,4,6>: Cost 4 vext3 <4,6,0,1>, <7,4,6,0>
3787085176U, // <1,7,4,7>: Cost 4 vext3 <4,7,6,1>, <7,4,7,6>
2626670121U, // <1,7,4,u>: Cost 3 vext2 <1,5,1,7>, RHS
- 2587189350U, // <1,7,5,0>: Cost 3 vext1 <6,1,7,5>, LHS
- 2662502096U, // <1,7,5,1>: Cost 3 vext2 <7,5,1,7>, <5,1,7,3>
- 3660932643U, // <1,7,5,2>: Cost 4 vext1 <6,1,7,5>, <2,1,3,5>
- 2236353120U, // <1,7,5,3>: Cost 3 vrev <3,5,7,1>
- 2587192630U, // <1,7,5,4>: Cost 3 vext1 <6,1,7,5>, RHS
+ 2569273446U, // <1,7,5,0>: Cost 3 vext1 <3,1,7,5>, LHS
+ 2569274368U, // <1,7,5,1>: Cost 3 vext1 <3,1,7,5>, <1,3,5,7>
+ 3643016808U, // <1,7,5,2>: Cost 4 vext1 <3,1,7,5>, <2,2,2,2>
+ 2569275680U, // <1,7,5,3>: Cost 3 vext1 <3,1,7,5>, <3,1,7,5>
+ 2569276726U, // <1,7,5,4>: Cost 3 vext1 <3,1,7,5>, RHS
4102034790U, // <1,7,5,5>: Cost 4 vtrnl <1,3,5,7>, <7,4,5,6>
2651222067U, // <1,7,5,6>: Cost 3 vext2 <5,6,1,7>, <5,6,1,7>
3899378998U, // <1,7,5,7>: Cost 4 vuzpr <1,1,5,7>, RHS
- 2652549333U, // <1,7,5,u>: Cost 3 vext2 <5,u,1,7>, <5,u,1,7>
- 3643023462U, // <1,7,6,0>: Cost 4 vext1 <3,1,7,6>, LHS
- 3701076390U, // <1,7,6,1>: Cost 4 vext2 <1,6,1,7>, <6,1,7,0>
+ 2569279278U, // <1,7,5,u>: Cost 3 vext1 <3,1,7,5>, LHS
+ 2730153430U, // <1,7,6,0>: Cost 3 vext3 <7,6,0,1>, <7,6,0,1>
+ 2724845022U, // <1,7,6,1>: Cost 3 vext3 <6,7,0,1>, <7,6,1,0>
3643025338U, // <1,7,6,2>: Cost 4 vext1 <3,1,7,6>, <2,6,3,7>
3643025697U, // <1,7,6,3>: Cost 4 vext1 <3,1,7,6>, <3,1,7,6>
3643026742U, // <1,7,6,4>: Cost 4 vext1 <3,1,7,6>, RHS
- 2713933318U, // <1,7,6,5>: Cost 3 vext3 <4,u,5,1>, <7,6,5,4>
+ 3654971091U, // <1,7,6,5>: Cost 4 vext1 <5,1,7,6>, <5,1,7,6>
3787675153U, // <1,7,6,6>: Cost 4 vext3 <4,u,5,1>, <7,6,6,6>
2724845076U, // <1,7,6,7>: Cost 3 vext3 <6,7,0,1>, <7,6,7,0>
- 2724845089U, // <1,7,6,u>: Cost 3 vext3 <6,7,0,1>, <7,6,u,4>
+ 2725508637U, // <1,7,6,u>: Cost 3 vext3 <6,u,0,1>, <7,6,u,0>
2730817063U, // <1,7,7,0>: Cost 3 vext3 <7,7,0,1>, <7,7,0,1>
3631088436U, // <1,7,7,1>: Cost 4 vext1 <1,1,7,7>, <1,1,1,1>
3660949158U, // <1,7,7,2>: Cost 4 vext1 <6,1,7,7>, <2,3,0,1>
- 3311422210U, // <1,7,7,3>: Cost 4 vrev <3,7,7,1>
+ 3801904705U, // <1,7,7,3>: Cost 4 vext3 <7,3,0,1>, <7,7,3,0>
3631090998U, // <1,7,7,4>: Cost 4 vext1 <1,1,7,7>, RHS
2662503828U, // <1,7,7,5>: Cost 3 vext2 <7,5,1,7>, <7,5,1,7>
- 3787675233U, // <1,7,7,6>: Cost 4 vext3 <4,u,5,1>, <7,7,6,5>
+ 3660951981U, // <1,7,7,6>: Cost 4 vext1 <6,1,7,7>, <6,1,7,7>
2713933420U, // <1,7,7,7>: Cost 3 vext3 <4,u,5,1>, <7,7,7,7>
2731406959U, // <1,7,7,u>: Cost 3 vext3 <7,7,u,1>, <7,7,u,1>
1507500134U, // <1,7,u,0>: Cost 2 vext1 <5,1,7,u>, LHS
@@ -1405,7 +1405,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1546297685U, // <1,u,0,4>: Cost 2 vext2 <0,4,1,u>, <0,4,1,u>
1658771190U, // <1,u,0,5>: Cost 2 vext3 <u,0,5,1>, <u,0,5,1>
2736789248U, // <1,u,0,6>: Cost 3 vext3 <u,7,0,1>, <u,0,6,2>
- 2972110152U, // <1,u,0,7>: Cost 3 vzipr <3,2,1,0>, RHS
+ 2659189376U, // <1,u,0,7>: Cost 3 vext2 <7,0,1,u>, <0,7,u,1>
1546298013U, // <1,u,0,u>: Cost 2 vext2 <0,4,1,u>, LHS
1483112550U, // <1,u,1,0>: Cost 2 vext1 <1,1,1,1>, LHS
202162278U, // <1,u,1,1>: Cost 1 vdup1 LHS
@@ -1417,7 +1417,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2958183752U, // <1,u,1,7>: Cost 3 vzipr <0,u,1,1>, RHS
202162278U, // <1,u,1,u>: Cost 1 vdup1 LHS
2819449750U, // <1,u,2,0>: Cost 3 vuzpr LHS, <1,2,3,0>
- 2689750899U, // <1,u,2,1>: Cost 3 vext3 <0,u,1,1>, <u,2,1,0>
+ 2893207342U, // <1,u,2,1>: Cost 3 vzipl <1,2,3,0>, LHS
2819448996U, // <1,u,2,2>: Cost 3 vuzpr LHS, <0,2,0,2>
2819450482U, // <1,u,2,3>: Cost 3 vuzpr LHS, <2,2,3,3>
2819449754U, // <1,u,2,4>: Cost 3 vuzpr LHS, <1,2,3,4>
@@ -1426,22 +1426,22 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2970799432U, // <1,u,2,7>: Cost 3 vzipr <3,0,1,2>, RHS
2819449002U, // <1,u,2,u>: Cost 3 vuzpr LHS, <0,2,0,u>
403931292U, // <1,u,3,0>: Cost 1 vext1 LHS, LHS
- 1477673780U, // <1,u,3,1>: Cost 2 vext1 LHS, <1,1,1,1>
- 1477674600U, // <1,u,3,2>: Cost 2 vext1 LHS, <2,2,2,2>
+ 1477673718U, // <1,u,3,1>: Cost 2 vext1 LHS, <1,0,3,2>
+ 115726126U, // <1,u,3,2>: Cost 1 vrev LHS
2014102173U, // <1,u,3,3>: Cost 2 vtrnr LHS, LHS
403934518U, // <1,u,3,4>: Cost 1 vext1 LHS, RHS
1507536601U, // <1,u,3,5>: Cost 2 vext1 <5,1,u,3>, <5,1,u,3>
1525453306U, // <1,u,3,6>: Cost 2 vext1 LHS, <6,2,7,3>
2014105129U, // <1,u,3,7>: Cost 2 vtrnr LHS, RHS
403937070U, // <1,u,3,u>: Cost 1 vext1 LHS, LHS
- 2569338982U, // <1,u,4,0>: Cost 3 vext1 <3,1,u,4>, LHS
+ 2620042157U, // <1,u,4,0>: Cost 3 vext2 <0,4,1,u>, <4,0,u,1>
2620042237U, // <1,u,4,1>: Cost 3 vext2 <0,4,1,u>, <4,1,u,0>
- 2734135332U, // <1,u,4,2>: Cost 3 vext3 <u,3,0,1>, <u,4,2,6>
+ 2263217967U, // <1,u,4,2>: Cost 3 vrev <u,1,2,4>
2569341224U, // <1,u,4,3>: Cost 3 vext1 <3,1,u,4>, <3,1,u,4>
2569342262U, // <1,u,4,4>: Cost 3 vext1 <3,1,u,4>, RHS
1546300726U, // <1,u,4,5>: Cost 2 vext2 <0,4,1,u>, RHS
2819449180U, // <1,u,4,6>: Cost 3 vuzpr LHS, <0,4,2,6>
- 2259654012U, // <1,u,4,7>: Cost 3 vrev <7,4,u,1>
+ 2724845649U, // <1,u,4,7>: Cost 3 vext3 <6,7,0,1>, <u,4,7,6>
1546300969U, // <1,u,4,u>: Cost 2 vext2 <0,4,1,u>, RHS
2551431270U, // <1,u,5,0>: Cost 3 vext1 <0,1,u,5>, LHS
2551432192U, // <1,u,5,1>: Cost 3 vext1 <0,1,u,5>, <1,3,5,7>
@@ -1453,11 +1453,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1745710390U, // <1,u,5,7>: Cost 2 vuzpr LHS, RHS
1745710391U, // <1,u,5,u>: Cost 2 vuzpr LHS, RHS
2653221159U, // <1,u,6,0>: Cost 3 vext2 <6,0,1,u>, <6,0,1,u>
- 2557117236U, // <1,u,6,1>: Cost 3 vext1 <1,1,4,6>, <1,1,1,1>
- 2231117793U, // <1,u,6,2>: Cost 3 vrev <2,6,u,1>
+ 2725509303U, // <1,u,6,1>: Cost 3 vext3 <6,u,0,1>, <u,6,1,0>
+ 2659193338U, // <1,u,6,2>: Cost 3 vext2 <7,0,1,u>, <6,2,7,3>
2689751248U, // <1,u,6,3>: Cost 3 vext3 <0,u,1,1>, <u,6,3,7>
- 2243063187U, // <1,u,6,4>: Cost 3 vrev <4,6,u,1>
- 2713934047U, // <1,u,6,5>: Cost 3 vext3 <4,u,5,1>, <u,6,5,4>
+ 2867228774U, // <1,u,6,4>: Cost 3 vuzpr LHS, <5,6,7,4>
+ 3764820194U, // <1,u,6,5>: Cost 4 vext3 <1,1,1,1>, <u,6,5,7>
2657202957U, // <1,u,6,6>: Cost 3 vext2 <6,6,1,u>, <6,6,1,u>
2819450810U, // <1,u,6,7>: Cost 3 vuzpr LHS, <2,6,3,7>
2819450811U, // <1,u,6,u>: Cost 3 vuzpr LHS, <2,6,3,u>
@@ -1466,13 +1466,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2569365158U, // <1,u,7,2>: Cost 3 vext1 <3,1,u,7>, <2,3,0,1>
2569365803U, // <1,u,7,3>: Cost 3 vext1 <3,1,u,7>, <3,1,u,7>
2557422902U, // <1,u,7,4>: Cost 3 vext1 <1,1,u,7>, RHS
- 2249699517U, // <1,u,7,5>: Cost 3 vrev <5,7,u,1>
- 1181930390U, // <1,u,7,6>: Cost 2 vrev <6,7,u,1>
+ 2662512021U, // <1,u,7,5>: Cost 3 vext2 <7,5,1,u>, <7,5,1,u>
+ 2724845884U, // <1,u,7,6>: Cost 3 vext3 <6,7,0,1>, <u,7,6,7>
2659194476U, // <1,u,7,7>: Cost 3 vext2 <7,0,1,u>, <7,7,7,7>
1590761096U, // <1,u,7,u>: Cost 2 vext2 <7,u,1,u>, <7,u,1,u>
403972257U, // <1,u,u,0>: Cost 1 vext1 LHS, LHS
202162278U, // <1,u,u,1>: Cost 1 vdup1 LHS
- 1477715560U, // <1,u,u,2>: Cost 2 vext1 LHS, <2,2,2,2>
+ 115767091U, // <1,u,u,2>: Cost 1 vrev LHS
1745707677U, // <1,u,u,3>: Cost 2 vuzpr LHS, LHS
403975478U, // <1,u,u,4>: Cost 1 vext1 LHS, RHS
1546303642U, // <1,u,u,5>: Cost 2 vext2 <0,4,1,u>, RHS
@@ -1482,14 +1482,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2551463936U, // <2,0,0,0>: Cost 3 vext1 <0,2,0,0>, <0,0,0,0>
2685698058U, // <2,0,0,1>: Cost 3 vext3 <0,2,0,2>, <0,0,1,1>
1610776596U, // <2,0,0,2>: Cost 2 vext3 <0,0,2,2>, <0,0,2,2>
- 2232526989U, // <2,0,0,3>: Cost 3 vrev <3,0,0,2>
+ 2619384069U, // <2,0,0,3>: Cost 3 vext2 <0,3,2,0>, <0,3,2,0>
2551467318U, // <2,0,0,4>: Cost 3 vext1 <0,2,0,0>, RHS
3899836596U, // <2,0,0,5>: Cost 4 vuzpr <1,2,3,0>, <3,0,4,5>
2621374968U, // <2,0,0,6>: Cost 3 vext2 <0,6,2,0>, <0,6,2,0>
- 2256417777U, // <2,0,0,7>: Cost 3 vrev <7,0,0,2>
+ 4168271334U, // <2,0,0,7>: Cost 4 vtrnr <1,2,3,0>, <2,0,5,7>
1611219018U, // <2,0,0,u>: Cost 2 vext3 <0,0,u,2>, <0,0,u,2>
2551472138U, // <2,0,1,0>: Cost 3 vext1 <0,2,0,1>, <0,0,1,1>
- 2685108316U, // <2,0,1,1>: Cost 3 vext3 <0,1,1,2>, <0,1,1,2>
+ 2690564186U, // <2,0,1,1>: Cost 3 vext3 <1,0,3,2>, <0,1,1,0>
1611956326U, // <2,0,1,2>: Cost 2 vext3 <0,2,0,2>, LHS
2826092646U, // <2,0,1,3>: Cost 3 vuzpr <1,2,3,0>, LHS
2551475510U, // <2,0,1,4>: Cost 3 vext1 <0,2,0,1>, RHS
@@ -1498,7 +1498,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3661050874U, // <2,0,1,7>: Cost 4 vext1 <6,2,0,1>, <7,0,1,2>
1611956380U, // <2,0,1,u>: Cost 2 vext3 <0,2,0,2>, LHS
1477738598U, // <2,0,2,0>: Cost 2 vext1 <0,2,0,2>, LHS
- 2551481140U, // <2,0,2,1>: Cost 3 vext1 <0,2,0,2>, <1,1,1,1>
+ 2551481078U, // <2,0,2,1>: Cost 3 vext1 <0,2,0,2>, <1,0,3,2>
2551481796U, // <2,0,2,2>: Cost 3 vext1 <0,2,0,2>, <2,0,2,0>
2551482518U, // <2,0,2,3>: Cost 3 vext1 <0,2,0,2>, <3,0,1,2>
1477741878U, // <2,0,2,4>: Cost 2 vext1 <0,2,0,2>, RHS
@@ -1509,7 +1509,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2953625600U, // <2,0,3,0>: Cost 3 vzipr LHS, <0,0,0,0>
2953627302U, // <2,0,3,1>: Cost 3 vzipr LHS, <2,3,0,1>
2953625764U, // <2,0,3,2>: Cost 3 vzipr LHS, <0,2,0,2>
- 3625232534U, // <2,0,3,3>: Cost 4 vext1 <0,2,0,3>, <3,0,1,2>
+ 4027369695U, // <2,0,3,3>: Cost 4 vzipr LHS, <3,1,0,3>
3625233718U, // <2,0,3,4>: Cost 4 vext1 <0,2,0,3>, RHS
3899836110U, // <2,0,3,5>: Cost 4 vuzpr <1,2,3,0>, <2,3,4,5>
4032012618U, // <2,0,3,6>: Cost 4 vzipr LHS, <0,4,0,6>
@@ -1525,32 +1525,32 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3799990664U, // <2,0,4,7>: Cost 4 vext3 <7,0,1,2>, <0,4,7,5>
2685698450U, // <2,0,4,u>: Cost 3 vext3 <0,2,0,2>, <0,4,u,6>
3625246822U, // <2,0,5,0>: Cost 4 vext1 <0,2,0,5>, LHS
- 3297641584U, // <2,0,5,1>: Cost 4 vrev <1,5,0,2>
- 2702361006U, // <2,0,5,2>: Cost 3 vext3 <3,0,1,2>, <0,5,2,7>
- 3643164978U, // <2,0,5,3>: Cost 4 vext1 <3,2,0,5>, <3,2,0,5>
- 3625250102U, // <2,0,5,4>: Cost 4 vext1 <0,2,0,5>, RHS
- 3719008260U, // <2,0,5,5>: Cost 4 vext2 <4,6,2,0>, <5,5,5,5>
- 3719008354U, // <2,0,5,6>: Cost 4 vext2 <4,6,2,0>, <5,6,7,0>
+ 3289776304U, // <2,0,5,1>: Cost 4 vrev <0,2,1,5>
+ 2690564526U, // <2,0,5,2>: Cost 3 vext3 <1,0,3,2>, <0,5,2,7>
+ 3289923778U, // <2,0,5,3>: Cost 4 vrev <0,2,3,5>
+ 2216255691U, // <2,0,5,4>: Cost 3 vrev <0,2,4,5>
+ 3726307332U, // <2,0,5,5>: Cost 4 vext2 <5,u,2,0>, <5,5,5,5>
+ 3726307426U, // <2,0,5,6>: Cost 4 vext2 <5,u,2,0>, <5,6,7,0>
2826095926U, // <2,0,5,7>: Cost 3 vuzpr <1,2,3,0>, RHS
- 2826095927U, // <2,0,5,u>: Cost 3 vuzpr <1,2,3,0>, RHS
+ 2216550639U, // <2,0,5,u>: Cost 3 vrev <0,2,u,5>
4162420736U, // <2,0,6,0>: Cost 4 vtrnr <0,2,4,6>, <0,0,0,0>
2901885030U, // <2,0,6,1>: Cost 3 vzipl <2,6,3,7>, LHS
2685698559U, // <2,0,6,2>: Cost 3 vext3 <0,2,0,2>, <0,6,2,7>
- 3310250611U, // <2,0,6,3>: Cost 4 vrev <3,6,0,2>
- 2242481484U, // <2,0,6,4>: Cost 3 vrev <4,6,0,2>
- 3322196005U, // <2,0,6,5>: Cost 4 vrev <5,6,0,2>
- 3719009080U, // <2,0,6,6>: Cost 4 vext2 <4,6,2,0>, <6,6,6,6>
- 2621379406U, // <2,0,6,7>: Cost 3 vext2 <0,6,2,0>, <6,7,0,1>
- 2901885597U, // <2,0,6,u>: Cost 3 vzipl <2,6,3,7>, LHS
+ 3643173171U, // <2,0,6,3>: Cost 4 vext1 <3,2,0,6>, <3,2,0,6>
+ 2216263884U, // <2,0,6,4>: Cost 3 vrev <0,2,4,6>
+ 3730289341U, // <2,0,6,5>: Cost 4 vext2 <6,5,2,0>, <6,5,2,0>
+ 3726308152U, // <2,0,6,6>: Cost 4 vext2 <5,u,2,0>, <6,6,6,6>
+ 3899836346U, // <2,0,6,7>: Cost 4 vuzpr <1,2,3,0>, <2,6,3,7>
+ 2216558832U, // <2,0,6,u>: Cost 3 vrev <0,2,u,6>
2659202049U, // <2,0,7,0>: Cost 3 vext2 <7,0,2,0>, <7,0,2,0>
- 2726249024U, // <2,0,7,1>: Cost 3 vext3 <7,0,1,2>, <0,7,1,0>
+ 3726308437U, // <2,0,7,1>: Cost 4 vext2 <5,u,2,0>, <7,1,2,3>
2726249034U, // <2,0,7,2>: Cost 3 vext3 <7,0,1,2>, <0,7,2,1>
- 3310914244U, // <2,0,7,3>: Cost 4 vrev <3,7,0,2>
- 3719009638U, // <2,0,7,4>: Cost 4 vext2 <4,6,2,0>, <7,4,5,6>
- 3322859638U, // <2,0,7,5>: Cost 4 vrev <5,7,0,2>
- 2255090511U, // <2,0,7,6>: Cost 3 vrev <6,7,0,2>
- 3719009900U, // <2,0,7,7>: Cost 4 vext2 <4,6,2,0>, <7,7,7,7>
- 2267035905U, // <2,0,7,u>: Cost 3 vrev <u,7,0,2>
+ 3734934772U, // <2,0,7,3>: Cost 4 vext2 <7,3,2,0>, <7,3,2,0>
+ 3726308710U, // <2,0,7,4>: Cost 4 vext2 <5,u,2,0>, <7,4,5,6>
+ 3726308814U, // <2,0,7,5>: Cost 4 vext2 <5,u,2,0>, <7,5,u,2>
+ 3736925671U, // <2,0,7,6>: Cost 4 vext2 <7,6,2,0>, <7,6,2,0>
+ 3726308972U, // <2,0,7,7>: Cost 4 vext2 <5,u,2,0>, <7,7,7,7>
+ 2659202049U, // <2,0,7,u>: Cost 3 vext2 <7,0,2,0>, <7,0,2,0>
1477787750U, // <2,0,u,0>: Cost 2 vext1 <0,2,0,u>, LHS
2953668262U, // <2,0,u,1>: Cost 3 vzipr LHS, <2,3,0,1>
1611956893U, // <2,0,u,2>: Cost 2 vext3 <0,2,0,2>, LHS
@@ -1560,22 +1560,22 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2765412506U, // <2,0,u,6>: Cost 3 vuzpl <2,3,0,1>, RHS
2826096169U, // <2,0,u,7>: Cost 3 vuzpr <1,2,3,0>, RHS
1611956947U, // <2,0,u,u>: Cost 2 vext3 <0,2,0,2>, LHS
- 1495711846U, // <2,1,0,0>: Cost 2 vext1 <3,2,1,0>, LHS
+ 2569453670U, // <2,1,0,0>: Cost 3 vext1 <3,2,1,0>, LHS
2619392102U, // <2,1,0,1>: Cost 3 vext2 <0,3,2,1>, LHS
- 2226628029U, // <2,1,0,2>: Cost 3 vrev <2,0,1,2>
- 1158858902U, // <2,1,0,3>: Cost 2 vrev <3,0,1,2>
- 1495715126U, // <2,1,0,4>: Cost 2 vext1 <3,2,1,0>, RHS
- 2244546120U, // <2,1,0,5>: Cost 3 vrev <5,0,1,2>
- 2250518817U, // <2,1,0,6>: Cost 3 vrev <6,0,1,2>
- 1182749690U, // <2,1,0,7>: Cost 2 vrev <7,0,1,2>
- 1495717678U, // <2,1,0,u>: Cost 2 vext1 <3,2,1,0>, LHS
+ 3759440619U, // <2,1,0,2>: Cost 4 vext3 <0,2,0,2>, <1,0,2,0>
+ 1616823030U, // <2,1,0,3>: Cost 2 vext3 <1,0,3,2>, <1,0,3,2>
+ 2569456950U, // <2,1,0,4>: Cost 3 vext1 <3,2,1,0>, RHS
+ 2690712328U, // <2,1,0,5>: Cost 3 vext3 <1,0,5,2>, <1,0,5,2>
+ 3661115841U, // <2,1,0,6>: Cost 4 vext1 <6,2,1,0>, <6,2,1,0>
+ 2622046794U, // <2,1,0,7>: Cost 3 vext2 <0,7,2,1>, <0,7,2,1>
+ 1617191715U, // <2,1,0,u>: Cost 2 vext3 <1,0,u,2>, <1,0,u,2>
2551545958U, // <2,1,1,0>: Cost 3 vext1 <0,2,1,1>, LHS
2685698868U, // <2,1,1,1>: Cost 3 vext3 <0,2,0,2>, <1,1,1,1>
- 2643280794U, // <2,1,1,2>: Cost 3 vext2 <4,3,2,1>, <1,2,3,4>
+ 2628682646U, // <2,1,1,2>: Cost 3 vext2 <1,u,2,1>, <1,2,3,0>
2685698888U, // <2,1,1,3>: Cost 3 vext3 <0,2,0,2>, <1,1,3,3>
2551549238U, // <2,1,1,4>: Cost 3 vext1 <0,2,1,1>, RHS
3693134992U, // <2,1,1,5>: Cost 4 vext2 <0,3,2,1>, <1,5,3,7>
- 3711050950U, // <2,1,1,6>: Cost 4 vext2 <3,3,2,1>, <1,6,0,7>
+ 3661124034U, // <2,1,1,6>: Cost 4 vext1 <6,2,1,1>, <6,2,1,1>
3625292794U, // <2,1,1,7>: Cost 4 vext1 <0,2,1,1>, <7,0,1,2>
2685698933U, // <2,1,1,u>: Cost 3 vext3 <0,2,0,2>, <1,1,u,3>
2551554150U, // <2,1,2,0>: Cost 3 vext1 <0,2,1,2>, LHS
@@ -1587,7 +1587,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3693135802U, // <2,1,2,6>: Cost 4 vext2 <0,3,2,1>, <2,6,3,7>
2726249402U, // <2,1,2,7>: Cost 3 vext3 <7,0,1,2>, <1,2,7,0>
2685699011U, // <2,1,2,u>: Cost 3 vext3 <0,2,0,2>, <1,2,u,0>
- 2953627958U, // <2,1,3,0>: Cost 3 vzipr LHS, <3,2,1,0>
+ 2551562342U, // <2,1,3,0>: Cost 3 vext1 <0,2,1,3>, LHS
2953625610U, // <2,1,3,1>: Cost 3 vzipr LHS, <0,0,1,1>
2953627798U, // <2,1,3,2>: Cost 3 vzipr LHS, <3,0,1,2>
2953626584U, // <2,1,3,3>: Cost 3 vzipr LHS, <1,3,1,3>
@@ -1596,80 +1596,80 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2587398596U, // <2,1,3,6>: Cost 3 vext1 <6,2,1,3>, <6,2,1,3>
4032013519U, // <2,1,3,7>: Cost 4 vzipr LHS, <1,6,1,7>
2953625617U, // <2,1,3,u>: Cost 3 vzipr LHS, <0,0,1,u>
- 3625312358U, // <2,1,4,0>: Cost 4 vext1 <0,2,1,4>, LHS
+ 2690565154U, // <2,1,4,0>: Cost 3 vext3 <1,0,3,2>, <1,4,0,5>
3625313270U, // <2,1,4,1>: Cost 4 vext1 <0,2,1,4>, <1,3,4,6>
3771532340U, // <2,1,4,2>: Cost 4 vext3 <2,2,2,2>, <1,4,2,5>
- 3094560870U, // <2,1,4,3>: Cost 3 vtrnr <1,2,3,4>, LHS
+ 1148404634U, // <2,1,4,3>: Cost 2 vrev <1,2,3,4>
3625315638U, // <2,1,4,4>: Cost 4 vext1 <0,2,1,4>, RHS
2619395382U, // <2,1,4,5>: Cost 3 vext2 <0,3,2,1>, RHS
3837242678U, // <2,1,4,6>: Cost 4 vuzpl <2,0,1,2>, RHS
3799991394U, // <2,1,4,7>: Cost 4 vext3 <7,0,1,2>, <1,4,7,6>
- 2619395625U, // <2,1,4,u>: Cost 3 vext2 <0,3,2,1>, RHS
+ 1148773319U, // <2,1,4,u>: Cost 2 vrev <1,2,u,4>
2551578726U, // <2,1,5,0>: Cost 3 vext1 <0,2,1,5>, LHS
2551579648U, // <2,1,5,1>: Cost 3 vext1 <0,2,1,5>, <1,3,5,7>
- 3625322032U, // <2,1,5,2>: Cost 4 vext1 <0,2,1,5>, <2,1,5,0>
+ 3625321952U, // <2,1,5,2>: Cost 4 vext1 <0,2,1,5>, <2,0,5,1>
2685699216U, // <2,1,5,3>: Cost 3 vext3 <0,2,0,2>, <1,5,3,7>
2551582006U, // <2,1,5,4>: Cost 3 vext1 <0,2,1,5>, RHS
- 3625324192U, // <2,1,5,5>: Cost 4 vext1 <0,2,1,5>, <5,1,2,0>
- 3720343650U, // <2,1,5,6>: Cost 4 vext2 <4,u,2,1>, <5,6,7,0>
+ 3740913668U, // <2,1,5,5>: Cost 4 vext2 <u,3,2,1>, <5,5,5,5>
+ 3661156806U, // <2,1,5,6>: Cost 4 vext1 <6,2,1,5>, <6,2,1,5>
3893652790U, // <2,1,5,7>: Cost 4 vuzpr <0,2,0,1>, RHS
2685699261U, // <2,1,5,u>: Cost 3 vext3 <0,2,0,2>, <1,5,u,7>
2551586918U, // <2,1,6,0>: Cost 3 vext1 <0,2,1,6>, LHS
- 3625329460U, // <2,1,6,1>: Cost 4 vext1 <0,2,1,6>, <1,1,1,1>
+ 3625329398U, // <2,1,6,1>: Cost 4 vext1 <0,2,1,6>, <1,0,3,2>
2551588794U, // <2,1,6,2>: Cost 3 vext1 <0,2,1,6>, <2,6,3,7>
3088679014U, // <2,1,6,3>: Cost 3 vtrnr <0,2,4,6>, LHS
2551590198U, // <2,1,6,4>: Cost 3 vext1 <0,2,1,6>, RHS
4029382994U, // <2,1,6,5>: Cost 4 vzipr <0,4,2,6>, <0,4,1,5>
- 3625333113U, // <2,1,6,6>: Cost 4 vext1 <0,2,1,6>, <6,1,2,0>
- 3720344398U, // <2,1,6,7>: Cost 4 vext2 <4,u,2,1>, <6,7,0,1>
+ 3625333560U, // <2,1,6,6>: Cost 4 vext1 <0,2,1,6>, <6,6,6,6>
+ 3731624800U, // <2,1,6,7>: Cost 4 vext2 <6,7,2,1>, <6,7,2,1>
2551592750U, // <2,1,6,u>: Cost 3 vext1 <0,2,1,6>, LHS
2622051322U, // <2,1,7,0>: Cost 3 vext2 <0,7,2,1>, <7,0,1,2>
3733615699U, // <2,1,7,1>: Cost 4 vext2 <7,1,2,1>, <7,1,2,1>
3795125538U, // <2,1,7,2>: Cost 4 vext3 <6,1,7,2>, <1,7,2,0>
- 2661201141U, // <2,1,7,3>: Cost 3 vext2 <7,3,2,1>, <7,3,2,1>
- 3316960678U, // <2,1,7,4>: Cost 4 vrev <4,7,1,2>
- 3322933375U, // <2,1,7,5>: Cost 4 vrev <5,7,1,2>
- 2255164248U, // <2,1,7,6>: Cost 3 vrev <6,7,1,2>
- 3720345196U, // <2,1,7,7>: Cost 4 vext2 <4,u,2,1>, <7,7,7,7>
- 2664519306U, // <2,1,7,u>: Cost 3 vext2 <7,u,2,1>, <7,u,2,1>
- 1525637222U, // <2,1,u,0>: Cost 2 vext1 <u,2,1,u>, LHS
+ 2222171037U, // <2,1,7,3>: Cost 3 vrev <1,2,3,7>
+ 3740915046U, // <2,1,7,4>: Cost 4 vext2 <u,3,2,1>, <7,4,5,6>
+ 3296060335U, // <2,1,7,5>: Cost 4 vrev <1,2,5,7>
+ 3736933864U, // <2,1,7,6>: Cost 4 vext2 <7,6,2,1>, <7,6,2,1>
+ 3805300055U, // <2,1,7,7>: Cost 4 vext3 <7,u,1,2>, <1,7,7,u>
+ 2669827714U, // <2,1,7,u>: Cost 3 vext2 <u,7,2,1>, <7,u,1,2>
+ 2551603302U, // <2,1,u,0>: Cost 3 vext1 <0,2,1,u>, LHS
2953666570U, // <2,1,u,1>: Cost 3 vzipr LHS, <0,0,1,1>
2953668758U, // <2,1,u,2>: Cost 3 vzipr LHS, <3,0,1,2>
- 1164167966U, // <2,1,u,3>: Cost 2 vrev <3,u,1,2>
- 1525640502U, // <2,1,u,4>: Cost 2 vext1 <u,2,1,u>, RHS
+ 1148437406U, // <2,1,u,3>: Cost 2 vrev <1,2,3,u>
+ 2551606582U, // <2,1,u,4>: Cost 3 vext1 <0,2,1,u>, RHS
2953666898U, // <2,1,u,5>: Cost 3 vzipr LHS, <0,4,1,5>
- 2587439561U, // <2,1,u,6>: Cost 3 vext1 <6,2,1,u>, <6,2,1,u>
- 1188058754U, // <2,1,u,7>: Cost 2 vrev <7,u,1,2>
- 1525643131U, // <2,1,u,u>: Cost 2 vext1 <u,2,1,u>, <u,2,1,u>
+ 2587398596U, // <2,1,u,6>: Cost 3 vext1 <6,2,1,3>, <6,2,1,3>
+ 2669828370U, // <2,1,u,7>: Cost 3 vext2 <u,7,2,1>, <u,7,2,1>
+ 1148806091U, // <2,1,u,u>: Cost 2 vrev <1,2,u,u>
1543667732U, // <2,2,0,0>: Cost 2 vext2 <0,0,2,2>, <0,0,2,2>
1548976230U, // <2,2,0,1>: Cost 2 vext2 <0,u,2,2>, LHS
2685699524U, // <2,2,0,2>: Cost 3 vext3 <0,2,0,2>, <2,0,2,0>
2685699535U, // <2,2,0,3>: Cost 3 vext3 <0,2,0,2>, <2,0,3,2>
2551614774U, // <2,2,0,4>: Cost 3 vext1 <0,2,2,0>, RHS
- 3771532774U, // <2,2,0,5>: Cost 4 vext3 <2,2,2,2>, <2,0,5,7>
+ 3704422830U, // <2,2,0,5>: Cost 4 vext2 <2,2,2,2>, <0,5,2,7>
3893657642U, // <2,2,0,6>: Cost 4 vuzpr <0,2,0,2>, <0,0,4,6>
3770574323U, // <2,2,0,7>: Cost 4 vext3 <2,0,7,2>, <2,0,7,2>
1548976796U, // <2,2,0,u>: Cost 2 vext2 <0,u,2,2>, <0,u,2,2>
- 2702362118U, // <2,2,1,0>: Cost 3 vext3 <3,0,1,2>, <2,1,0,3>
+ 2622718710U, // <2,2,1,0>: Cost 3 vext2 <0,u,2,2>, <1,0,3,2>
2622718772U, // <2,2,1,1>: Cost 3 vext2 <0,u,2,2>, <1,1,1,1>
2622718870U, // <2,2,1,2>: Cost 3 vext2 <0,u,2,2>, <1,2,3,0>
2819915878U, // <2,2,1,3>: Cost 3 vuzpr <0,2,0,2>, LHS
3625364790U, // <2,2,1,4>: Cost 4 vext1 <0,2,2,1>, RHS
2622719120U, // <2,2,1,5>: Cost 3 vext2 <0,u,2,2>, <1,5,3,7>
3760031292U, // <2,2,1,6>: Cost 4 vext3 <0,2,u,2>, <2,1,6,3>
- 3798664776U, // <2,2,1,7>: Cost 4 vext3 <6,7,1,2>, <2,1,7,6>
+ 3667170468U, // <2,2,1,7>: Cost 4 vext1 <7,2,2,1>, <7,2,2,1>
2819915883U, // <2,2,1,u>: Cost 3 vuzpr <0,2,0,2>, LHS
1489829990U, // <2,2,2,0>: Cost 2 vext1 <2,2,2,2>, LHS
- 2563572532U, // <2,2,2,1>: Cost 3 vext1 <2,2,2,2>, <1,1,1,1>
+ 2563572470U, // <2,2,2,1>: Cost 3 vext1 <2,2,2,2>, <1,0,3,2>
269271142U, // <2,2,2,2>: Cost 1 vdup2 LHS
2685699698U, // <2,2,2,3>: Cost 3 vext3 <0,2,0,2>, <2,2,3,3>
1489833270U, // <2,2,2,4>: Cost 2 vext1 <2,2,2,2>, RHS
2685699720U, // <2,2,2,5>: Cost 3 vext3 <0,2,0,2>, <2,2,5,7>
2622719930U, // <2,2,2,6>: Cost 3 vext2 <0,u,2,2>, <2,6,3,7>
- 2257892517U, // <2,2,2,7>: Cost 3 vrev <7,2,2,2>
+ 2593436837U, // <2,2,2,7>: Cost 3 vext1 <7,2,2,2>, <7,2,2,2>
269271142U, // <2,2,2,u>: Cost 1 vdup2 LHS
2685699750U, // <2,2,3,0>: Cost 3 vext3 <0,2,0,2>, <2,3,0,1>
- 2698380976U, // <2,2,3,1>: Cost 3 vext3 <2,3,1,2>, <2,3,1,2>
+ 2690565806U, // <2,2,3,1>: Cost 3 vext3 <1,0,3,2>, <2,3,1,0>
2953627240U, // <2,2,3,2>: Cost 3 vzipr LHS, <2,2,2,2>
1879883878U, // <2,2,3,3>: Cost 2 vzipr LHS, LHS
2685699790U, // <2,2,3,4>: Cost 3 vext3 <0,2,0,2>, <2,3,4,5>
@@ -1678,7 +1678,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2593445030U, // <2,2,3,7>: Cost 3 vext1 <7,2,2,3>, <7,2,2,3>
1879883883U, // <2,2,3,u>: Cost 2 vzipr LHS, LHS
2551644262U, // <2,2,4,0>: Cost 3 vext1 <0,2,2,4>, LHS
- 3625386804U, // <2,2,4,1>: Cost 4 vext1 <0,2,2,4>, <1,1,1,1>
+ 3625386742U, // <2,2,4,1>: Cost 4 vext1 <0,2,2,4>, <1,0,3,2>
2551645902U, // <2,2,4,2>: Cost 3 vext1 <0,2,2,4>, <2,3,4,5>
3759441686U, // <2,2,4,3>: Cost 4 vext3 <0,2,0,2>, <2,4,3,5>
2551647542U, // <2,2,4,4>: Cost 3 vext1 <0,2,2,4>, RHS
@@ -1690,7 +1690,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2617413328U, // <2,2,5,1>: Cost 3 vext2 <0,0,2,2>, <5,1,7,3>
2685699936U, // <2,2,5,2>: Cost 3 vext3 <0,2,0,2>, <2,5,2,7>
4027383910U, // <2,2,5,3>: Cost 4 vzipr <0,1,2,5>, LHS
- 3696463796U, // <2,2,5,4>: Cost 4 vext2 <0,u,2,2>, <5,4,5,6>
+ 2228201085U, // <2,2,5,4>: Cost 3 vrev <2,2,4,5>
2617413636U, // <2,2,5,5>: Cost 3 vext2 <0,0,2,2>, <5,5,5,5>
2617413730U, // <2,2,5,6>: Cost 3 vext2 <0,0,2,2>, <5,6,7,0>
2819919158U, // <2,2,5,7>: Cost 3 vuzpr <0,2,0,2>, RHS
@@ -1709,8 +1709,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2660545701U, // <2,2,7,2>: Cost 3 vext2 <7,2,2,2>, <7,2,2,2>
4030718054U, // <2,2,7,3>: Cost 4 vzipr <0,6,2,7>, LHS
2617415014U, // <2,2,7,4>: Cost 3 vext2 <0,0,2,2>, <7,4,5,6>
- 3704427936U, // <2,2,7,5>: Cost 4 vext2 <2,2,2,2>, <7,5,3,1>
- 2255237985U, // <2,2,7,6>: Cost 3 vrev <6,7,2,2>
+ 3302033032U, // <2,2,7,5>: Cost 4 vrev <2,2,5,7>
+ 3661246929U, // <2,2,7,6>: Cost 4 vext1 <6,2,2,7>, <6,2,2,7>
2617415276U, // <2,2,7,7>: Cost 3 vext2 <0,0,2,2>, <7,7,7,7>
2731558962U, // <2,2,7,u>: Cost 3 vext3 <7,u,1,2>, <2,7,u,1>
1489829990U, // <2,2,u,0>: Cost 2 vext1 <2,2,2,2>, LHS
@@ -1731,7 +1731,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2622726655U, // <2,3,0,6>: Cost 3 vext2 LHS, <0,6,2,7>
2593494188U, // <2,3,0,7>: Cost 3 vext1 <7,2,3,0>, <7,2,3,0>
470598301U, // <2,3,0,u>: Cost 1 vext2 LHS, LHS
- 2551693414U, // <2,3,1,0>: Cost 3 vext1 <0,2,3,1>, LHS
+ 1544340214U, // <2,3,1,0>: Cost 2 vext2 LHS, <1,0,3,2>
1544340276U, // <2,3,1,1>: Cost 2 vext2 LHS, <1,1,1,1>
1544340374U, // <2,3,1,2>: Cost 2 vext2 LHS, <1,2,3,0>
1548985304U, // <2,3,1,3>: Cost 2 vext2 LHS, <1,3,1,3>
@@ -1741,7 +1741,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2665858347U, // <2,3,1,7>: Cost 3 vext2 LHS, <1,7,3,0>
1548985709U, // <2,3,1,u>: Cost 2 vext2 LHS, <1,u,1,3>
2622727613U, // <2,3,2,0>: Cost 3 vext2 LHS, <2,0,1,2>
- 2685700406U, // <2,3,2,1>: Cost 3 vext3 <0,2,0,2>, <3,2,1,0>
+ 2622727711U, // <2,3,2,1>: Cost 3 vext2 LHS, <2,1,3,1>
1544341096U, // <2,3,2,2>: Cost 2 vext2 LHS, <2,2,2,2>
1544341158U, // <2,3,2,3>: Cost 2 vext2 LHS, <2,3,0,1>
2622727958U, // <2,3,2,4>: Cost 3 vext2 LHS, <2,4,3,5>
@@ -1750,14 +1750,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2665859050U, // <2,3,2,7>: Cost 3 vext2 LHS, <2,7,0,1>
1548986427U, // <2,3,2,u>: Cost 2 vext2 LHS, <2,u,0,1>
1548986518U, // <2,3,3,0>: Cost 2 vext2 LHS, <3,0,1,2>
- 2622728422U, // <2,3,3,1>: Cost 3 vext2 LHS, <3,1,1,1>
- 1544341814U, // <2,3,3,2>: Cost 2 vext2 LHS, <3,2,1,0>
+ 2622728415U, // <2,3,3,1>: Cost 3 vext2 LHS, <3,1,0,3>
+ 1489913458U, // <2,3,3,2>: Cost 2 vext1 <2,2,3,3>, <2,2,3,3>
1544341916U, // <2,3,3,3>: Cost 2 vext2 LHS, <3,3,3,3>
1548986882U, // <2,3,3,4>: Cost 2 vext2 LHS, <3,4,5,6>
2665859632U, // <2,3,3,5>: Cost 3 vext2 LHS, <3,5,1,7>
- 2665859704U, // <2,3,3,6>: Cost 3 vext2 LHS, <3,6,0,7>
+ 2234304870U, // <2,3,3,6>: Cost 3 vrev <3,2,6,3>
2958271632U, // <2,3,3,7>: Cost 3 vzipr LHS, <1,5,3,7>
- 1548987164U, // <2,3,3,u>: Cost 2 vext2 LHS, <3,u,1,0>
+ 1548987166U, // <2,3,3,u>: Cost 2 vext2 LHS, <3,u,1,2>
1483948134U, // <2,3,4,0>: Cost 2 vext1 <1,2,3,4>, LHS
1483948954U, // <2,3,4,1>: Cost 2 vext1 <1,2,3,4>, <1,2,3,4>
2622729276U, // <2,3,4,2>: Cost 3 vext2 LHS, <4,2,6,0>
@@ -1771,7 +1771,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1592118992U, // <2,3,5,1>: Cost 2 vext2 LHS, <5,1,7,3>
2665860862U, // <2,3,5,2>: Cost 3 vext2 LHS, <5,2,3,4>
2551728642U, // <2,3,5,3>: Cost 3 vext1 <0,2,3,5>, <3,4,5,6>
- 2551729462U, // <2,3,5,4>: Cost 3 vext1 <0,2,3,5>, RHS
+ 1592119238U, // <2,3,5,4>: Cost 2 vext2 LHS, <5,4,7,6>
1592119300U, // <2,3,5,5>: Cost 2 vext2 LHS, <5,5,5,5>
1592119394U, // <2,3,5,6>: Cost 2 vext2 LHS, <5,6,7,0>
1592119464U, // <2,3,5,7>: Cost 2 vext2 LHS, <5,7,5,7>
@@ -1780,7 +1780,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2557707164U, // <2,3,6,1>: Cost 3 vext1 <1,2,3,6>, <1,2,3,6>
1592119802U, // <2,3,6,2>: Cost 2 vext2 LHS, <6,2,7,3>
2665861682U, // <2,3,6,3>: Cost 3 vext2 LHS, <6,3,4,5>
- 2622730860U, // <2,3,6,4>: Cost 3 vext2 LHS, <6,4,2,0>
+ 2622730893U, // <2,3,6,4>: Cost 3 vext2 LHS, <6,4,5,6>
2665861810U, // <2,3,6,5>: Cost 3 vext2 LHS, <6,5,0,7>
1592120120U, // <2,3,6,6>: Cost 2 vext2 LHS, <6,6,6,6>
1592120142U, // <2,3,6,7>: Cost 2 vext2 LHS, <6,7,0,1>
@@ -1791,35 +1791,35 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2665862371U, // <2,3,7,3>: Cost 3 vext2 LHS, <7,3,0,1>
1592120678U, // <2,3,7,4>: Cost 2 vext2 LHS, <7,4,5,6>
2665862534U, // <2,3,7,5>: Cost 3 vext2 LHS, <7,5,0,2>
- 1592120838U, // <2,3,7,6>: Cost 2 vext2 LHS, <7,6,5,4>
+ 2665862614U, // <2,3,7,6>: Cost 3 vext2 LHS, <7,6,0,1>
1592120940U, // <2,3,7,7>: Cost 2 vext2 LHS, <7,7,7,7>
1592120962U, // <2,3,7,u>: Cost 2 vext2 LHS, <7,u,1,2>
1548990163U, // <2,3,u,0>: Cost 2 vext2 LHS, <u,0,1,2>
470603566U, // <2,3,u,1>: Cost 1 vext2 LHS, LHS
- 1548990323U, // <2,3,u,2>: Cost 2 vext2 LHS, <u,2,1,0>
+ 1548990341U, // <2,3,u,2>: Cost 2 vext2 LHS, <u,2,3,0>
1548990396U, // <2,3,u,3>: Cost 2 vext2 LHS, <u,3,0,1>
1548990527U, // <2,3,u,4>: Cost 2 vext2 LHS, <u,4,5,6>
470603930U, // <2,3,u,5>: Cost 1 vext2 LHS, RHS
1548990672U, // <2,3,u,6>: Cost 2 vext2 LHS, <u,6,3,7>
1592121600U, // <2,3,u,7>: Cost 2 vext2 LHS, <u,7,0,1>
470604133U, // <2,3,u,u>: Cost 1 vext2 LHS, LHS
- 2587590758U, // <2,4,0,0>: Cost 3 vext1 <6,2,4,0>, LHS
+ 2617425942U, // <2,4,0,0>: Cost 3 vext2 <0,0,2,4>, <0,0,2,4>
2618753126U, // <2,4,0,1>: Cost 3 vext2 <0,2,2,4>, LHS
2618753208U, // <2,4,0,2>: Cost 3 vext2 <0,2,2,4>, <0,2,2,4>
- 2232821937U, // <2,4,0,3>: Cost 3 vrev <3,0,4,2>
- 2587594038U, // <2,4,0,4>: Cost 3 vext1 <6,2,4,0>, RHS
+ 2619416841U, // <2,4,0,3>: Cost 3 vext2 <0,3,2,4>, <0,3,2,4>
+ 2587593628U, // <2,4,0,4>: Cost 3 vext1 <6,2,4,0>, <4,0,6,2>
2712832914U, // <2,4,0,5>: Cost 3 vext3 <4,6,u,2>, <4,0,5,1>
1634962332U, // <2,4,0,6>: Cost 2 vext3 <4,0,6,2>, <4,0,6,2>
- 2256712725U, // <2,4,0,7>: Cost 3 vrev <7,0,4,2>
+ 3799993252U, // <2,4,0,7>: Cost 4 vext3 <7,0,1,2>, <4,0,7,1>
1634962332U, // <2,4,0,u>: Cost 2 vext3 <4,0,6,2>, <4,0,6,2>
- 3697140463U, // <2,4,1,0>: Cost 4 vext2 <1,0,2,4>, <1,0,2,4>
+ 2619417334U, // <2,4,1,0>: Cost 3 vext2 <0,3,2,4>, <1,0,3,2>
3692495668U, // <2,4,1,1>: Cost 4 vext2 <0,2,2,4>, <1,1,1,1>
2625389466U, // <2,4,1,2>: Cost 3 vext2 <1,3,2,4>, <1,2,3,4>
2826125414U, // <2,4,1,3>: Cost 3 vuzpr <1,2,3,4>, LHS
3699794995U, // <2,4,1,4>: Cost 4 vext2 <1,4,2,4>, <1,4,2,4>
3692496016U, // <2,4,1,5>: Cost 4 vext2 <0,2,2,4>, <1,5,3,7>
3763424238U, // <2,4,1,6>: Cost 4 vext3 <0,u,0,2>, <4,1,6,3>
- 3331118182U, // <2,4,1,7>: Cost 4 vrev <7,1,4,2>
+ 3667317942U, // <2,4,1,7>: Cost 4 vext1 <7,2,4,1>, <7,2,4,1>
2826125419U, // <2,4,1,u>: Cost 3 vuzpr <1,2,3,4>, LHS
2629371336U, // <2,4,2,0>: Cost 3 vext2 <2,0,2,4>, <2,0,2,4>
3699131946U, // <2,4,2,1>: Cost 4 vext2 <1,3,2,4>, <2,1,4,3>
@@ -1832,7 +1832,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2899119657U, // <2,4,2,u>: Cost 3 vzipl <2,2,2,2>, RHS
2635344033U, // <2,4,3,0>: Cost 3 vext2 <3,0,2,4>, <3,0,2,4>
4032012325U, // <2,4,3,1>: Cost 4 vzipr LHS, <0,0,4,1>
- 3692497206U, // <2,4,3,2>: Cost 4 vext2 <0,2,2,4>, <3,2,1,0>
+ 3692497228U, // <2,4,3,2>: Cost 4 vext2 <0,2,2,4>, <3,2,3,4>
3692497308U, // <2,4,3,3>: Cost 4 vext2 <0,2,2,4>, <3,3,3,3>
3001404624U, // <2,4,3,4>: Cost 3 vzipr LHS, <4,4,4,4>
2953627342U, // <2,4,3,5>: Cost 3 vzipr LHS, <2,3,4,5>
@@ -1841,7 +1841,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2953625806U, // <2,4,3,u>: Cost 3 vzipr LHS, <0,2,4,u>
2710916266U, // <2,4,4,0>: Cost 3 vext3 <4,4,0,2>, <4,4,0,2>
3899869648U, // <2,4,4,1>: Cost 4 vuzpr <1,2,3,4>, <3,4,0,1>
- 3692497944U, // <2,4,4,2>: Cost 4 vext2 <0,2,2,4>, <4,2,2,0>
+ 3899869658U, // <2,4,4,2>: Cost 4 vuzpr <1,2,3,4>, <3,4,1,2>
3899868930U, // <2,4,4,3>: Cost 4 vuzpr <1,2,3,4>, <2,4,1,3>
2712833232U, // <2,4,4,4>: Cost 3 vext3 <4,6,u,2>, <4,4,4,4>
2618756406U, // <2,4,4,5>: Cost 3 vext2 <0,2,2,4>, RHS
@@ -1849,21 +1849,21 @@ static const unsigned PerfectShuffleTable[6561+1] = {
4168304426U, // <2,4,4,7>: Cost 4 vtrnr <1,2,3,4>, <2,4,5,7>
2618756649U, // <2,4,4,u>: Cost 3 vext2 <0,2,2,4>, RHS
2551800011U, // <2,4,5,0>: Cost 3 vext1 <0,2,4,5>, <0,2,4,5>
- 2557772708U, // <2,4,5,1>: Cost 3 vext1 <1,2,4,5>, <1,2,4,5>
+ 2569716470U, // <2,4,5,1>: Cost 3 vext1 <3,2,4,5>, <1,0,3,2>
2563745405U, // <2,4,5,2>: Cost 3 vext1 <2,2,4,5>, <2,2,4,5>
- 2557773974U, // <2,4,5,3>: Cost 3 vext1 <1,2,4,5>, <3,0,1,2>
+ 2569718102U, // <2,4,5,3>: Cost 3 vext1 <3,2,4,5>, <3,2,4,5>
2551803190U, // <2,4,5,4>: Cost 3 vext1 <0,2,4,5>, RHS
- 3625545619U, // <2,4,5,5>: Cost 4 vext1 <0,2,4,5>, <5,4,2,0>
+ 3625545732U, // <2,4,5,5>: Cost 4 vext1 <0,2,4,5>, <5,5,5,5>
1611959606U, // <2,4,5,6>: Cost 2 vext3 <0,2,0,2>, RHS
2826128694U, // <2,4,5,7>: Cost 3 vuzpr <1,2,3,4>, RHS
1611959624U, // <2,4,5,u>: Cost 2 vext3 <0,2,0,2>, RHS
1478066278U, // <2,4,6,0>: Cost 2 vext1 <0,2,4,6>, LHS
- 2551808820U, // <2,4,6,1>: Cost 3 vext1 <0,2,4,6>, <1,1,1,1>
- 2551809640U, // <2,4,6,2>: Cost 3 vext1 <0,2,4,6>, <2,2,2,2>
+ 2551808758U, // <2,4,6,1>: Cost 3 vext1 <0,2,4,6>, <1,0,3,2>
+ 2551809516U, // <2,4,6,2>: Cost 3 vext1 <0,2,4,6>, <2,0,6,4>
2551810198U, // <2,4,6,3>: Cost 3 vext1 <0,2,4,6>, <3,0,1,2>
1478069558U, // <2,4,6,4>: Cost 2 vext1 <0,2,4,6>, RHS
2901888310U, // <2,4,6,5>: Cost 3 vzipl <2,6,3,7>, RHS
- 2551812716U, // <2,4,6,6>: Cost 3 vext1 <0,2,4,6>, <6,4,2,0>
+ 2551812920U, // <2,4,6,6>: Cost 3 vext1 <0,2,4,6>, <6,6,6,6>
2726251914U, // <2,4,6,7>: Cost 3 vext3 <7,0,1,2>, <4,6,7,1>
1478072110U, // <2,4,6,u>: Cost 2 vext1 <0,2,4,6>, LHS
2659234821U, // <2,4,7,0>: Cost 3 vext2 <7,0,2,4>, <7,0,2,4>
@@ -1874,7 +1874,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2726251976U, // <2,4,7,5>: Cost 3 vext3 <7,0,1,2>, <4,7,5,0>
2726251986U, // <2,4,7,6>: Cost 3 vext3 <7,0,1,2>, <4,7,6,1>
3727005292U, // <2,4,7,7>: Cost 4 vext2 <6,0,2,4>, <7,7,7,7>
- 2726252003U, // <2,4,7,u>: Cost 3 vext3 <7,0,1,2>, <4,7,u,0>
+ 2659234821U, // <2,4,7,u>: Cost 3 vext2 <7,0,2,4>, <7,0,2,4>
1478082662U, // <2,4,u,0>: Cost 2 vext1 <0,2,4,u>, LHS
2618758958U, // <2,4,u,1>: Cost 3 vext2 <0,2,2,4>, LHS
2551826024U, // <2,4,u,2>: Cost 3 vext1 <0,2,4,u>, <2,2,2,2>
@@ -1893,17 +1893,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3693830655U, // <2,5,0,6>: Cost 4 vext2 <0,4,2,5>, <0,6,2,7>
3094531382U, // <2,5,0,7>: Cost 3 vtrnr <1,2,3,0>, RHS
2618098333U, // <2,5,0,u>: Cost 3 vext2 <0,1,2,5>, LHS
- 3631554662U, // <2,5,1,0>: Cost 4 vext1 <1,2,5,1>, LHS
+ 3691840246U, // <2,5,1,0>: Cost 4 vext2 <0,1,2,5>, <1,0,3,2>
3691840308U, // <2,5,1,1>: Cost 4 vext2 <0,1,2,5>, <1,1,1,1>
2626061206U, // <2,5,1,2>: Cost 3 vext2 <1,4,2,5>, <1,2,3,0>
2618098688U, // <2,5,1,3>: Cost 3 vext2 <0,1,2,5>, <1,3,5,7>
2626061364U, // <2,5,1,4>: Cost 3 vext2 <1,4,2,5>, <1,4,2,5>
3691840656U, // <2,5,1,5>: Cost 4 vext2 <0,1,2,5>, <1,5,3,7>
- 3711747270U, // <2,5,1,6>: Cost 4 vext2 <3,4,2,5>, <1,6,0,7>
+ 3789082310U, // <2,5,1,6>: Cost 4 vext3 <5,1,6,2>, <5,1,6,2>
2712833744U, // <2,5,1,7>: Cost 3 vext3 <4,6,u,2>, <5,1,7,3>
2628715896U, // <2,5,1,u>: Cost 3 vext2 <1,u,2,5>, <1,u,2,5>
3693831613U, // <2,5,2,0>: Cost 4 vext2 <0,4,2,5>, <2,0,1,2>
- 3711747587U, // <2,5,2,1>: Cost 4 vext2 <3,4,2,5>, <2,1,0,0>
+ 4026698642U, // <2,5,2,1>: Cost 4 vzipr <0,0,2,2>, <4,0,5,1>
2632033896U, // <2,5,2,2>: Cost 3 vext2 <2,4,2,5>, <2,2,2,2>
3691841190U, // <2,5,2,3>: Cost 4 vext2 <0,1,2,5>, <2,3,0,1>
2632034061U, // <2,5,2,4>: Cost 3 vext2 <2,4,2,5>, <2,4,2,5>
@@ -1913,26 +1913,26 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3088354615U, // <2,5,2,u>: Cost 3 vtrnr <0,2,0,2>, RHS
2557829222U, // <2,5,3,0>: Cost 3 vext1 <1,2,5,3>, LHS
2557830059U, // <2,5,3,1>: Cost 3 vext1 <1,2,5,3>, <1,2,5,3>
- 2638006582U, // <2,5,3,2>: Cost 3 vext2 <3,4,2,5>, <3,2,1,0>
+ 2575746766U, // <2,5,3,2>: Cost 3 vext1 <4,2,5,3>, <2,3,4,5>
3691841948U, // <2,5,3,3>: Cost 4 vext2 <0,1,2,5>, <3,3,3,3>
2619427330U, // <2,5,3,4>: Cost 3 vext2 <0,3,2,5>, <3,4,5,6>
2581720847U, // <2,5,3,5>: Cost 3 vext1 <5,2,5,3>, <5,2,5,3>
2953628162U, // <2,5,3,6>: Cost 3 vzipr LHS, <3,4,5,6>
2953626624U, // <2,5,3,7>: Cost 3 vzipr LHS, <1,3,5,7>
2953626625U, // <2,5,3,u>: Cost 3 vzipr LHS, <1,3,5,u>
- 3631579238U, // <2,5,4,0>: Cost 4 vext1 <1,2,5,4>, LHS
+ 2569781350U, // <2,5,4,0>: Cost 3 vext1 <3,2,5,4>, LHS
3631580076U, // <2,5,4,1>: Cost 4 vext1 <1,2,5,4>, <1,2,5,4>
- 3693833267U, // <2,5,4,2>: Cost 4 vext2 <0,4,2,5>, <4,2,5,0>
- 2235550206U, // <2,5,4,3>: Cost 3 vrev <3,4,5,2>
- 3631582518U, // <2,5,4,4>: Cost 4 vext1 <1,2,5,4>, RHS
+ 2569782990U, // <2,5,4,2>: Cost 3 vext1 <3,2,5,4>, <2,3,4,5>
+ 2569783646U, // <2,5,4,3>: Cost 3 vext1 <3,2,5,4>, <3,2,5,4>
+ 2569784630U, // <2,5,4,4>: Cost 3 vext1 <3,2,5,4>, RHS
2618101046U, // <2,5,4,5>: Cost 3 vext2 <0,1,2,5>, RHS
3893905922U, // <2,5,4,6>: Cost 4 vuzpr <0,2,3,5>, <3,4,5,6>
3094564150U, // <2,5,4,7>: Cost 3 vtrnr <1,2,3,4>, RHS
2618101289U, // <2,5,4,u>: Cost 3 vext2 <0,1,2,5>, RHS
2551873638U, // <2,5,5,0>: Cost 3 vext1 <0,2,5,5>, LHS
3637560320U, // <2,5,5,1>: Cost 4 vext1 <2,2,5,5>, <1,3,5,7>
- 3691843304U, // <2,5,5,2>: Cost 4 vext2 <0,1,2,5>, <5,2,1,0>
- 3309955663U, // <2,5,5,3>: Cost 4 vrev <3,5,5,2>
+ 3637560966U, // <2,5,5,2>: Cost 4 vext1 <2,2,5,5>, <2,2,5,5>
+ 3723030343U, // <2,5,5,3>: Cost 4 vext2 <5,3,2,5>, <5,3,2,5>
2551876918U, // <2,5,5,4>: Cost 3 vext1 <0,2,5,5>, RHS
2712834052U, // <2,5,5,5>: Cost 3 vext3 <4,6,u,2>, <5,5,5,5>
4028713474U, // <2,5,5,6>: Cost 4 vzipr <0,3,2,5>, <3,4,5,6>
@@ -1948,18 +1948,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3088682294U, // <2,5,6,7>: Cost 3 vtrnr <0,2,4,6>, RHS
3088682295U, // <2,5,6,u>: Cost 3 vtrnr <0,2,4,6>, RHS
2563833958U, // <2,5,7,0>: Cost 3 vext1 <2,2,5,7>, LHS
- 3769766016U, // <2,5,7,1>: Cost 4 vext3 <1,u,5,2>, <5,7,1,3>
+ 2551890678U, // <2,5,7,1>: Cost 3 vext1 <0,2,5,7>, <1,0,3,2>
2563835528U, // <2,5,7,2>: Cost 3 vext1 <2,2,5,7>, <2,2,5,7>
- 2551892118U, // <2,5,7,3>: Cost 3 vext1 <0,2,5,7>, <3,0,1,2>
+ 3637577878U, // <2,5,7,3>: Cost 4 vext1 <2,2,5,7>, <3,0,1,2>
2563837238U, // <2,5,7,4>: Cost 3 vext1 <2,2,5,7>, RHS
2712834216U, // <2,5,7,5>: Cost 3 vext3 <4,6,u,2>, <5,7,5,7>
2712834220U, // <2,5,7,6>: Cost 3 vext3 <4,6,u,2>, <5,7,6,2>
- 3637581208U, // <2,5,7,7>: Cost 4 vext1 <2,2,5,7>, <7,5,2,2>
+ 4174449974U, // <2,5,7,7>: Cost 4 vtrnr <2,2,5,7>, RHS
2563839790U, // <2,5,7,u>: Cost 3 vext1 <2,2,5,7>, LHS
2563842150U, // <2,5,u,0>: Cost 3 vext1 <2,2,5,u>, LHS
2618103598U, // <2,5,u,1>: Cost 3 vext2 <0,1,2,5>, LHS
2563843721U, // <2,5,u,2>: Cost 3 vext1 <2,2,5,u>, <2,2,5,u>
- 2238204738U, // <2,5,u,3>: Cost 3 vrev <3,u,5,2>
+ 2569816418U, // <2,5,u,3>: Cost 3 vext1 <3,2,5,u>, <3,2,5,u>
2622748735U, // <2,5,u,4>: Cost 3 vext2 <0,u,2,5>, <u,4,5,6>
2618103962U, // <2,5,u,5>: Cost 3 vext2 <0,1,2,5>, RHS
2953669122U, // <2,5,u,6>: Cost 3 vzipr LHS, <3,4,5,6>
@@ -1974,7 +1974,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2551911246U, // <2,6,0,6>: Cost 3 vext1 <0,2,6,0>, <6,7,0,1>
2720723287U, // <2,6,0,7>: Cost 3 vext3 <6,0,7,2>, <6,0,7,2>
1546355357U, // <2,6,0,u>: Cost 2 vext2 <0,4,2,6>, LHS
- 3693839092U, // <2,6,1,0>: Cost 4 vext2 <0,4,2,6>, <1,0,3,0>
+ 2620097270U, // <2,6,1,0>: Cost 3 vext2 <0,4,2,6>, <1,0,3,2>
2620097332U, // <2,6,1,1>: Cost 3 vext2 <0,4,2,6>, <1,1,1,1>
2620097430U, // <2,6,1,2>: Cost 3 vext2 <0,4,2,6>, <1,2,3,0>
2820243558U, // <2,6,1,3>: Cost 3 vuzpr <0,2,4,6>, LHS
@@ -1994,14 +1994,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2620098619U, // <2,6,2,u>: Cost 3 vext2 <0,4,2,6>, <2,u,0,1>
2620098710U, // <2,6,3,0>: Cost 3 vext2 <0,4,2,6>, <3,0,1,2>
3893986982U, // <2,6,3,1>: Cost 4 vuzpr <0,2,4,6>, <2,3,0,1>
- 2620098870U, // <2,6,3,2>: Cost 3 vext2 <0,4,2,6>, <3,2,1,0>
+ 2569848762U, // <2,6,3,2>: Cost 3 vext1 <3,2,6,3>, <2,6,3,7>
2620098972U, // <2,6,3,3>: Cost 3 vext2 <0,4,2,6>, <3,3,3,3>
2620099074U, // <2,6,3,4>: Cost 3 vext2 <0,4,2,6>, <3,4,5,6>
3893987022U, // <2,6,3,5>: Cost 4 vuzpr <0,2,4,6>, <2,3,4,5>
3001404644U, // <2,6,3,6>: Cost 3 vzipr LHS, <4,4,6,6>
1879887158U, // <2,6,3,7>: Cost 2 vzipr LHS, RHS
1879887159U, // <2,6,3,u>: Cost 2 vzipr LHS, RHS
- 2575827046U, // <2,6,4,0>: Cost 3 vext1 <4,2,6,4>, LHS
+ 2620099484U, // <2,6,4,0>: Cost 3 vext2 <0,4,2,6>, <4,0,6,2>
2620099566U, // <2,6,4,1>: Cost 3 vext2 <0,4,2,6>, <4,1,6,3>
2620099644U, // <2,6,4,2>: Cost 3 vext2 <0,4,2,6>, <4,2,6,0>
3643599207U, // <2,6,4,3>: Cost 4 vext1 <3,2,6,4>, <3,2,6,4>
@@ -2014,14 +2014,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2667876048U, // <2,6,5,1>: Cost 3 vext2 <u,4,2,6>, <5,1,7,3>
2712834756U, // <2,6,5,2>: Cost 3 vext3 <4,6,u,2>, <6,5,2,7>
3643607400U, // <2,6,5,3>: Cost 4 vext1 <3,2,6,5>, <3,2,6,5>
- 3693842356U, // <2,6,5,4>: Cost 4 vext2 <0,4,2,6>, <5,4,5,6>
+ 2252091873U, // <2,6,5,4>: Cost 3 vrev <6,2,4,5>
2667876356U, // <2,6,5,5>: Cost 3 vext2 <u,4,2,6>, <5,5,5,5>
2667876450U, // <2,6,5,6>: Cost 3 vext2 <u,4,2,6>, <5,6,7,0>
2820246838U, // <2,6,5,7>: Cost 3 vuzpr <0,2,4,6>, RHS
2820246839U, // <2,6,5,u>: Cost 3 vuzpr <0,2,4,6>, RHS
2563899494U, // <2,6,6,0>: Cost 3 vext1 <2,2,6,6>, LHS
3893988683U, // <2,6,6,1>: Cost 4 vuzpr <0,2,4,6>, <4,6,0,1>
- 2620101084U, // <2,6,6,2>: Cost 3 vext2 <0,4,2,6>, <6,2,4,0>
+ 2563901072U, // <2,6,6,2>: Cost 3 vext1 <2,2,6,6>, <2,2,6,6>
3893987236U, // <2,6,6,3>: Cost 4 vuzpr <0,2,4,6>, <2,6,1,3>
2563902774U, // <2,6,6,4>: Cost 3 vext1 <2,2,6,6>, RHS
3893988723U, // <2,6,6,5>: Cost 4 vuzpr <0,2,4,6>, <4,6,4,5>
@@ -2031,15 +2031,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712834894U, // <2,6,7,0>: Cost 3 vext3 <4,6,u,2>, <6,7,0,1>
2724926296U, // <2,6,7,1>: Cost 3 vext3 <6,7,1,2>, <6,7,1,2>
2725000033U, // <2,6,7,2>: Cost 3 vext3 <6,7,2,2>, <6,7,2,2>
- 2725073770U, // <2,6,7,3>: Cost 3 vext3 <6,7,3,2>, <6,7,3,2>
+ 2702365544U, // <2,6,7,3>: Cost 3 vext3 <3,0,1,2>, <6,7,3,0>
2712834934U, // <2,6,7,4>: Cost 3 vext3 <4,6,u,2>, <6,7,4,5>
3776107393U, // <2,6,7,5>: Cost 4 vext3 <3,0,1,2>, <6,7,5,7>
- 2255532933U, // <2,6,7,6>: Cost 3 vrev <6,7,6,2>
+ 2725294981U, // <2,6,7,6>: Cost 3 vext3 <6,7,6,2>, <6,7,6,2>
2726253452U, // <2,6,7,7>: Cost 3 vext3 <7,0,1,2>, <6,7,7,0>
2712834966U, // <2,6,7,u>: Cost 3 vext3 <4,6,u,2>, <6,7,u,1>
2620102355U, // <2,6,u,0>: Cost 3 vext2 <0,4,2,6>, <u,0,1,2>
1546360622U, // <2,6,u,1>: Cost 2 vext2 <0,4,2,6>, LHS
- 2620102515U, // <2,6,u,2>: Cost 3 vext2 <0,4,2,6>, <u,2,1,0>
+ 2620102536U, // <2,6,u,2>: Cost 3 vext2 <0,4,2,6>, <u,2,3,3>
2820244125U, // <2,6,u,3>: Cost 3 vuzpr <0,2,4,6>, LHS
1594136612U, // <2,6,u,4>: Cost 2 vext2 <u,4,2,6>, <u,4,2,6>
1546360986U, // <2,6,u,5>: Cost 2 vext2 <0,4,2,6>, RHS
@@ -2049,24 +2049,24 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2726179825U, // <2,7,0,0>: Cost 3 vext3 <7,0,0,2>, <7,0,0,2>
1652511738U, // <2,7,0,1>: Cost 2 vext3 <7,0,1,2>, <7,0,1,2>
2621431972U, // <2,7,0,2>: Cost 3 vext2 <0,6,2,7>, <0,2,0,2>
- 3693183244U, // <2,7,0,3>: Cost 4 vext2 <0,3,2,7>, <0,3,2,7>
+ 2257949868U, // <2,7,0,3>: Cost 3 vrev <7,2,3,0>
2726474773U, // <2,7,0,4>: Cost 3 vext3 <7,0,4,2>, <7,0,4,2>
2620768686U, // <2,7,0,5>: Cost 3 vext2 <0,5,2,7>, <0,5,2,7>
2621432319U, // <2,7,0,6>: Cost 3 vext2 <0,6,2,7>, <0,6,2,7>
2599760953U, // <2,7,0,7>: Cost 3 vext1 <u,2,7,0>, <7,0,u,2>
1653027897U, // <2,7,0,u>: Cost 2 vext3 <7,0,u,2>, <7,0,u,2>
- 2726843458U, // <2,7,1,0>: Cost 3 vext3 <7,1,0,2>, <7,1,0,2>
+ 2639348470U, // <2,7,1,0>: Cost 3 vext2 <3,6,2,7>, <1,0,3,2>
3695174452U, // <2,7,1,1>: Cost 4 vext2 <0,6,2,7>, <1,1,1,1>
3695174550U, // <2,7,1,2>: Cost 4 vext2 <0,6,2,7>, <1,2,3,0>
3694511104U, // <2,7,1,3>: Cost 4 vext2 <0,5,2,7>, <1,3,5,7>
- 2599767350U, // <2,7,1,4>: Cost 3 vext1 <u,2,7,1>, RHS
+ 3713090594U, // <2,7,1,4>: Cost 4 vext2 <3,6,2,7>, <1,4,0,5>
3693184144U, // <2,7,1,5>: Cost 4 vext2 <0,3,2,7>, <1,5,3,7>
2627405016U, // <2,7,1,6>: Cost 3 vext2 <1,6,2,7>, <1,6,2,7>
- 2599769082U, // <2,7,1,7>: Cost 3 vext1 <u,2,7,1>, <7,0,1,2>
- 2599769902U, // <2,7,1,u>: Cost 3 vext1 <u,2,7,1>, LHS
+ 3799995519U, // <2,7,1,7>: Cost 4 vext3 <7,0,1,2>, <7,1,7,0>
+ 2639348470U, // <2,7,1,u>: Cost 3 vext2 <3,6,2,7>, <1,0,3,2>
3695175101U, // <2,7,2,0>: Cost 4 vext2 <0,6,2,7>, <2,0,1,2>
3643655168U, // <2,7,2,1>: Cost 4 vext1 <3,2,7,2>, <1,3,5,7>
- 2727654565U, // <2,7,2,2>: Cost 3 vext3 <7,2,2,2>, <7,2,2,2>
+ 2257892517U, // <2,7,2,2>: Cost 3 vrev <7,2,2,2>
3695175334U, // <2,7,2,3>: Cost 4 vext2 <0,6,2,7>, <2,3,0,1>
3695175465U, // <2,7,2,4>: Cost 4 vext2 <0,6,2,7>, <2,4,5,6>
2632714080U, // <2,7,2,5>: Cost 3 vext2 <2,5,2,7>, <2,5,2,7>
@@ -2085,7 +2085,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2708706617U, // <2,7,4,0>: Cost 3 vext3 <4,0,6,2>, <7,4,0,6>
3649643418U, // <2,7,4,1>: Cost 4 vext1 <4,2,7,4>, <1,2,3,4>
3649644330U, // <2,7,4,2>: Cost 4 vext1 <4,2,7,4>, <2,4,5,7>
- 3802797392U, // <2,7,4,3>: Cost 4 vext3 <7,4,3,2>, <7,4,3,2>
+ 2257982640U, // <2,7,4,3>: Cost 3 vrev <7,2,3,4>
3649645641U, // <2,7,4,4>: Cost 4 vext1 <4,2,7,4>, <4,2,7,4>
2621435190U, // <2,7,4,5>: Cost 3 vext2 <0,6,2,7>, RHS
2712835441U, // <2,7,4,6>: Cost 3 vext3 <4,6,u,2>, <7,4,6,u>
@@ -2093,8 +2093,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2621435433U, // <2,7,4,u>: Cost 3 vext2 <0,6,2,7>, RHS
2729497990U, // <2,7,5,0>: Cost 3 vext3 <7,5,0,2>, <7,5,0,2>
3643679744U, // <2,7,5,1>: Cost 4 vext1 <3,2,7,5>, <1,3,5,7>
- 3706457886U, // <2,7,5,2>: Cost 4 vext2 <2,5,2,7>, <5,2,7,0>
- 3769767328U, // <2,7,5,3>: Cost 4 vext3 <1,u,5,2>, <7,5,3,1>
+ 3637708424U, // <2,7,5,2>: Cost 4 vext1 <2,2,7,5>, <2,2,5,7>
+ 3643681137U, // <2,7,5,3>: Cost 4 vext1 <3,2,7,5>, <3,2,7,5>
2599800118U, // <2,7,5,4>: Cost 3 vext1 <u,2,7,5>, RHS
3786577334U, // <2,7,5,5>: Cost 4 vext3 <4,6,u,2>, <7,5,5,5>
3786577345U, // <2,7,5,6>: Cost 4 vext3 <4,6,u,2>, <7,5,6,7>
@@ -2103,18 +2103,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2581889126U, // <2,7,6,0>: Cost 3 vext1 <5,2,7,6>, LHS
3643687936U, // <2,7,6,1>: Cost 4 vext1 <3,2,7,6>, <1,3,5,7>
2663240186U, // <2,7,6,2>: Cost 3 vext2 <7,6,2,7>, <6,2,7,3>
- 3975632154U, // <2,7,6,3>: Cost 4 vzipl <2,6,3,7>, <7,3,6,2>
+ 3643689330U, // <2,7,6,3>: Cost 4 vext1 <3,2,7,6>, <3,2,7,6>
2581892406U, // <2,7,6,4>: Cost 3 vext1 <5,2,7,6>, RHS
- 2712835590U, // <2,7,6,5>: Cost 3 vext3 <4,6,u,2>, <7,6,5,4>
+ 2581892900U, // <2,7,6,5>: Cost 3 vext1 <5,2,7,6>, <5,2,7,6>
2587865597U, // <2,7,6,6>: Cost 3 vext1 <6,2,7,6>, <6,2,7,6>
3786577428U, // <2,7,6,7>: Cost 4 vext3 <4,6,u,2>, <7,6,7,0>
2581894958U, // <2,7,6,u>: Cost 3 vext1 <5,2,7,6>, LHS
2726254119U, // <2,7,7,0>: Cost 3 vext3 <7,0,1,2>, <7,7,0,1>
3804640817U, // <2,7,7,1>: Cost 4 vext3 <7,7,1,2>, <7,7,1,2>
- 3695178951U, // <2,7,7,2>: Cost 4 vext2 <0,6,2,7>, <7,2,6,0>
+ 3637724826U, // <2,7,7,2>: Cost 4 vext1 <2,2,7,7>, <2,2,7,7>
3734992123U, // <2,7,7,3>: Cost 4 vext2 <7,3,2,7>, <7,3,2,7>
2552040758U, // <2,7,7,4>: Cost 3 vext1 <0,2,7,7>, RHS
- 3323375797U, // <2,7,7,5>: Cost 4 vrev <5,7,7,2>
+ 3799995992U, // <2,7,7,5>: Cost 4 vext3 <7,0,1,2>, <7,7,5,5>
2663241198U, // <2,7,7,6>: Cost 3 vext2 <7,6,2,7>, <7,6,2,7>
2712835692U, // <2,7,7,7>: Cost 3 vext3 <4,6,u,2>, <7,7,7,7>
2731562607U, // <2,7,7,u>: Cost 3 vext3 <7,u,1,2>, <7,7,u,1>
@@ -2130,13 +2130,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1544380416U, // <2,u,0,0>: Cost 2 vext2 LHS, <0,0,0,0>
470638699U, // <2,u,0,1>: Cost 1 vext2 LHS, LHS
1544380580U, // <2,u,0,2>: Cost 2 vext2 LHS, <0,2,0,2>
- 1159375061U, // <2,u,0,3>: Cost 2 vrev <3,0,u,2>
+ 1658631909U, // <2,u,0,3>: Cost 2 vext3 <u,0,3,2>, <u,0,3,2>
1544380754U, // <2,u,0,4>: Cost 2 vext2 LHS, <0,4,1,5>
- 2245062279U, // <2,u,0,5>: Cost 3 vrev <5,0,u,2>
+ 2665898414U, // <2,u,0,5>: Cost 3 vext2 LHS, <0,5,2,7>
1658853120U, // <2,u,0,6>: Cost 2 vext3 <u,0,6,2>, <u,0,6,2>
- 1183265849U, // <2,u,0,7>: Cost 2 vrev <7,0,u,2>
+ 3094531625U, // <2,u,0,7>: Cost 3 vtrnr <1,2,3,0>, RHS
470639261U, // <2,u,0,u>: Cost 1 vext2 LHS, LHS
- 2618122996U, // <2,u,1,0>: Cost 3 vext2 LHS, <1,0,3,0>
+ 1544381174U, // <2,u,1,0>: Cost 2 vext2 LHS, <1,0,3,2>
1544381236U, // <2,u,1,1>: Cost 2 vext2 LHS, <1,1,1,1>
1544381334U, // <2,u,1,2>: Cost 2 vext2 LHS, <1,2,3,0>
1544381400U, // <2,u,1,3>: Cost 2 vext2 LHS, <1,3,1,3>
@@ -2146,7 +2146,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2726254427U, // <2,u,1,7>: Cost 3 vext3 <7,0,1,2>, <u,1,7,3>
1544381823U, // <2,u,1,u>: Cost 2 vext2 LHS, <1,u,3,3>
1478328422U, // <2,u,2,0>: Cost 2 vext1 <0,2,u,2>, LHS
- 2618123806U, // <2,u,2,1>: Cost 3 vext2 LHS, <2,1,3,0>
+ 2618123807U, // <2,u,2,1>: Cost 3 vext2 LHS, <2,1,3,1>
269271142U, // <2,u,2,2>: Cost 1 vdup2 LHS
1544382118U, // <2,u,2,3>: Cost 2 vext2 LHS, <2,3,0,1>
1478331702U, // <2,u,2,4>: Cost 2 vext1 <0,2,u,2>, RHS
@@ -2156,7 +2156,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
269271142U, // <2,u,2,u>: Cost 1 vdup2 LHS
1544382614U, // <2,u,3,0>: Cost 2 vext2 LHS, <3,0,1,2>
2953627374U, // <2,u,3,1>: Cost 3 vzipr LHS, <2,3,u,1>
- 1544382774U, // <2,u,3,2>: Cost 2 vext2 LHS, <3,2,1,0>
+ 1490282143U, // <2,u,3,2>: Cost 2 vext1 <2,2,u,3>, <2,2,u,3>
1879883932U, // <2,u,3,3>: Cost 2 vzipr LHS, LHS
1544382978U, // <2,u,3,4>: Cost 2 vext2 LHS, <3,4,5,6>
2953627378U, // <2,u,3,5>: Cost 3 vzipr LHS, <2,3,u,5>
@@ -2166,7 +2166,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1484316774U, // <2,u,4,0>: Cost 2 vext1 <1,2,u,4>, LHS
1484317639U, // <2,u,4,1>: Cost 2 vext1 <1,2,u,4>, <1,2,u,4>
2552088270U, // <2,u,4,2>: Cost 3 vext1 <0,2,u,4>, <2,3,4,5>
- 3094561437U, // <2,u,4,3>: Cost 3 vtrnr <1,2,3,4>, LHS
+ 1190213513U, // <2,u,4,3>: Cost 2 vrev <u,2,3,4>
1484320054U, // <2,u,4,4>: Cost 2 vext1 <1,2,u,4>, RHS
470641974U, // <2,u,4,5>: Cost 1 vext2 LHS, RHS
1592159604U, // <2,u,4,6>: Cost 2 vext2 LHS, <4,6,4,6>
@@ -2176,13 +2176,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1592159952U, // <2,u,5,1>: Cost 2 vext2 LHS, <5,1,7,3>
2564040353U, // <2,u,5,2>: Cost 3 vext1 <2,2,u,5>, <2,2,u,5>
2690275455U, // <2,u,5,3>: Cost 3 vext3 <0,u,u,2>, <u,5,3,7>
- 2552098102U, // <2,u,5,4>: Cost 3 vext1 <0,2,u,5>, RHS
+ 1592160198U, // <2,u,5,4>: Cost 2 vext2 LHS, <5,4,7,6>
1592160260U, // <2,u,5,5>: Cost 2 vext2 LHS, <5,5,5,5>
1611962522U, // <2,u,5,6>: Cost 2 vext3 <0,2,0,2>, RHS
1592160424U, // <2,u,5,7>: Cost 2 vext2 LHS, <5,7,5,7>
1611962540U, // <2,u,5,u>: Cost 2 vext3 <0,2,0,2>, RHS
1478361190U, // <2,u,6,0>: Cost 2 vext1 <0,2,u,6>, LHS
- 2552103732U, // <2,u,6,1>: Cost 3 vext1 <0,2,u,6>, <1,1,1,1>
+ 2552103670U, // <2,u,6,1>: Cost 3 vext1 <0,2,u,6>, <1,0,3,2>
1592160762U, // <2,u,6,2>: Cost 2 vext2 LHS, <6,2,7,3>
2685704400U, // <2,u,6,3>: Cost 3 vext3 <0,2,0,2>, <u,6,3,7>
1478364470U, // <2,u,6,4>: Cost 2 vext1 <0,2,u,6>, RHS
@@ -2193,10 +2193,10 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1592161274U, // <2,u,7,0>: Cost 2 vext2 LHS, <7,0,1,2>
2659931226U, // <2,u,7,1>: Cost 3 vext2 <7,1,2,u>, <7,1,2,u>
2564056739U, // <2,u,7,2>: Cost 3 vext1 <2,2,u,7>, <2,2,u,7>
- 2661258492U, // <2,u,7,3>: Cost 3 vext2 <7,3,2,u>, <7,3,2,u>
+ 2665903331U, // <2,u,7,3>: Cost 3 vext2 LHS, <7,3,0,1>
1592161638U, // <2,u,7,4>: Cost 2 vext2 LHS, <7,4,5,6>
2665903494U, // <2,u,7,5>: Cost 3 vext2 LHS, <7,5,0,2>
- 1592161798U, // <2,u,7,6>: Cost 2 vext2 LHS, <7,6,5,4>
+ 2587947527U, // <2,u,7,6>: Cost 3 vext1 <6,2,u,7>, <6,2,u,7>
1592161900U, // <2,u,7,7>: Cost 2 vext2 LHS, <7,7,7,7>
1592161922U, // <2,u,7,u>: Cost 2 vext2 LHS, <7,u,1,2>
1478377574U, // <2,u,u,0>: Cost 2 vext1 <0,2,u,u>, LHS
@@ -2211,14 +2211,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1611448320U, // <3,0,0,0>: Cost 2 vext3 LHS, <0,0,0,0>
1611890698U, // <3,0,0,1>: Cost 2 vext3 LHS, <0,0,1,1>
1611890708U, // <3,0,0,2>: Cost 2 vext3 LHS, <0,0,2,2>
- 2624766214U, // <3,0,0,3>: Cost 3 vext2 <1,2,3,0>, <0,3,2,1>
+ 3763576860U, // <3,0,0,3>: Cost 4 vext3 LHS, <0,0,3,1>
2689835045U, // <3,0,0,4>: Cost 3 vext3 LHS, <0,0,4,1>
- 3731685806U, // <3,0,0,5>: Cost 4 vext2 <6,7,3,0>, <0,5,2,7>
+ 3698508206U, // <3,0,0,5>: Cost 4 vext2 <1,2,3,0>, <0,5,2,7>
3763576887U, // <3,0,0,6>: Cost 4 vext3 LHS, <0,0,6,1>
3667678434U, // <3,0,0,7>: Cost 4 vext1 <7,3,0,0>, <7,3,0,0>
1616093258U, // <3,0,0,u>: Cost 2 vext3 LHS, <0,0,u,2>
1490337894U, // <3,0,1,0>: Cost 2 vext1 <2,3,0,1>, LHS
- 2685632603U, // <3,0,1,1>: Cost 3 vext3 LHS, <0,1,1,1>
+ 2685632602U, // <3,0,1,1>: Cost 3 vext3 LHS, <0,1,1,0>
537706598U, // <3,0,1,2>: Cost 1 vext3 LHS, LHS
2624766936U, // <3,0,1,3>: Cost 3 vext2 <1,2,3,0>, <1,3,1,3>
1490341174U, // <3,0,1,4>: Cost 2 vext1 <2,3,0,1>, RHS
@@ -2240,7 +2240,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2685632774U, // <3,0,3,2>: Cost 3 vext3 LHS, <0,3,2,1>
2624768412U, // <3,0,3,3>: Cost 3 vext2 <1,2,3,0>, <3,3,3,3>
2624768514U, // <3,0,3,4>: Cost 3 vext2 <1,2,3,0>, <3,4,5,6>
- 3698510384U, // <3,0,3,5>: Cost 4 vext2 <1,2,3,0>, <3,5,1,7>
+ 3702491714U, // <3,0,3,5>: Cost 4 vext2 <1,u,3,0>, <3,5,3,7>
2624768632U, // <3,0,3,6>: Cost 3 vext2 <1,2,3,0>, <3,6,0,7>
3702491843U, // <3,0,3,7>: Cost 4 vext2 <1,u,3,0>, <3,7,0,1>
2686959934U, // <3,0,3,u>: Cost 3 vext3 <0,3,u,3>, <0,3,u,3>
@@ -2257,7 +2257,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2666573520U, // <3,0,5,1>: Cost 3 vext2 <u,2,3,0>, <5,1,7,3>
3040886886U, // <3,0,5,2>: Cost 3 vtrnl <3,4,5,6>, LHS
3625912834U, // <3,0,5,3>: Cost 4 vext1 <0,3,0,5>, <3,4,5,6>
- 3625913654U, // <3,0,5,4>: Cost 4 vext1 <0,3,0,5>, RHS
+ 2666573766U, // <3,0,5,4>: Cost 3 vext2 <u,2,3,0>, <5,4,7,6>
2666573828U, // <3,0,5,5>: Cost 3 vext2 <u,2,3,0>, <5,5,5,5>
2732966354U, // <3,0,5,6>: Cost 3 vext3 LHS, <0,5,6,7>
2666573992U, // <3,0,5,7>: Cost 3 vext2 <u,2,3,0>, <5,7,5,7>
@@ -2267,17 +2267,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689835519U, // <3,0,6,2>: Cost 3 vext3 LHS, <0,6,2,7>
3667724438U, // <3,0,6,3>: Cost 4 vext1 <7,3,0,6>, <3,0,1,2>
3763577355U, // <3,0,6,4>: Cost 4 vext3 LHS, <0,6,4,1>
- 3322204198U, // <3,0,6,5>: Cost 4 vrev <5,6,0,3>
+ 3806708243U, // <3,0,6,5>: Cost 4 vext3 LHS, <0,6,5,0>
2666574648U, // <3,0,6,6>: Cost 3 vext2 <u,2,3,0>, <6,6,6,6>
2657948520U, // <3,0,6,7>: Cost 3 vext2 <6,7,3,0>, <6,7,3,0>
2689835573U, // <3,0,6,u>: Cost 3 vext3 LHS, <0,6,u,7>
2666574842U, // <3,0,7,0>: Cost 3 vext2 <u,2,3,0>, <7,0,1,2>
- 2685633088U, // <3,0,7,1>: Cost 3 vext3 LHS, <0,7,1,0>
+ 2685633095U, // <3,0,7,1>: Cost 3 vext3 LHS, <0,7,1,7>
2660603052U, // <3,0,7,2>: Cost 3 vext2 <7,2,3,0>, <7,2,3,0>
- 3702494480U, // <3,0,7,3>: Cost 4 vext2 <1,u,3,0>, <7,3,5,1>
+ 3643844997U, // <3,0,7,3>: Cost 4 vext1 <3,3,0,7>, <3,3,0,7>
2666575206U, // <3,0,7,4>: Cost 3 vext2 <u,2,3,0>, <7,4,5,6>
- 3702494624U, // <3,0,7,5>: Cost 4 vext2 <1,u,3,0>, <7,5,3,1>
- 2732966514U, // <3,0,7,6>: Cost 3 vext3 LHS, <0,7,6,5>
+ 3655790391U, // <3,0,7,5>: Cost 4 vext1 <5,3,0,7>, <5,3,0,7>
+ 3731690968U, // <3,0,7,6>: Cost 4 vext2 <6,7,3,0>, <7,6,0,3>
2666575468U, // <3,0,7,7>: Cost 3 vext2 <u,2,3,0>, <7,7,7,7>
2664584850U, // <3,0,7,u>: Cost 3 vext2 <7,u,3,0>, <7,u,3,0>
1616093834U, // <3,0,u,0>: Cost 2 vext3 LHS, <0,u,0,2>
@@ -2292,12 +2292,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2552201318U, // <3,1,0,0>: Cost 3 vext1 <0,3,1,0>, LHS
2618802278U, // <3,1,0,1>: Cost 3 vext2 <0,2,3,1>, LHS
2618802366U, // <3,1,0,2>: Cost 3 vext2 <0,2,3,1>, <0,2,3,1>
- 2685633268U, // <3,1,0,3>: Cost 3 vext3 LHS, <1,0,3,0>
+ 1611449078U, // <3,1,0,3>: Cost 2 vext3 LHS, <1,0,3,2>
2552204598U, // <3,1,0,4>: Cost 3 vext1 <0,3,1,0>, RHS
- 2732966664U, // <3,1,0,5>: Cost 3 vext3 LHS, <1,0,5,2>
+ 2732966663U, // <3,1,0,5>: Cost 3 vext3 LHS, <1,0,5,1>
3906258396U, // <3,1,0,6>: Cost 4 vuzpr <2,3,0,1>, <2,0,4,6>
- 2732966686U, // <3,1,0,7>: Cost 3 vext3 LHS, <1,0,7,6>
- 2685633313U, // <3,1,0,u>: Cost 3 vext3 LHS, <1,0,u,0>
+ 3667752171U, // <3,1,0,7>: Cost 4 vext1 <7,3,1,0>, <7,3,1,0>
+ 1611891491U, // <3,1,0,u>: Cost 2 vext3 LHS, <1,0,u,2>
2689835819U, // <3,1,1,0>: Cost 3 vext3 LHS, <1,1,0,1>
1611449140U, // <3,1,1,1>: Cost 2 vext3 LHS, <1,1,1,1>
2624775063U, // <3,1,1,2>: Cost 3 vext2 <1,2,3,1>, <1,2,3,1>
@@ -2305,13 +2305,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689835859U, // <3,1,1,4>: Cost 3 vext3 LHS, <1,1,4,5>
2689835868U, // <3,1,1,5>: Cost 3 vext3 LHS, <1,1,5,5>
3763577701U, // <3,1,1,6>: Cost 4 vext3 LHS, <1,1,6,5>
- 2257163340U, // <3,1,1,7>: Cost 3 vrev <7,1,1,3>
+ 3765273452U, // <3,1,1,7>: Cost 4 vext3 <1,1,7,3>, <1,1,7,3>
1611891573U, // <3,1,1,u>: Cost 2 vext3 LHS, <1,1,u,3>
- 2552217702U, // <3,1,2,0>: Cost 3 vext1 <0,3,1,2>, LHS
+ 2629420494U, // <3,1,2,0>: Cost 3 vext2 <2,0,3,1>, <2,0,3,1>
2689835911U, // <3,1,2,1>: Cost 3 vext3 LHS, <1,2,1,3>
2564163248U, // <3,1,2,2>: Cost 3 vext1 <2,3,1,2>, <2,3,1,2>
1611449238U, // <3,1,2,3>: Cost 2 vext3 LHS, <1,2,3,0>
- 2552220982U, // <3,1,2,4>: Cost 3 vext1 <0,3,1,2>, RHS
+ 2564164918U, // <3,1,2,4>: Cost 3 vext1 <2,3,1,2>, RHS
2689835947U, // <3,1,2,5>: Cost 3 vext3 LHS, <1,2,5,3>
3692545978U, // <3,1,2,6>: Cost 4 vext2 <0,2,3,1>, <2,6,3,7>
2732966842U, // <3,1,2,7>: Cost 3 vext3 LHS, <1,2,7,0>
@@ -2340,10 +2340,10 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1611891856U, // <3,1,5,3>: Cost 2 vext3 LHS, <1,5,3,7>
2689836183U, // <3,1,5,4>: Cost 3 vext3 LHS, <1,5,4,5>
3759375522U, // <3,1,5,5>: Cost 4 vext3 LHS, <1,5,5,7>
- 3733688418U, // <3,1,5,6>: Cost 4 vext2 <7,1,3,1>, <5,6,7,0>
+ 3720417378U, // <3,1,5,6>: Cost 4 vext2 <4,u,3,1>, <5,6,7,0>
2832518454U, // <3,1,5,7>: Cost 3 vuzpr <2,3,0,1>, RHS
1611891901U, // <3,1,5,u>: Cost 2 vext3 LHS, <1,5,u,7>
- 2732967110U, // <3,1,6,0>: Cost 3 vext3 LHS, <1,6,0,7>
+ 3763578048U, // <3,1,6,0>: Cost 4 vext3 LHS, <1,6,0,1>
2689836239U, // <3,1,6,1>: Cost 3 vext3 LHS, <1,6,1,7>
2732967128U, // <3,1,6,2>: Cost 3 vext3 LHS, <1,6,2,7>
2685633761U, // <3,1,6,3>: Cost 3 vext3 LHS, <1,6,3,7>
@@ -2357,9 +2357,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
4036102294U, // <3,1,7,2>: Cost 4 vzipr <1,5,3,7>, <3,0,1,2>
3095396454U, // <3,1,7,3>: Cost 3 vtrnr <1,3,5,7>, LHS
3631975734U, // <3,1,7,4>: Cost 4 vext1 <1,3,1,7>, RHS
- 2249199744U, // <3,1,7,5>: Cost 3 vrev <5,7,1,3>
- 2255172441U, // <3,1,7,6>: Cost 3 vrev <6,7,1,3>
- 3733689964U, // <3,1,7,7>: Cost 4 vext2 <7,1,3,1>, <7,7,7,7>
+ 2222982144U, // <3,1,7,5>: Cost 3 vrev <1,3,5,7>
+ 3296797705U, // <3,1,7,6>: Cost 4 vrev <1,3,6,7>
+ 3720418924U, // <3,1,7,7>: Cost 4 vext2 <4,u,3,1>, <7,7,7,7>
3095396459U, // <3,1,7,u>: Cost 3 vtrnr <1,3,5,7>, LHS
1484496998U, // <3,1,u,0>: Cost 2 vext1 <1,3,1,u>, LHS
1611892077U, // <3,1,u,1>: Cost 2 vext3 LHS, <1,u,1,3>
@@ -2370,24 +2370,24 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2685633950U, // <3,1,u,6>: Cost 3 vext3 LHS, <1,u,6,7>
2832518697U, // <3,1,u,7>: Cost 3 vuzpr <2,3,0,1>, RHS
1611892140U, // <3,1,u,u>: Cost 2 vext3 LHS, <1,u,u,3>
- 2623455252U, // <3,2,0,0>: Cost 3 vext2 <1,0,3,2>, <0,0,2,2>
- 2689836477U, // <3,2,0,1>: Cost 3 vext3 LHS, <2,0,1,2>
+ 2623455232U, // <3,2,0,0>: Cost 3 vext2 <1,0,3,2>, <0,0,0,0>
+ 1549713510U, // <3,2,0,1>: Cost 2 vext2 <1,0,3,2>, LHS
2689836484U, // <3,2,0,2>: Cost 3 vext3 LHS, <2,0,2,0>
2685633997U, // <3,2,0,3>: Cost 3 vext3 LHS, <2,0,3,0>
- 2558250294U, // <3,2,0,4>: Cost 3 vext1 <1,3,2,0>, RHS
+ 2623455570U, // <3,2,0,4>: Cost 3 vext2 <1,0,3,2>, <0,4,1,5>
2732967398U, // <3,2,0,5>: Cost 3 vext3 LHS, <2,0,5,7>
- 2732967401U, // <3,2,0,6>: Cost 3 vext3 LHS, <2,0,6,1>
- 3763578355U, // <3,2,0,7>: Cost 4 vext3 LHS, <2,0,7,2>
- 2685634042U, // <3,2,0,u>: Cost 3 vext3 LHS, <2,0,u,0>
- 67944550U, // <3,2,1,0>: Cost 1 vrev LHS
- 2576171930U, // <3,2,1,1>: Cost 3 vext1 <4,3,2,1>, <1,2,3,4>
- 2624783256U, // <3,2,1,2>: Cost 3 vext2 <1,2,3,2>, <1,2,3,2>
- 2685634078U, // <3,2,1,3>: Cost 3 vext3 LHS, <2,1,3,0>
+ 2689836524U, // <3,2,0,6>: Cost 3 vext3 LHS, <2,0,6,4>
+ 2229044964U, // <3,2,0,7>: Cost 3 vrev <2,3,7,0>
+ 1549714077U, // <3,2,0,u>: Cost 2 vext2 <1,0,3,2>, LHS
+ 1549714166U, // <3,2,1,0>: Cost 2 vext2 <1,0,3,2>, <1,0,3,2>
+ 2623456052U, // <3,2,1,1>: Cost 3 vext2 <1,0,3,2>, <1,1,1,1>
+ 2623456150U, // <3,2,1,2>: Cost 3 vext2 <1,0,3,2>, <1,2,3,0>
+ 2685634079U, // <3,2,1,3>: Cost 3 vext3 LHS, <2,1,3,1>
2552286518U, // <3,2,1,4>: Cost 3 vext1 <0,3,2,1>, RHS
- 3763578416U, // <3,2,1,5>: Cost 4 vext3 LHS, <2,1,5,0>
+ 2623456400U, // <3,2,1,5>: Cost 3 vext2 <1,0,3,2>, <1,5,3,7>
2689836604U, // <3,2,1,6>: Cost 3 vext3 LHS, <2,1,6,3>
- 2257237077U, // <3,2,1,7>: Cost 3 vrev <7,1,2,3>
- 115726126U, // <3,2,1,u>: Cost 1 vrev LHS
+ 3667834101U, // <3,2,1,7>: Cost 4 vext1 <7,3,2,1>, <7,3,2,1>
+ 1155385070U, // <3,2,1,u>: Cost 2 vrev <2,3,u,1>
2689836629U, // <3,2,2,0>: Cost 3 vext3 LHS, <2,2,0,1>
2689836640U, // <3,2,2,1>: Cost 3 vext3 LHS, <2,2,1,3>
1611449960U, // <3,2,2,2>: Cost 2 vext3 LHS, <2,2,2,2>
@@ -2395,12 +2395,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689836669U, // <3,2,2,4>: Cost 3 vext3 LHS, <2,2,4,5>
2689836680U, // <3,2,2,5>: Cost 3 vext3 LHS, <2,2,5,7>
2689836688U, // <3,2,2,6>: Cost 3 vext3 LHS, <2,2,6,6>
- 2257900710U, // <3,2,2,7>: Cost 3 vrev <7,2,2,3>
+ 3763578518U, // <3,2,2,7>: Cost 4 vext3 LHS, <2,2,7,3>
1611892383U, // <3,2,2,u>: Cost 2 vext3 LHS, <2,2,u,3>
1611450022U, // <3,2,3,0>: Cost 2 vext3 LHS, <2,3,0,1>
- 2685191855U, // <3,2,3,1>: Cost 3 vext3 LHS, <2,3,1,1>
+ 2685191854U, // <3,2,3,1>: Cost 3 vext3 LHS, <2,3,1,0>
2685191865U, // <3,2,3,2>: Cost 3 vext3 LHS, <2,3,2,2>
- 2685191874U, // <3,2,3,3>: Cost 3 vext3 LHS, <2,3,3,2>
+ 2685191875U, // <3,2,3,3>: Cost 3 vext3 LHS, <2,3,3,3>
1611450062U, // <3,2,3,4>: Cost 2 vext3 LHS, <2,3,4,5>
2732967635U, // <3,2,3,5>: Cost 3 vext3 LHS, <2,3,5,1>
2732967645U, // <3,2,3,6>: Cost 3 vext3 LHS, <2,3,6,2>
@@ -2411,19 +2411,19 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2732967692U, // <3,2,4,2>: Cost 3 vext3 LHS, <2,4,2,4>
2685634326U, // <3,2,4,3>: Cost 3 vext3 LHS, <2,4,3,5>
2558283062U, // <3,2,4,4>: Cost 3 vext1 <1,3,2,4>, RHS
- 2689836841U, // <3,2,4,5>: Cost 3 vext3 LHS, <2,4,5,6>
+ 1549716790U, // <3,2,4,5>: Cost 2 vext2 <1,0,3,2>, RHS
2689836844U, // <3,2,4,6>: Cost 3 vext3 LHS, <2,4,6,0>
- 3667858680U, // <3,2,4,7>: Cost 4 vext1 <7,3,2,4>, <7,3,2,4>
- 2685634371U, // <3,2,4,u>: Cost 3 vext3 LHS, <2,4,u,5>
+ 2229077736U, // <3,2,4,7>: Cost 3 vrev <2,3,7,4>
+ 1549717033U, // <3,2,4,u>: Cost 2 vext2 <1,0,3,2>, RHS
2552316006U, // <3,2,5,0>: Cost 3 vext1 <0,3,2,5>, LHS
- 3759376211U, // <3,2,5,1>: Cost 4 vext3 LHS, <2,5,1,3>
+ 2228643507U, // <3,2,5,1>: Cost 3 vrev <2,3,1,5>
2689836896U, // <3,2,5,2>: Cost 3 vext3 LHS, <2,5,2,7>
2685634408U, // <3,2,5,3>: Cost 3 vext3 LHS, <2,5,3,6>
- 2552319286U, // <3,2,5,4>: Cost 3 vext1 <0,3,2,5>, RHS
- 3759376251U, // <3,2,5,5>: Cost 4 vext3 LHS, <2,5,5,7>
+ 1155122894U, // <3,2,5,4>: Cost 2 vrev <2,3,4,5>
+ 2665263108U, // <3,2,5,5>: Cost 3 vext2 <u,0,3,2>, <5,5,5,5>
2689836932U, // <3,2,5,6>: Cost 3 vext3 LHS, <2,5,6,7>
- 3894398262U, // <3,2,5,7>: Cost 4 vuzpr <0,3,1,2>, RHS
- 2685634453U, // <3,2,5,u>: Cost 3 vext3 LHS, <2,5,u,6>
+ 2665263272U, // <3,2,5,7>: Cost 3 vext2 <u,0,3,2>, <5,7,5,7>
+ 1155417842U, // <3,2,5,u>: Cost 2 vrev <2,3,u,5>
2689836953U, // <3,2,6,0>: Cost 3 vext3 LHS, <2,6,0,1>
2689836964U, // <3,2,6,1>: Cost 3 vext3 LHS, <2,6,1,3>
2689836976U, // <3,2,6,2>: Cost 3 vext3 LHS, <2,6,2,6>
@@ -2431,26 +2431,26 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689836993U, // <3,2,6,4>: Cost 3 vext3 LHS, <2,6,4,5>
2689837004U, // <3,2,6,5>: Cost 3 vext3 LHS, <2,6,5,7>
2689837013U, // <3,2,6,6>: Cost 3 vext3 LHS, <2,6,6,7>
- 2657964906U, // <3,2,6,7>: Cost 3 vext2 <6,7,3,2>, <6,7,3,2>
+ 2665263950U, // <3,2,6,7>: Cost 3 vext2 <u,0,3,2>, <6,7,0,1>
1611892711U, // <3,2,6,u>: Cost 2 vext3 LHS, <2,6,u,7>
- 2732967914U, // <3,2,7,0>: Cost 3 vext3 LHS, <2,7,0,1>
- 3626075280U, // <3,2,7,1>: Cost 4 vext1 <0,3,2,7>, <1,5,3,7>
+ 2665264122U, // <3,2,7,0>: Cost 3 vext2 <u,0,3,2>, <7,0,1,2>
+ 2623460419U, // <3,2,7,1>: Cost 3 vext2 <1,0,3,2>, <7,1,0,3>
4169138340U, // <3,2,7,2>: Cost 4 vtrnr <1,3,5,7>, <0,2,0,2>
2962358374U, // <3,2,7,3>: Cost 3 vzipr <1,5,3,7>, LHS
- 3626077494U, // <3,2,7,4>: Cost 4 vext1 <0,3,2,7>, RHS
- 4169138352U, // <3,2,7,5>: Cost 4 vtrnr <1,3,5,7>, <0,2,1,5>
- 2255246178U, // <3,2,7,6>: Cost 3 vrev <6,7,2,3>
- 3723744876U, // <3,2,7,7>: Cost 4 vext2 <5,4,3,2>, <7,7,7,7>
+ 2665264486U, // <3,2,7,4>: Cost 3 vext2 <u,0,3,2>, <7,4,5,6>
+ 2228954841U, // <3,2,7,5>: Cost 3 vrev <2,3,5,7>
+ 2229028578U, // <3,2,7,6>: Cost 3 vrev <2,3,6,7>
+ 2665264748U, // <3,2,7,7>: Cost 3 vext2 <u,0,3,2>, <7,7,7,7>
2962358379U, // <3,2,7,u>: Cost 3 vzipr <1,5,3,7>, LHS
- 72589981U, // <3,2,u,0>: Cost 1 vrev LHS
- 2685634628U, // <3,2,u,1>: Cost 3 vext3 LHS, <2,u,1,1>
+ 1611892795U, // <3,2,u,0>: Cost 2 vext3 LHS, <2,u,0,1>
+ 1549719342U, // <3,2,u,1>: Cost 2 vext2 <1,0,3,2>, LHS
1611449960U, // <3,2,u,2>: Cost 2 vext3 LHS, <2,2,2,2>
1611892824U, // <3,2,u,3>: Cost 2 vext3 LHS, <2,u,3,3>
1611892835U, // <3,2,u,4>: Cost 2 vext3 LHS, <2,u,4,5>
- 2689837165U, // <3,2,u,5>: Cost 3 vext3 LHS, <2,u,5,6>
+ 1549719706U, // <3,2,u,5>: Cost 2 vext2 <1,0,3,2>, RHS
2689837168U, // <3,2,u,6>: Cost 3 vext3 LHS, <2,u,6,0>
- 2594149628U, // <3,2,u,7>: Cost 3 vext1 <7,3,2,u>, <7,3,2,u>
- 120371557U, // <3,2,u,u>: Cost 1 vrev LHS
+ 2665265408U, // <3,2,u,7>: Cost 3 vext2 <u,0,3,2>, <u,7,0,1>
+ 1611892867U, // <3,2,u,u>: Cost 2 vext3 LHS, <2,u,u,1>
2685192331U, // <3,3,0,0>: Cost 3 vext3 LHS, <3,0,0,0>
1611450518U, // <3,3,0,1>: Cost 2 vext3 LHS, <3,0,1,2>
2685634717U, // <3,3,0,2>: Cost 3 vext3 LHS, <3,0,2,0>
@@ -2460,7 +2460,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3763579075U, // <3,3,0,6>: Cost 4 vext3 LHS, <3,0,6,2>
4034053264U, // <3,3,0,7>: Cost 4 vzipr <1,2,3,0>, <1,5,3,7>
1611450581U, // <3,3,0,u>: Cost 2 vext3 LHS, <3,0,u,2>
- 2558328934U, // <3,3,1,0>: Cost 3 vext1 <1,3,3,1>, LHS
+ 2685192415U, // <3,3,1,0>: Cost 3 vext3 LHS, <3,1,0,3>
1550385992U, // <3,3,1,1>: Cost 2 vext2 <1,1,3,3>, <1,1,3,3>
2685192433U, // <3,3,1,2>: Cost 3 vext3 LHS, <3,1,2,3>
2685634808U, // <3,3,1,3>: Cost 3 vext3 LHS, <3,1,3,1>
@@ -2470,22 +2470,22 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2703477022U, // <3,3,1,7>: Cost 3 vext3 <3,1,7,3>, <3,1,7,3>
1555031423U, // <3,3,1,u>: Cost 2 vext2 <1,u,3,3>, <1,u,3,3>
2564309094U, // <3,3,2,0>: Cost 3 vext1 <2,3,3,2>, LHS
- 1611450678U, // <3,3,2,1>: Cost 2 vext3 LHS, <3,2,1,0>
+ 2630100513U, // <3,3,2,1>: Cost 3 vext2 <2,1,3,3>, <2,1,3,3>
1557022322U, // <3,3,2,2>: Cost 2 vext2 <2,2,3,3>, <2,2,3,3>
2685192520U, // <3,3,2,3>: Cost 3 vext3 LHS, <3,2,3,0>
2564312374U, // <3,3,2,4>: Cost 3 vext1 <2,3,3,2>, RHS
- 3759376733U, // <3,3,2,5>: Cost 4 vext3 LHS, <3,2,5,3>
+ 2732968286U, // <3,3,2,5>: Cost 3 vext3 LHS, <3,2,5,4>
2685634918U, // <3,3,2,6>: Cost 3 vext3 LHS, <3,2,6,3>
2704140655U, // <3,3,2,7>: Cost 3 vext3 <3,2,7,3>, <3,2,7,3>
- 1616095605U, // <3,3,2,u>: Cost 2 vext3 LHS, <3,2,u,0>
+ 1561004120U, // <3,3,2,u>: Cost 2 vext2 <2,u,3,3>, <2,u,3,3>
1496547430U, // <3,3,3,0>: Cost 2 vext1 <3,3,3,3>, LHS
2624129256U, // <3,3,3,1>: Cost 3 vext2 <1,1,3,3>, <3,1,1,3>
- 2685192593U, // <3,3,3,2>: Cost 3 vext3 LHS, <3,3,2,1>
+ 2630764866U, // <3,3,3,2>: Cost 3 vext2 <2,2,3,3>, <3,2,2,3>
336380006U, // <3,3,3,3>: Cost 1 vdup3 LHS
1496550710U, // <3,3,3,4>: Cost 2 vext1 <3,3,3,3>, RHS
2732968368U, // <3,3,3,5>: Cost 3 vext3 LHS, <3,3,5,5>
2624129683U, // <3,3,3,6>: Cost 3 vext2 <1,1,3,3>, <3,6,3,7>
- 2258638080U, // <3,3,3,7>: Cost 3 vrev <7,3,3,3>
+ 2594182400U, // <3,3,3,7>: Cost 3 vext1 <7,3,3,3>, <7,3,3,3>
336380006U, // <3,3,3,u>: Cost 1 vdup3 LHS
2558353510U, // <3,3,4,0>: Cost 3 vext1 <1,3,3,4>, LHS
2558354411U, // <3,3,4,1>: Cost 3 vext1 <1,3,3,4>, <1,3,3,4>
@@ -2520,11 +2520,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2661291264U, // <3,3,7,3>: Cost 3 vext2 <7,3,3,3>, <7,3,3,3>
2558381366U, // <3,3,7,4>: Cost 3 vext1 <1,3,3,7>, RHS
2732968694U, // <3,3,7,5>: Cost 3 vext3 LHS, <3,7,5,7>
- 2255319915U, // <3,3,7,6>: Cost 3 vrev <6,7,3,3>
+ 3781126907U, // <3,3,7,6>: Cost 4 vext3 <3,7,6,3>, <3,7,6,3>
3095397376U, // <3,3,7,7>: Cost 3 vtrnr <1,3,5,7>, <1,3,5,7>
2558383918U, // <3,3,7,u>: Cost 3 vext1 <1,3,3,7>, LHS
1496547430U, // <3,3,u,0>: Cost 2 vext1 <3,3,3,3>, LHS
- 1611893532U, // <3,3,u,1>: Cost 2 vext3 LHS, <3,u,1,0>
+ 1611893534U, // <3,3,u,1>: Cost 2 vext3 LHS, <3,u,1,2>
1592858504U, // <3,3,u,2>: Cost 2 vext2 <u,2,3,3>, <u,2,3,3>
336380006U, // <3,3,u,3>: Cost 1 vdup3 LHS
1496550710U, // <3,3,u,4>: Cost 2 vext1 <3,3,3,3>, RHS
@@ -2541,7 +2541,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1659227036U, // <3,4,0,6>: Cost 2 vext3 LHS, <4,0,6,2>
3667973382U, // <3,4,0,7>: Cost 4 vext1 <7,3,4,0>, <7,3,4,0>
1551057565U, // <3,4,0,u>: Cost 2 vext2 <1,2,3,4>, LHS
- 2564374630U, // <3,4,1,0>: Cost 3 vext1 <2,3,4,1>, LHS
+ 2624799478U, // <3,4,1,0>: Cost 3 vext2 <1,2,3,4>, <1,0,3,2>
2624799540U, // <3,4,1,1>: Cost 3 vext2 <1,2,3,4>, <1,1,1,1>
1551057818U, // <3,4,1,2>: Cost 2 vext2 <1,2,3,4>, <1,2,3,4>
2624799704U, // <3,4,1,3>: Cost 3 vext2 <1,2,3,4>, <1,3,1,3>
@@ -2555,23 +2555,23 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2624800360U, // <3,4,2,2>: Cost 3 vext2 <1,2,3,4>, <2,2,2,2>
2624800422U, // <3,4,2,3>: Cost 3 vext2 <1,2,3,4>, <2,3,0,1>
2624800514U, // <3,4,2,4>: Cost 3 vext2 <1,2,3,4>, <2,4,1,3>
- 2905001270U, // <3,4,2,5>: Cost 3 vzipl <3,2,1,0>, RHS
+ 2709965878U, // <3,4,2,5>: Cost 3 vext3 <4,2,5,3>, <4,2,5,3>
2689838140U, // <3,4,2,6>: Cost 3 vext3 LHS, <4,2,6,0>
2634090504U, // <3,4,2,7>: Cost 3 vext2 <2,7,3,4>, <2,7,3,4>
2689838158U, // <3,4,2,u>: Cost 3 vext3 LHS, <4,2,u,0>
2624800918U, // <3,4,3,0>: Cost 3 vext2 <1,2,3,4>, <3,0,1,2>
2636081403U, // <3,4,3,1>: Cost 3 vext2 <3,1,3,4>, <3,1,3,4>
- 2624801078U, // <3,4,3,2>: Cost 3 vext2 <1,2,3,4>, <3,2,1,0>
+ 2636745036U, // <3,4,3,2>: Cost 3 vext2 <3,2,3,4>, <3,2,3,4>
2624801180U, // <3,4,3,3>: Cost 3 vext2 <1,2,3,4>, <3,3,3,3>
2624801232U, // <3,4,3,4>: Cost 3 vext2 <1,2,3,4>, <3,4,0,1>
2905836854U, // <3,4,3,5>: Cost 3 vzipl <3,3,3,3>, RHS
3040054582U, // <3,4,3,6>: Cost 3 vtrnl <3,3,3,3>, RHS
3702524611U, // <3,4,3,7>: Cost 4 vext2 <1,u,3,4>, <3,7,0,1>
- 2624801564U, // <3,4,3,u>: Cost 3 vext2 <1,2,3,4>, <3,u,1,0>
+ 2624801566U, // <3,4,3,u>: Cost 3 vext2 <1,2,3,4>, <3,u,1,2>
2564399206U, // <3,4,4,0>: Cost 3 vext1 <2,3,4,4>, LHS
2564400026U, // <3,4,4,1>: Cost 3 vext1 <2,3,4,4>, <1,2,3,4>
2564400845U, // <3,4,4,2>: Cost 3 vext1 <2,3,4,4>, <2,3,4,4>
- 2624801898U, // <3,4,4,3>: Cost 3 vext2 <1,2,3,4>, <4,3,2,1>
+ 2570373542U, // <3,4,4,3>: Cost 3 vext1 <3,3,4,4>, <3,3,4,4>
1659227344U, // <3,4,4,4>: Cost 2 vext3 LHS, <4,4,4,4>
1551060278U, // <3,4,4,5>: Cost 2 vext2 <1,2,3,4>, RHS
1659227364U, // <3,4,4,6>: Cost 2 vext3 LHS, <4,4,6,6>
@@ -2588,7 +2588,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
537709896U, // <3,4,5,u>: Cost 1 vext3 LHS, RHS
2689838411U, // <3,4,6,0>: Cost 3 vext3 LHS, <4,6,0,1>
2558444534U, // <3,4,6,1>: Cost 3 vext1 <1,3,4,6>, <1,3,4,6>
- 2732969308U, // <3,4,6,2>: Cost 3 vext3 LHS, <4,6,2,0>
+ 2666607098U, // <3,4,6,2>: Cost 3 vext2 <u,2,3,4>, <6,2,7,3>
2558446082U, // <3,4,6,3>: Cost 3 vext1 <1,3,4,6>, <3,4,5,6>
1659227508U, // <3,4,6,4>: Cost 2 vext3 LHS, <4,6,4,6>
2689838462U, // <3,4,6,5>: Cost 3 vext3 LHS, <4,6,5,7>
@@ -2598,10 +2598,10 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2666607610U, // <3,4,7,0>: Cost 3 vext2 <u,2,3,4>, <7,0,1,2>
3702527072U, // <3,4,7,1>: Cost 4 vext2 <1,u,3,4>, <7,1,3,5>
2660635824U, // <3,4,7,2>: Cost 3 vext2 <7,2,3,4>, <7,2,3,4>
- 3702527248U, // <3,4,7,3>: Cost 4 vext2 <1,u,3,4>, <7,3,5,1>
+ 3644139945U, // <3,4,7,3>: Cost 4 vext1 <3,3,4,7>, <3,3,4,7>
2666607974U, // <3,4,7,4>: Cost 3 vext2 <u,2,3,4>, <7,4,5,6>
2732969416U, // <3,4,7,5>: Cost 3 vext3 LHS, <4,7,5,0>
- 2732969426U, // <3,4,7,6>: Cost 3 vext3 LHS, <4,7,6,1>
+ 2732969425U, // <3,4,7,6>: Cost 3 vext3 LHS, <4,7,6,0>
2666608236U, // <3,4,7,7>: Cost 3 vext2 <u,2,3,4>, <7,7,7,7>
2664617622U, // <3,4,7,u>: Cost 3 vext2 <7,u,3,4>, <7,u,3,4>
1490690150U, // <3,4,u,0>: Cost 2 vext1 <2,3,4,u>, LHS
@@ -2620,18 +2620,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689838690U, // <3,5,0,4>: Cost 3 vext3 LHS, <5,0,4,1>
2732969579U, // <3,5,0,5>: Cost 3 vext3 LHS, <5,0,5,1>
2732969588U, // <3,5,0,6>: Cost 3 vext3 LHS, <5,0,6,1>
- 4162817334U, // <3,5,0,7>: Cost 4 vtrnr <0,3,1,0>, RHS
+ 2246963055U, // <3,5,0,7>: Cost 3 vrev <5,3,7,0>
2618835613U, // <3,5,0,u>: Cost 3 vext2 <0,2,3,5>, LHS
2594308198U, // <3,5,1,0>: Cost 3 vext1 <7,3,5,1>, LHS
3692577588U, // <3,5,1,1>: Cost 4 vext2 <0,2,3,5>, <1,1,1,1>
2624807835U, // <3,5,1,2>: Cost 3 vext2 <1,2,3,5>, <1,2,3,5>
2625471468U, // <3,5,1,3>: Cost 3 vext2 <1,3,3,5>, <1,3,3,5>
- 2689838770U, // <3,5,1,4>: Cost 3 vext3 LHS, <5,1,4,0>
+ 2626135101U, // <3,5,1,4>: Cost 3 vext2 <1,4,3,5>, <1,4,3,5>
2594311888U, // <3,5,1,5>: Cost 3 vext1 <7,3,5,1>, <5,1,7,3>
3699877107U, // <3,5,1,6>: Cost 4 vext2 <1,4,3,5>, <1,6,5,7>
1641680592U, // <3,5,1,7>: Cost 2 vext3 <5,1,7,3>, <5,1,7,3>
1641754329U, // <3,5,1,u>: Cost 2 vext3 <5,1,u,3>, <5,1,u,3>
- 3703195090U, // <3,5,2,0>: Cost 4 vext2 <2,0,3,5>, <2,0,3,5>
+ 3692578274U, // <3,5,2,0>: Cost 4 vext2 <0,2,3,5>, <2,0,5,3>
2630116899U, // <3,5,2,1>: Cost 3 vext2 <2,1,3,5>, <2,1,3,5>
3692578408U, // <3,5,2,2>: Cost 4 vext2 <0,2,3,5>, <2,2,2,2>
2625472206U, // <3,5,2,3>: Cost 3 vext2 <1,3,3,5>, <2,3,4,5>
@@ -2642,22 +2642,22 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2634762330U, // <3,5,2,u>: Cost 3 vext2 <2,u,3,5>, <2,u,3,5>
3692578966U, // <3,5,3,0>: Cost 4 vext2 <0,2,3,5>, <3,0,1,2>
2636089596U, // <3,5,3,1>: Cost 3 vext2 <3,1,3,5>, <3,1,3,5>
- 3692579126U, // <3,5,3,2>: Cost 4 vext2 <0,2,3,5>, <3,2,1,0>
+ 3699214668U, // <3,5,3,2>: Cost 4 vext2 <1,3,3,5>, <3,2,3,4>
2638080412U, // <3,5,3,3>: Cost 3 vext2 <3,4,3,5>, <3,3,3,3>
2618837506U, // <3,5,3,4>: Cost 3 vext2 <0,2,3,5>, <3,4,5,6>
2832844494U, // <3,5,3,5>: Cost 3 vuzpr <2,3,4,5>, <2,3,4,5>
4033415682U, // <3,5,3,6>: Cost 4 vzipr <1,1,3,3>, <3,4,5,6>
3095072054U, // <3,5,3,7>: Cost 3 vtrnr <1,3,1,3>, RHS
3095072055U, // <3,5,3,u>: Cost 3 vtrnr <1,3,1,3>, RHS
- 2732969858U, // <3,5,4,0>: Cost 3 vext3 LHS, <5,4,0,1>
- 2732969874U, // <3,5,4,1>: Cost 3 vext3 LHS, <5,4,1,u>
- 3763580819U, // <3,5,4,2>: Cost 4 vext3 LHS, <5,4,2,0>
- 2732969886U, // <3,5,4,3>: Cost 3 vext3 LHS, <5,4,3,2>
- 2732969898U, // <3,5,4,4>: Cost 3 vext3 LHS, <5,4,4,5>
+ 2600304742U, // <3,5,4,0>: Cost 3 vext1 <u,3,5,4>, LHS
+ 3763580815U, // <3,5,4,1>: Cost 4 vext3 LHS, <5,4,1,5>
+ 2564474582U, // <3,5,4,2>: Cost 3 vext1 <2,3,5,4>, <2,3,5,4>
+ 3699879044U, // <3,5,4,3>: Cost 4 vext2 <1,4,3,5>, <4,3,5,0>
+ 2600308022U, // <3,5,4,4>: Cost 3 vext1 <u,3,5,4>, RHS
2618838326U, // <3,5,4,5>: Cost 3 vext2 <0,2,3,5>, RHS
2772454710U, // <3,5,4,6>: Cost 3 vuzpl <3,4,5,6>, RHS
- 2732969925U, // <3,5,4,7>: Cost 3 vext3 LHS, <5,4,7,5>
- 2618838569U, // <3,5,4,u>: Cost 3 vext2 <0,2,3,5>, RHS
+ 1659228102U, // <3,5,4,7>: Cost 2 vext3 LHS, <5,4,7,6>
+ 1659228111U, // <3,5,4,u>: Cost 2 vext3 LHS, <5,4,u,6>
2570453094U, // <3,5,5,0>: Cost 3 vext1 <3,3,5,5>, LHS
2624810704U, // <3,5,5,1>: Cost 3 vext2 <1,2,3,5>, <5,1,7,3>
2570454734U, // <3,5,5,2>: Cost 3 vext1 <3,3,5,5>, <2,3,4,5>
@@ -2683,7 +2683,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1484786998U, // <3,5,7,4>: Cost 2 vext1 <1,3,5,7>, RHS
1659228328U, // <3,5,7,5>: Cost 2 vext3 LHS, <5,7,5,7>
2732970154U, // <3,5,7,6>: Cost 3 vext3 LHS, <5,7,6,0>
- 2558530976U, // <3,5,7,7>: Cost 3 vext1 <1,3,5,7>, <7,5,3,1>
+ 2558531180U, // <3,5,7,7>: Cost 3 vext1 <1,3,5,7>, <7,7,7,7>
1484789550U, // <3,5,7,u>: Cost 2 vext1 <1,3,5,7>, LHS
1484791910U, // <3,5,u,0>: Cost 2 vext1 <1,3,5,u>, LHS
1484792833U, // <3,5,u,1>: Cost 2 vext1 <1,3,5,u>, <1,3,5,u>
@@ -2703,7 +2703,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2732970316U, // <3,6,0,6>: Cost 3 vext3 LHS, <6,0,6,0>
2960313654U, // <3,6,0,7>: Cost 3 vzipr <1,2,3,0>, RHS
2689839456U, // <3,6,0,u>: Cost 3 vext3 LHS, <6,0,u,2>
- 2720878954U, // <3,6,1,0>: Cost 3 vext3 <6,1,0,3>, <6,1,0,3>
+ 3763581290U, // <3,6,1,0>: Cost 4 vext3 LHS, <6,1,0,3>
3763581297U, // <3,6,1,1>: Cost 4 vext3 LHS, <6,1,1,1>
2624816028U, // <3,6,1,2>: Cost 3 vext2 <1,2,3,6>, <1,2,3,6>
3763581315U, // <3,6,1,3>: Cost 4 vext3 LHS, <6,1,3,1>
@@ -2715,43 +2715,43 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2594390118U, // <3,6,2,0>: Cost 3 vext1 <7,3,6,2>, LHS
2721616324U, // <3,6,2,1>: Cost 3 vext3 <6,2,1,3>, <6,2,1,3>
2630788725U, // <3,6,2,2>: Cost 3 vext2 <2,2,3,6>, <2,2,3,6>
- 2234304870U, // <3,6,2,3>: Cost 3 vrev <3,2,6,3>
- 2689839580U, // <3,6,2,4>: Cost 3 vext3 LHS, <6,2,4,0>
+ 3763581395U, // <3,6,2,3>: Cost 4 vext3 LHS, <6,2,3,0>
+ 2632115991U, // <3,6,2,4>: Cost 3 vext2 <2,4,3,6>, <2,4,3,6>
2632779624U, // <3,6,2,5>: Cost 3 vext2 <2,5,3,6>, <2,5,3,6>
2594394618U, // <3,6,2,6>: Cost 3 vext1 <7,3,6,2>, <6,2,7,3>
1648316922U, // <3,6,2,7>: Cost 2 vext3 <6,2,7,3>, <6,2,7,3>
1648390659U, // <3,6,2,u>: Cost 2 vext3 <6,2,u,3>, <6,2,u,3>
3693914262U, // <3,6,3,0>: Cost 4 vext2 <0,4,3,6>, <3,0,1,2>
3638281176U, // <3,6,3,1>: Cost 4 vext1 <2,3,6,3>, <1,3,1,3>
- 3763581468U, // <3,6,3,2>: Cost 4 vext3 LHS, <6,3,2,1>
+ 3696568678U, // <3,6,3,2>: Cost 4 vext2 <0,u,3,6>, <3,2,6,3>
2638088604U, // <3,6,3,3>: Cost 3 vext2 <3,4,3,6>, <3,3,3,3>
2632780290U, // <3,6,3,4>: Cost 3 vext2 <2,5,3,6>, <3,4,5,6>
3712494145U, // <3,6,3,5>: Cost 4 vext2 <3,5,3,6>, <3,5,3,6>
3698559612U, // <3,6,3,6>: Cost 4 vext2 <1,2,3,6>, <3,6,1,2>
2959674678U, // <3,6,3,7>: Cost 3 vzipr <1,1,3,3>, RHS
2959674679U, // <3,6,3,u>: Cost 3 vzipr <1,1,3,3>, RHS
- 3638288486U, // <3,6,4,0>: Cost 4 vext1 <2,3,6,4>, LHS
+ 3763581536U, // <3,6,4,0>: Cost 4 vext3 LHS, <6,4,0,6>
2722943590U, // <3,6,4,1>: Cost 3 vext3 <6,4,1,3>, <6,4,1,3>
- 2689839724U, // <3,6,4,2>: Cost 3 vext3 LHS, <6,4,2,0>
+ 2732970609U, // <3,6,4,2>: Cost 3 vext3 LHS, <6,4,2,5>
3698560147U, // <3,6,4,3>: Cost 4 vext2 <1,2,3,6>, <4,3,6,6>
2732970628U, // <3,6,4,4>: Cost 3 vext3 LHS, <6,4,4,6>
2689839757U, // <3,6,4,5>: Cost 3 vext3 LHS, <6,4,5,6>
2732970640U, // <3,6,4,6>: Cost 3 vext3 LHS, <6,4,6,0>
2960346422U, // <3,6,4,7>: Cost 3 vzipr <1,2,3,4>, RHS
2689839784U, // <3,6,4,u>: Cost 3 vext3 LHS, <6,4,u,6>
- 2732970674U, // <3,6,5,0>: Cost 3 vext3 LHS, <6,5,0,7>
- 3789165243U, // <3,6,5,1>: Cost 4 vext3 <5,1,7,3>, <6,5,1,7>
+ 2576498790U, // <3,6,5,0>: Cost 3 vext1 <4,3,6,5>, LHS
+ 3650241270U, // <3,6,5,1>: Cost 4 vext1 <4,3,6,5>, <1,0,3,2>
2732970692U, // <3,6,5,2>: Cost 3 vext3 LHS, <6,5,2,7>
2576501250U, // <3,6,5,3>: Cost 3 vext1 <4,3,6,5>, <3,4,5,6>
- 2242268466U, // <3,6,5,4>: Cost 3 vrev <4,5,6,3>
- 3806712536U, // <3,6,5,5>: Cost 4 vext3 LHS, <6,5,5,0>
+ 2576501906U, // <3,6,5,4>: Cost 3 vext1 <4,3,6,5>, <4,3,6,5>
+ 3650244622U, // <3,6,5,5>: Cost 4 vext1 <4,3,6,5>, <5,5,6,6>
4114633528U, // <3,6,5,6>: Cost 4 vtrnl <3,4,5,6>, <6,6,6,6>
2732970735U, // <3,6,5,7>: Cost 3 vext3 LHS, <6,5,7,5>
- 2724123382U, // <3,6,5,u>: Cost 3 vext3 <6,5,u,3>, <6,5,u,3>
+ 2576504622U, // <3,6,5,u>: Cost 3 vext1 <4,3,6,5>, LHS
2732970749U, // <3,6,6,0>: Cost 3 vext3 LHS, <6,6,0,1>
2724270856U, // <3,6,6,1>: Cost 3 vext3 <6,6,1,3>, <6,6,1,3>
2624819706U, // <3,6,6,2>: Cost 3 vext2 <1,2,3,6>, <6,2,7,3>
- 3699888686U, // <3,6,6,3>: Cost 4 vext2 <1,4,3,6>, <6,3,4,1>
+ 3656223234U, // <3,6,6,3>: Cost 4 vext1 <5,3,6,6>, <3,4,5,6>
2732970788U, // <3,6,6,4>: Cost 3 vext3 LHS, <6,6,4,4>
2732970800U, // <3,6,6,5>: Cost 3 vext3 LHS, <6,6,5,7>
1659228984U, // <3,6,6,6>: Cost 2 vext3 LHS, <6,6,6,6>
@@ -2768,8 +2768,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1659229078U, // <3,6,7,u>: Cost 2 vext3 LHS, <6,7,u,1>
1659229087U, // <3,6,u,0>: Cost 2 vext3 LHS, <6,u,0,1>
2689840041U, // <3,6,u,1>: Cost 3 vext3 LHS, <6,u,1,2>
- 2689840048U, // <3,6,u,2>: Cost 3 vext3 LHS, <6,u,2,0>
- 2238286668U, // <3,6,u,3>: Cost 3 vrev <3,u,6,3>
+ 2558609339U, // <3,6,u,2>: Cost 3 vext1 <1,3,6,u>, <2,6,3,u>
+ 2576525853U, // <3,6,u,3>: Cost 3 vext1 <4,3,6,u>, <3,4,u,6>
1659229127U, // <3,6,u,4>: Cost 2 vext3 LHS, <6,u,4,5>
2689840081U, // <3,6,u,5>: Cost 3 vext3 LHS, <6,u,5,6>
1659228984U, // <3,6,u,6>: Cost 2 vext3 LHS, <6,6,6,6>
@@ -2784,7 +2784,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2588480072U, // <3,7,0,6>: Cost 3 vext1 <6,3,7,0>, <6,3,7,0>
2732971055U, // <3,7,0,7>: Cost 3 vext3 LHS, <7,0,7,1>
1553072797U, // <3,7,0,u>: Cost 2 vext2 <1,5,3,7>, LHS
- 2582511718U, // <3,7,1,0>: Cost 3 vext1 <5,3,7,1>, LHS
+ 2626814710U, // <3,7,1,0>: Cost 3 vext2 <1,5,3,7>, <1,0,3,2>
2626814772U, // <3,7,1,1>: Cost 3 vext2 <1,5,3,7>, <1,1,1,1>
2626814870U, // <3,7,1,2>: Cost 3 vext2 <1,5,3,7>, <1,2,3,0>
2625487854U, // <3,7,1,3>: Cost 3 vext2 <1,3,3,7>, <1,3,3,7>
@@ -2794,7 +2794,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2727367810U, // <3,7,1,7>: Cost 3 vext3 <7,1,7,3>, <7,1,7,3>
1555064195U, // <3,7,1,u>: Cost 2 vext2 <1,u,3,7>, <1,u,3,7>
2588491878U, // <3,7,2,0>: Cost 3 vext1 <6,3,7,2>, LHS
- 3700557342U, // <3,7,2,1>: Cost 4 vext2 <1,5,3,7>, <2,1,3,0>
+ 3700557318U, // <3,7,2,1>: Cost 4 vext2 <1,5,3,7>, <2,1,0,3>
2626815592U, // <3,7,2,2>: Cost 3 vext2 <1,5,3,7>, <2,2,2,2>
2626815654U, // <3,7,2,3>: Cost 3 vext2 <1,5,3,7>, <2,3,0,1>
2588495158U, // <3,7,2,4>: Cost 3 vext1 <6,3,7,2>, RHS
@@ -2804,52 +2804,52 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1561036892U, // <3,7,2,u>: Cost 2 vext2 <2,u,3,7>, <2,u,3,7>
2626816150U, // <3,7,3,0>: Cost 3 vext2 <1,5,3,7>, <3,0,1,2>
2626816268U, // <3,7,3,1>: Cost 3 vext2 <1,5,3,7>, <3,1,5,3>
- 2626816310U, // <3,7,3,2>: Cost 3 vext2 <1,5,3,7>, <3,2,1,0>
+ 2633451878U, // <3,7,3,2>: Cost 3 vext2 <2,6,3,7>, <3,2,6,3>
2626816412U, // <3,7,3,3>: Cost 3 vext2 <1,5,3,7>, <3,3,3,3>
2626816514U, // <3,7,3,4>: Cost 3 vext2 <1,5,3,7>, <3,4,5,6>
2638760514U, // <3,7,3,5>: Cost 3 vext2 <3,5,3,7>, <3,5,3,7>
2639424147U, // <3,7,3,6>: Cost 3 vext2 <3,6,3,7>, <3,6,3,7>
2826961920U, // <3,7,3,7>: Cost 3 vuzpr <1,3,5,7>, <1,3,5,7>
- 2626816796U, // <3,7,3,u>: Cost 3 vext2 <1,5,3,7>, <3,u,1,0>
+ 2626816798U, // <3,7,3,u>: Cost 3 vext2 <1,5,3,7>, <3,u,1,2>
2582536294U, // <3,7,4,0>: Cost 3 vext1 <5,3,7,4>, LHS
2582537360U, // <3,7,4,1>: Cost 3 vext1 <5,3,7,4>, <1,5,3,7>
2588510138U, // <3,7,4,2>: Cost 3 vext1 <6,3,7,4>, <2,6,3,7>
- 3700558954U, // <3,7,4,3>: Cost 4 vext2 <1,5,3,7>, <4,3,2,1>
+ 3700558996U, // <3,7,4,3>: Cost 4 vext2 <1,5,3,7>, <4,3,6,7>
2582539574U, // <3,7,4,4>: Cost 3 vext1 <5,3,7,4>, RHS
1553075510U, // <3,7,4,5>: Cost 2 vext2 <1,5,3,7>, RHS
2588512844U, // <3,7,4,6>: Cost 3 vext1 <6,3,7,4>, <6,3,7,4>
2564625766U, // <3,7,4,7>: Cost 3 vext1 <2,3,7,4>, <7,4,5,6>
1553075753U, // <3,7,4,u>: Cost 2 vext2 <1,5,3,7>, RHS
2732971398U, // <3,7,5,0>: Cost 3 vext3 LHS, <7,5,0,2>
- 2715424148U, // <3,7,5,1>: Cost 3 vext3 <5,1,7,3>, <7,5,1,7>
+ 2626817744U, // <3,7,5,1>: Cost 3 vext2 <1,5,3,7>, <5,1,7,3>
3700559649U, // <3,7,5,2>: Cost 4 vext2 <1,5,3,7>, <5,2,7,3>
2626817903U, // <3,7,5,3>: Cost 3 vext2 <1,5,3,7>, <5,3,7,0>
- 3900705379U, // <3,7,5,4>: Cost 4 vuzpr <1,3,5,7>, <3,5,7,4>
+ 2258728203U, // <3,7,5,4>: Cost 3 vrev <7,3,4,5>
2732971446U, // <3,7,5,5>: Cost 3 vext3 LHS, <7,5,5,5>
2732971457U, // <3,7,5,6>: Cost 3 vext3 LHS, <7,5,6,7>
2826964278U, // <3,7,5,7>: Cost 3 vuzpr <1,3,5,7>, RHS
2826964279U, // <3,7,5,u>: Cost 3 vuzpr <1,3,5,7>, RHS
- 2600468582U, // <3,7,6,0>: Cost 3 vext1 <u,3,7,6>, LHS
- 2633453993U, // <3,7,6,1>: Cost 3 vext2 <2,6,3,7>, <6,1,7,3>
- 2722059758U, // <3,7,6,2>: Cost 3 vext3 <6,2,7,3>, <7,6,2,7>
+ 2732971478U, // <3,7,6,0>: Cost 3 vext3 LHS, <7,6,0,1>
+ 2732971486U, // <3,7,6,1>: Cost 3 vext3 LHS, <7,6,1,0>
+ 2633454074U, // <3,7,6,2>: Cost 3 vext2 <2,6,3,7>, <6,2,7,3>
2633454152U, // <3,7,6,3>: Cost 3 vext2 <2,6,3,7>, <6,3,7,0>
- 2600471862U, // <3,7,6,4>: Cost 3 vext1 <u,3,7,6>, RHS
- 1659229702U, // <3,7,6,5>: Cost 2 vext3 LHS, <7,6,5,4>
+ 2732971518U, // <3,7,6,4>: Cost 3 vext3 LHS, <7,6,4,5>
+ 2732971526U, // <3,7,6,5>: Cost 3 vext3 LHS, <7,6,5,4>
2732971537U, // <3,7,6,6>: Cost 3 vext3 LHS, <7,6,6,6>
2732971540U, // <3,7,6,7>: Cost 3 vext3 LHS, <7,6,7,0>
- 1659229729U, // <3,7,6,u>: Cost 2 vext3 LHS, <7,6,u,4>
+ 2726041124U, // <3,7,6,u>: Cost 3 vext3 <6,u,7,3>, <7,6,u,7>
2570616934U, // <3,7,7,0>: Cost 3 vext1 <3,3,7,7>, LHS
2570617856U, // <3,7,7,1>: Cost 3 vext1 <3,3,7,7>, <1,3,5,7>
2564646635U, // <3,7,7,2>: Cost 3 vext1 <2,3,7,7>, <2,3,7,7>
- 2626819344U, // <3,7,7,3>: Cost 3 vext2 <1,5,3,7>, <7,3,5,1>
+ 2570619332U, // <3,7,7,3>: Cost 3 vext1 <3,3,7,7>, <3,3,7,7>
2570620214U, // <3,7,7,4>: Cost 3 vext1 <3,3,7,7>, RHS
- 2732971608U, // <3,7,7,5>: Cost 3 vext3 LHS, <7,7,5,5>
- 2732971617U, // <3,7,7,6>: Cost 3 vext3 LHS, <7,7,6,5>
+ 2582564726U, // <3,7,7,5>: Cost 3 vext1 <5,3,7,7>, <5,3,7,7>
+ 2588537423U, // <3,7,7,6>: Cost 3 vext1 <6,3,7,7>, <6,3,7,7>
1659229804U, // <3,7,7,7>: Cost 2 vext3 LHS, <7,7,7,7>
1659229804U, // <3,7,7,u>: Cost 2 vext3 LHS, <7,7,7,7>
2626819795U, // <3,7,u,0>: Cost 3 vext2 <1,5,3,7>, <u,0,1,2>
1553078062U, // <3,7,u,1>: Cost 2 vext2 <1,5,3,7>, LHS
- 2626819955U, // <3,7,u,2>: Cost 3 vext2 <1,5,3,7>, <u,2,1,0>
+ 2626819973U, // <3,7,u,2>: Cost 3 vext2 <1,5,3,7>, <u,2,3,0>
2826961565U, // <3,7,u,3>: Cost 3 vuzpr <1,3,5,7>, LHS
2626820159U, // <3,7,u,4>: Cost 3 vext2 <1,5,3,7>, <u,4,5,6>
1553078426U, // <3,7,u,5>: Cost 2 vext2 <1,5,3,7>, RHS
@@ -2859,13 +2859,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1611448320U, // <3,u,0,0>: Cost 2 vext3 LHS, <0,0,0,0>
1611896531U, // <3,u,0,1>: Cost 2 vext3 LHS, <u,0,1,2>
1659672284U, // <3,u,0,2>: Cost 2 vext3 LHS, <u,0,2,2>
- 2689840867U, // <3,u,0,3>: Cost 3 vext3 LHS, <u,0,3,0>
+ 1616099045U, // <3,u,0,3>: Cost 2 vext3 LHS, <u,0,3,2>
2685638381U, // <3,u,0,4>: Cost 3 vext3 LHS, <u,0,4,1>
1663874806U, // <3,u,0,5>: Cost 2 vext3 LHS, <u,0,5,1>
1663874816U, // <3,u,0,6>: Cost 2 vext3 LHS, <u,0,6,2>
2960313672U, // <3,u,0,7>: Cost 3 vzipr <1,2,3,0>, RHS
1611896594U, // <3,u,0,u>: Cost 2 vext3 LHS, <u,0,u,2>
- 68386972U, // <3,u,1,0>: Cost 1 vrev LHS
+ 1549763324U, // <3,u,1,0>: Cost 2 vext2 <1,0,3,u>, <1,0,3,u>
1550426957U, // <3,u,1,1>: Cost 2 vext2 <1,1,3,u>, <1,1,3,u>
537712430U, // <3,u,1,2>: Cost 1 vext3 LHS, LHS
1616541495U, // <3,u,1,3>: Cost 2 vext3 LHS, <u,1,3,3>
@@ -2875,7 +2875,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1659230043U, // <3,u,1,7>: Cost 2 vext3 LHS, <u,1,7,3>
537712484U, // <3,u,1,u>: Cost 1 vext3 LHS, LHS
1611890852U, // <3,u,2,0>: Cost 2 vext3 LHS, <0,2,0,2>
- 1611896691U, // <3,u,2,1>: Cost 2 vext3 LHS, <u,2,1,0>
+ 2624833102U, // <3,u,2,1>: Cost 3 vext2 <1,2,3,u>, <2,1,u,3>
1557063287U, // <3,u,2,2>: Cost 2 vext2 <2,2,3,u>, <2,2,3,u>
1616099205U, // <3,u,2,3>: Cost 2 vext3 LHS, <u,2,3,0>
1611890892U, // <3,u,2,4>: Cost 2 vext3 LHS, <0,2,4,6>
@@ -2885,7 +2885,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1616541618U, // <3,u,2,u>: Cost 2 vext3 LHS, <u,2,u,0>
1611896764U, // <3,u,3,0>: Cost 2 vext3 LHS, <u,3,0,1>
1484973079U, // <3,u,3,1>: Cost 2 vext1 <1,3,u,3>, <1,3,u,3>
- 2685638606U, // <3,u,3,2>: Cost 3 vext3 LHS, <u,3,2,1>
+ 2685638607U, // <3,u,3,2>: Cost 3 vext3 LHS, <u,3,2,2>
336380006U, // <3,u,3,3>: Cost 1 vdup3 LHS
1611896804U, // <3,u,3,4>: Cost 2 vext3 LHS, <u,3,4,5>
1616541679U, // <3,u,3,5>: Cost 2 vext3 LHS, <u,3,5,7>
@@ -2899,7 +2899,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1659227344U, // <3,u,4,4>: Cost 2 vext3 LHS, <4,4,4,4>
1611896895U, // <3,u,4,5>: Cost 2 vext3 LHS, <u,4,5,6>
1663875144U, // <3,u,4,6>: Cost 2 vext3 LHS, <u,4,6,6>
- 2960346440U, // <3,u,4,7>: Cost 3 vzipr <1,2,3,4>, RHS
+ 1659230289U, // <3,u,4,7>: Cost 2 vext3 LHS, <u,4,7,6>
1611896922U, // <3,u,4,u>: Cost 2 vext3 LHS, <u,4,u,6>
1490960486U, // <3,u,5,0>: Cost 2 vext1 <2,3,u,5>, LHS
2689841261U, // <3,u,5,1>: Cost 3 vext3 LHS, <u,5,1,7>
@@ -2915,7 +2915,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689841351U, // <3,u,6,2>: Cost 3 vext3 LHS, <u,6,2,7>
1616099536U, // <3,u,6,3>: Cost 2 vext3 LHS, <u,6,3,7>
1659227508U, // <3,u,6,4>: Cost 2 vext3 LHS, <4,6,4,6>
- 1659230431U, // <3,u,6,5>: Cost 2 vext3 LHS, <u,6,5,4>
+ 2690283746U, // <3,u,6,5>: Cost 3 vext3 LHS, <u,6,5,7>
1659228984U, // <3,u,6,6>: Cost 2 vext3 LHS, <6,6,6,6>
1659230445U, // <3,u,6,7>: Cost 2 vext3 LHS, <u,6,7,0>
1616099581U, // <3,u,6,u>: Cost 2 vext3 LHS, <u,6,u,7>
@@ -2928,7 +2928,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2722060599U, // <3,u,7,6>: Cost 3 vext3 <6,2,7,3>, <u,7,6,2>
1659229804U, // <3,u,7,7>: Cost 2 vext3 LHS, <7,7,7,7>
1485010734U, // <3,u,7,u>: Cost 2 vext1 <1,3,u,7>, LHS
- 73032403U, // <3,u,u,0>: Cost 1 vrev LHS
+ 1616099665U, // <3,u,u,0>: Cost 2 vext3 LHS, <u,u,0,1>
1611897179U, // <3,u,u,1>: Cost 2 vext3 LHS, <u,u,1,2>
537712997U, // <3,u,u,2>: Cost 1 vext3 LHS, LHS
336380006U, // <3,u,u,3>: Cost 1 vdup3 LHS
@@ -2940,11 +2940,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2691907584U, // <4,0,0,0>: Cost 3 vext3 <1,2,3,4>, <0,0,0,0>
2691907594U, // <4,0,0,1>: Cost 3 vext3 <1,2,3,4>, <0,0,1,1>
2691907604U, // <4,0,0,2>: Cost 3 vext3 <1,2,3,4>, <0,0,2,2>
- 3306285199U, // <4,0,0,3>: Cost 4 vrev <3,0,0,4>
- 2648064338U, // <4,0,0,4>: Cost 3 vext2 <5,1,4,0>, <0,4,1,5>
+ 3709862144U, // <4,0,0,3>: Cost 4 vext2 <3,1,4,0>, <0,3,1,4>
+ 2684682280U, // <4,0,0,4>: Cost 3 vext3 <0,0,4,4>, <0,0,4,4>
3694600633U, // <4,0,0,5>: Cost 4 vext2 <0,5,4,0>, <0,5,4,0>
- 3324203290U, // <4,0,0,6>: Cost 4 vrev <6,0,0,4>
- 3330175987U, // <4,0,0,7>: Cost 4 vrev <7,0,0,4>
+ 3291431290U, // <4,0,0,6>: Cost 4 vrev <0,4,6,0>
+ 3668342067U, // <4,0,0,7>: Cost 4 vext1 <7,4,0,0>, <7,4,0,0>
2691907657U, // <4,0,0,u>: Cost 3 vext3 <1,2,3,4>, <0,0,u,1>
2570715238U, // <4,0,1,0>: Cost 3 vext1 <3,4,0,1>, LHS
2570716058U, // <4,0,1,1>: Cost 3 vext1 <3,4,0,1>, <1,2,3,4>
@@ -2952,7 +2952,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2570717648U, // <4,0,1,3>: Cost 3 vext1 <3,4,0,1>, <3,4,0,1>
2570718518U, // <4,0,1,4>: Cost 3 vext1 <3,4,0,1>, RHS
2594607206U, // <4,0,1,5>: Cost 3 vext1 <7,4,0,1>, <5,6,7,4>
- 3721807091U, // <4,0,1,6>: Cost 4 vext2 <5,1,4,0>, <1,6,5,7>
+ 3662377563U, // <4,0,1,6>: Cost 4 vext1 <6,4,0,1>, <6,4,0,1>
2594608436U, // <4,0,1,7>: Cost 3 vext1 <7,4,0,1>, <7,4,0,1>
1618165916U, // <4,0,1,u>: Cost 2 vext3 <1,2,3,4>, LHS
2685714598U, // <4,0,2,0>: Cost 3 vext3 <0,2,0,4>, <0,2,0,4>
@@ -2960,19 +2960,19 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2685862072U, // <4,0,2,2>: Cost 3 vext3 <0,2,2,4>, <0,2,2,4>
2631476937U, // <4,0,2,3>: Cost 3 vext2 <2,3,4,0>, <2,3,4,0>
2685714636U, // <4,0,2,4>: Cost 3 vext3 <0,2,0,4>, <0,2,4,6>
- 3705218930U, // <4,0,2,5>: Cost 4 vext2 <2,3,4,0>, <2,5,4,7>
+ 3765649622U, // <4,0,2,5>: Cost 4 vext3 <1,2,3,4>, <0,2,5,7>
2686157020U, // <4,0,2,6>: Cost 3 vext3 <0,2,6,4>, <0,2,6,4>
- 3331503253U, // <4,0,2,7>: Cost 4 vrev <7,2,0,4>
+ 3668358453U, // <4,0,2,7>: Cost 4 vext1 <7,4,0,2>, <7,4,0,2>
2686304494U, // <4,0,2,u>: Cost 3 vext3 <0,2,u,4>, <0,2,u,4>
3632529510U, // <4,0,3,0>: Cost 4 vext1 <1,4,0,3>, LHS
2686451968U, // <4,0,3,1>: Cost 3 vext3 <0,3,1,4>, <0,3,1,4>
- 2228561577U, // <4,0,3,2>: Cost 3 vrev <2,3,0,4>
+ 2686525705U, // <4,0,3,2>: Cost 3 vext3 <0,3,2,4>, <0,3,2,4>
3760341266U, // <4,0,3,3>: Cost 4 vext3 <0,3,3,4>, <0,3,3,4>
3632532790U, // <4,0,3,4>: Cost 4 vext1 <1,4,0,3>, RHS
3913254606U, // <4,0,3,5>: Cost 4 vuzpr <3,4,5,0>, <2,3,4,5>
3705219740U, // <4,0,3,6>: Cost 4 vext2 <2,3,4,0>, <3,6,4,7>
- 3332166886U, // <4,0,3,7>: Cost 4 vrev <7,3,0,4>
- 2264397759U, // <4,0,3,u>: Cost 3 vrev <u,3,0,4>
+ 3713845990U, // <4,0,3,7>: Cost 4 vext2 <3,7,4,0>, <3,7,4,0>
+ 2686451968U, // <4,0,3,u>: Cost 3 vext3 <0,3,1,4>, <0,3,1,4>
2552823910U, // <4,0,4,0>: Cost 3 vext1 <0,4,0,4>, LHS
2691907922U, // <4,0,4,1>: Cost 3 vext3 <1,2,3,4>, <0,4,1,5>
2691907932U, // <4,0,4,2>: Cost 3 vext3 <1,2,3,4>, <0,4,2,6>
@@ -2980,13 +2980,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2552827190U, // <4,0,4,4>: Cost 3 vext1 <0,4,0,4>, RHS
2631478582U, // <4,0,4,5>: Cost 3 vext2 <2,3,4,0>, RHS
3626570017U, // <4,0,4,6>: Cost 4 vext1 <0,4,0,4>, <6,0,1,2>
- 3332830519U, // <4,0,4,7>: Cost 4 vrev <7,4,0,4>
+ 3668374839U, // <4,0,4,7>: Cost 4 vext1 <7,4,0,4>, <7,4,0,4>
2552829742U, // <4,0,4,u>: Cost 3 vext1 <0,4,0,4>, LHS
- 2570748006U, // <4,0,5,0>: Cost 3 vext1 <3,4,0,5>, LHS
+ 2558804070U, // <4,0,5,0>: Cost 3 vext1 <1,4,0,5>, LHS
1839644774U, // <4,0,5,1>: Cost 2 vzipl RHS, LHS
2913386660U, // <4,0,5,2>: Cost 3 vzipl RHS, <0,2,0,2>
- 2570750102U, // <4,0,5,3>: Cost 3 vext1 <3,4,0,5>, <3,0,1,2>
- 2570751286U, // <4,0,5,4>: Cost 3 vext1 <3,4,0,5>, RHS
+ 2570750420U, // <4,0,5,3>: Cost 3 vext1 <3,4,0,5>, <3,4,0,5>
+ 2558807350U, // <4,0,5,4>: Cost 3 vext1 <1,4,0,5>, RHS
3987128750U, // <4,0,5,5>: Cost 4 vzipl RHS, <0,5,2,7>
3987128822U, // <4,0,5,6>: Cost 4 vzipl RHS, <0,6,1,7>
2594641208U, // <4,0,5,7>: Cost 3 vext1 <7,4,0,5>, <7,4,0,5>
@@ -2996,45 +2996,45 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1973862502U, // <4,0,6,2>: Cost 2 vtrnl RHS, LHS
2570758613U, // <4,0,6,3>: Cost 3 vext1 <3,4,0,6>, <3,4,0,6>
2552843574U, // <4,0,6,4>: Cost 3 vext1 <0,4,0,6>, RHS
- 2656694991U, // <4,0,6,5>: Cost 3 vext2 <6,5,4,0>, <6,5,4,0>
- 3721810744U, // <4,0,6,6>: Cost 4 vext2 <5,1,4,0>, <6,6,6,6>
+ 2217664887U, // <4,0,6,5>: Cost 3 vrev <0,4,5,6>
+ 3662418528U, // <4,0,6,6>: Cost 4 vext1 <6,4,0,6>, <6,4,0,6>
2658022257U, // <4,0,6,7>: Cost 3 vext2 <6,7,4,0>, <6,7,4,0>
1973862556U, // <4,0,6,u>: Cost 2 vtrnl RHS, LHS
- 3721810938U, // <4,0,7,0>: Cost 4 vext2 <5,1,4,0>, <7,0,1,2>
- 2689106500U, // <4,0,7,1>: Cost 3 vext3 <0,7,1,4>, <0,7,1,4>
+ 3731764218U, // <4,0,7,0>: Cost 4 vext2 <6,7,4,0>, <7,0,1,2>
+ 3988324454U, // <4,0,7,1>: Cost 4 vzipl <4,7,5,0>, LHS
4122034278U, // <4,0,7,2>: Cost 4 vtrnl <4,6,7,1>, LHS
- 3310930630U, // <4,0,7,3>: Cost 4 vrev <3,7,0,4>
- 3721811302U, // <4,0,7,4>: Cost 4 vext2 <5,1,4,0>, <7,4,5,6>
- 3721811345U, // <4,0,7,5>: Cost 4 vext2 <5,1,4,0>, <7,5,1,4>
- 2255106897U, // <4,0,7,6>: Cost 3 vrev <6,7,0,4>
- 3721811564U, // <4,0,7,7>: Cost 4 vext2 <5,1,4,0>, <7,7,7,7>
- 2668639912U, // <4,0,7,u>: Cost 3 vext2 <u,5,4,0>, <7,u,5,4>
+ 3735082246U, // <4,0,7,3>: Cost 4 vext2 <7,3,4,0>, <7,3,4,0>
+ 3731764536U, // <4,0,7,4>: Cost 4 vext2 <6,7,4,0>, <7,4,0,5>
+ 3937145718U, // <4,0,7,5>: Cost 4 vuzpr <7,4,5,0>, <6,7,4,5>
+ 3737073145U, // <4,0,7,6>: Cost 4 vext2 <7,6,4,0>, <7,6,4,0>
+ 3731764844U, // <4,0,7,7>: Cost 4 vext2 <6,7,4,0>, <7,7,7,7>
+ 4122034332U, // <4,0,7,u>: Cost 4 vtrnl <4,6,7,1>, LHS
2552856678U, // <4,0,u,0>: Cost 3 vext1 <0,4,0,u>, LHS
1841635430U, // <4,0,u,1>: Cost 2 vzipl RHS, LHS
1618166429U, // <4,0,u,2>: Cost 2 vext3 <1,2,3,4>, LHS
2570774999U, // <4,0,u,3>: Cost 3 vext1 <3,4,0,u>, <3,4,0,u>
2552859958U, // <4,0,u,4>: Cost 3 vext1 <0,4,0,u>, RHS
2631481498U, // <4,0,u,5>: Cost 3 vext2 <2,3,4,0>, RHS
- 2255770530U, // <4,0,u,6>: Cost 3 vrev <6,u,0,4>
+ 2686157020U, // <4,0,u,6>: Cost 3 vext3 <0,2,6,4>, <0,2,6,4>
2594665787U, // <4,0,u,7>: Cost 3 vext1 <7,4,0,u>, <7,4,0,u>
1618166483U, // <4,0,u,u>: Cost 2 vext3 <1,2,3,4>, LHS
2617548837U, // <4,1,0,0>: Cost 3 vext2 <0,0,4,1>, <0,0,4,1>
2622857318U, // <4,1,0,1>: Cost 3 vext2 <0,u,4,1>, LHS
3693281484U, // <4,1,0,2>: Cost 4 vext2 <0,3,4,1>, <0,2,4,6>
- 2232617112U, // <4,1,0,3>: Cost 3 vrev <3,0,1,4>
+ 2691908342U, // <4,1,0,3>: Cost 3 vext3 <1,2,3,4>, <1,0,3,2>
2622857554U, // <4,1,0,4>: Cost 3 vext2 <0,u,4,1>, <0,4,1,5>
- 3694608826U, // <4,1,0,5>: Cost 4 vext2 <0,5,4,1>, <0,5,4,1>
+ 3764470538U, // <4,1,0,5>: Cost 4 vext3 <1,0,5,4>, <1,0,5,4>
3695272459U, // <4,1,0,6>: Cost 4 vext2 <0,6,4,1>, <0,6,4,1>
- 2256507900U, // <4,1,0,7>: Cost 3 vrev <7,0,1,4>
+ 3733094980U, // <4,1,0,7>: Cost 4 vext2 <7,0,4,1>, <0,7,1,4>
2622857885U, // <4,1,0,u>: Cost 3 vext2 <0,u,4,1>, LHS
- 2215362654U, // <4,1,1,0>: Cost 3 vrev <0,1,1,4>
- 2221335351U, // <4,1,1,1>: Cost 3 vrev <1,1,1,4>
+ 3696599798U, // <4,1,1,0>: Cost 4 vext2 <0,u,4,1>, <1,0,3,2>
+ 2691097399U, // <4,1,1,1>: Cost 3 vext3 <1,1,1,4>, <1,1,1,4>
2631484314U, // <4,1,1,2>: Cost 3 vext2 <2,3,4,1>, <1,2,3,4>
2691908424U, // <4,1,1,3>: Cost 3 vext3 <1,2,3,4>, <1,1,3,3>
3696600125U, // <4,1,1,4>: Cost 4 vext2 <0,u,4,1>, <1,4,3,5>
3696600175U, // <4,1,1,5>: Cost 4 vext2 <0,u,4,1>, <1,5,0,1>
3696600307U, // <4,1,1,6>: Cost 4 vext2 <0,u,4,1>, <1,6,5,7>
- 3330913357U, // <4,1,1,7>: Cost 4 vrev <7,1,1,4>
+ 3668423997U, // <4,1,1,7>: Cost 4 vext1 <7,4,1,1>, <7,4,1,1>
2691908469U, // <4,1,1,u>: Cost 3 vext3 <1,2,3,4>, <1,1,u,3>
2570797158U, // <4,1,2,0>: Cost 3 vext1 <3,4,1,2>, LHS
2570797978U, // <4,1,2,1>: Cost 3 vext1 <3,4,1,2>, <1,2,3,4>
@@ -3043,7 +3043,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2570800438U, // <4,1,2,4>: Cost 3 vext1 <3,4,1,2>, RHS
3765650347U, // <4,1,2,5>: Cost 4 vext3 <1,2,3,4>, <1,2,5,3>
3696601018U, // <4,1,2,6>: Cost 4 vext2 <0,u,4,1>, <2,6,3,7>
- 3331576990U, // <4,1,2,7>: Cost 4 vrev <7,2,1,4>
+ 3668432190U, // <4,1,2,7>: Cost 4 vext1 <7,4,1,2>, <7,4,1,2>
1618535367U, // <4,1,2,u>: Cost 2 vext3 <1,2,u,4>, <1,2,u,4>
2564833382U, // <4,1,3,0>: Cost 3 vext1 <2,4,1,3>, LHS
2691908568U, // <4,1,3,1>: Cost 3 vext3 <1,2,3,4>, <1,3,1,3>
@@ -3060,15 +3060,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3113877606U, // <4,1,4,3>: Cost 3 vtrnr <4,4,4,4>, LHS
3760194630U, // <4,1,4,4>: Cost 4 vext3 <0,3,1,4>, <1,4,4,5>
2622860598U, // <4,1,4,5>: Cost 3 vext2 <0,u,4,1>, RHS
- 3767198807U, // <4,1,4,6>: Cost 4 vext3 <1,4,6,4>, <1,4,6,4>
+ 3297436759U, // <4,1,4,6>: Cost 4 vrev <1,4,6,4>
3800007772U, // <4,1,4,7>: Cost 4 vext3 <7,0,1,4>, <1,4,7,0>
2622860841U, // <4,1,4,u>: Cost 3 vext2 <0,u,4,1>, RHS
1479164006U, // <4,1,5,0>: Cost 2 vext1 <0,4,1,5>, LHS
- 2552906548U, // <4,1,5,1>: Cost 3 vext1 <0,4,1,5>, <1,1,1,1>
+ 2552906486U, // <4,1,5,1>: Cost 3 vext1 <0,4,1,5>, <1,0,3,2>
2552907299U, // <4,1,5,2>: Cost 3 vext1 <0,4,1,5>, <2,1,3,5>
2552907926U, // <4,1,5,3>: Cost 3 vext1 <0,4,1,5>, <3,0,1,2>
1479167286U, // <4,1,5,4>: Cost 2 vext1 <0,4,1,5>, RHS
- 2552909490U, // <4,1,5,5>: Cost 3 vext1 <0,4,1,5>, <5,1,4,0>
+ 2913387664U, // <4,1,5,5>: Cost 3 vzipl RHS, <1,5,3,7>
2600686074U, // <4,1,5,6>: Cost 3 vext1 <u,4,1,5>, <6,2,7,3>
2600686586U, // <4,1,5,7>: Cost 3 vext1 <u,4,1,5>, <7,0,1,2>
1479169838U, // <4,1,5,u>: Cost 2 vext1 <0,4,1,5>, LHS
@@ -3077,8 +3077,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
4028205206U, // <4,1,6,2>: Cost 4 vzipr <0,2,4,6>, <3,0,1,2>
3089858662U, // <4,1,6,3>: Cost 3 vtrnr <0,4,2,6>, LHS
2552917302U, // <4,1,6,4>: Cost 3 vext1 <0,4,1,6>, RHS
- 3047605248U, // <4,1,6,5>: Cost 3 vtrnl RHS, <1,3,5,7>
- 3626660235U, // <4,1,6,6>: Cost 4 vext1 <0,4,1,6>, <6,1,4,0>
+ 2223637584U, // <4,1,6,5>: Cost 3 vrev <1,4,5,6>
+ 4121347081U, // <4,1,6,6>: Cost 4 vtrnl RHS, <1,3,6,7>
3721155406U, // <4,1,6,7>: Cost 4 vext2 <5,0,4,1>, <6,7,0,1>
2552919854U, // <4,1,6,u>: Cost 3 vext1 <0,4,1,6>, LHS
2659357716U, // <4,1,7,0>: Cost 3 vext2 <7,0,4,1>, <7,0,4,1>
@@ -3087,51 +3087,51 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2695226671U, // <4,1,7,3>: Cost 3 vext3 <1,7,3,4>, <1,7,3,4>
3721155942U, // <4,1,7,4>: Cost 4 vext2 <5,0,4,1>, <7,4,5,6>
3721155976U, // <4,1,7,5>: Cost 4 vext2 <5,0,4,1>, <7,5,0,4>
- 3721156102U, // <4,1,7,6>: Cost 4 vext2 <5,0,4,1>, <7,6,5,4>
+ 3662500458U, // <4,1,7,6>: Cost 4 vext1 <6,4,1,7>, <6,4,1,7>
3721156204U, // <4,1,7,7>: Cost 4 vext2 <5,0,4,1>, <7,7,7,7>
2659357716U, // <4,1,7,u>: Cost 3 vext2 <7,0,4,1>, <7,0,4,1>
1479188582U, // <4,1,u,0>: Cost 2 vext1 <0,4,1,u>, LHS
- 2552931124U, // <4,1,u,1>: Cost 3 vext1 <0,4,1,u>, <1,1,1,1>
+ 2552931062U, // <4,1,u,1>: Cost 3 vext1 <0,4,1,u>, <1,0,3,2>
2552931944U, // <4,1,u,2>: Cost 3 vext1 <0,4,1,u>, <2,2,2,2>
1622148480U, // <4,1,u,3>: Cost 2 vext3 <1,u,3,4>, <1,u,3,4>
1479191862U, // <4,1,u,4>: Cost 2 vext1 <0,4,1,u>, RHS
2622863514U, // <4,1,u,5>: Cost 3 vext2 <0,u,4,1>, RHS
- 2588766827U, // <4,1,u,6>: Cost 3 vext1 <6,4,1,u>, <6,4,1,u>
- 2261816964U, // <4,1,u,7>: Cost 3 vrev <7,u,1,4>
+ 2588725862U, // <4,1,u,6>: Cost 3 vext1 <6,4,1,3>, <6,4,1,3>
+ 2600686586U, // <4,1,u,7>: Cost 3 vext1 <u,4,1,5>, <7,0,1,2>
1479194414U, // <4,1,u,u>: Cost 2 vext1 <0,4,1,u>, LHS
- 2588770406U, // <4,2,0,0>: Cost 3 vext1 <6,4,2,0>, LHS
+ 2617557030U, // <4,2,0,0>: Cost 3 vext2 <0,0,4,2>, <0,0,4,2>
2622865510U, // <4,2,0,1>: Cost 3 vext2 <0,u,4,2>, LHS
2622865612U, // <4,2,0,2>: Cost 3 vext2 <0,u,4,2>, <0,2,4,6>
- 2232690849U, // <4,2,0,3>: Cost 3 vrev <3,0,2,4>
+ 3693289753U, // <4,2,0,3>: Cost 4 vext2 <0,3,4,2>, <0,3,4,2>
2635473244U, // <4,2,0,4>: Cost 3 vext2 <3,0,4,2>, <0,4,2,6>
3765650918U, // <4,2,0,5>: Cost 4 vext3 <1,2,3,4>, <2,0,5,7>
- 2250608940U, // <4,2,0,6>: Cost 3 vrev <6,0,2,4>
- 2256581637U, // <4,2,0,7>: Cost 3 vrev <7,0,2,4>
+ 2696775148U, // <4,2,0,6>: Cost 3 vext3 <2,0,6,4>, <2,0,6,4>
+ 3695944285U, // <4,2,0,7>: Cost 4 vext2 <0,7,4,2>, <0,7,4,2>
2622866077U, // <4,2,0,u>: Cost 3 vext2 <0,u,4,2>, LHS
- 2215436391U, // <4,2,1,0>: Cost 3 vrev <0,1,2,4>
+ 3696607990U, // <4,2,1,0>: Cost 4 vext2 <0,u,4,2>, <1,0,3,2>
3696608052U, // <4,2,1,1>: Cost 4 vext2 <0,u,4,2>, <1,1,1,1>
3696608150U, // <4,2,1,2>: Cost 4 vext2 <0,u,4,2>, <1,2,3,0>
3895574630U, // <4,2,1,3>: Cost 4 vuzpr <0,4,u,2>, LHS
2691909162U, // <4,2,1,4>: Cost 3 vext3 <1,2,3,4>, <2,1,4,3>
3696608400U, // <4,2,1,5>: Cost 4 vext2 <0,u,4,2>, <1,5,3,7>
3760784956U, // <4,2,1,6>: Cost 4 vext3 <0,4,0,4>, <2,1,6,3>
- 3330987094U, // <4,2,1,7>: Cost 4 vrev <7,1,2,4>
- 2263217967U, // <4,2,1,u>: Cost 3 vrev <u,1,2,4>
- 2216100024U, // <4,2,2,0>: Cost 3 vrev <0,2,2,4>
+ 3773908549U, // <4,2,1,7>: Cost 5 vext3 <2,5,7,4>, <2,1,7,3>
+ 2691909162U, // <4,2,1,u>: Cost 3 vext3 <1,2,3,4>, <2,1,4,3>
+ 3696608748U, // <4,2,2,0>: Cost 4 vext2 <0,u,4,2>, <2,0,6,4>
3696608828U, // <4,2,2,1>: Cost 4 vext2 <0,u,4,2>, <2,1,6,3>
2691909224U, // <4,2,2,2>: Cost 3 vext3 <1,2,3,4>, <2,2,2,2>
2691909234U, // <4,2,2,3>: Cost 3 vext3 <1,2,3,4>, <2,2,3,3>
3759605368U, // <4,2,2,4>: Cost 4 vext3 <0,2,2,4>, <2,2,4,0>
3696609156U, // <4,2,2,5>: Cost 4 vext2 <0,u,4,2>, <2,5,6,7>
3760785040U, // <4,2,2,6>: Cost 4 vext3 <0,4,0,4>, <2,2,6,6>
- 3331650727U, // <4,2,2,7>: Cost 4 vrev <7,2,2,4>
+ 3668505927U, // <4,2,2,7>: Cost 4 vext1 <7,4,2,2>, <7,4,2,2>
2691909279U, // <4,2,2,u>: Cost 3 vext3 <1,2,3,4>, <2,2,u,3>
2691909286U, // <4,2,3,0>: Cost 3 vext3 <1,2,3,4>, <2,3,0,1>
3764840111U, // <4,2,3,1>: Cost 4 vext3 <1,1,1,4>, <2,3,1,1>
- 3696609590U, // <4,2,3,2>: Cost 4 vext2 <0,u,4,2>, <3,2,1,0>
+ 3765651129U, // <4,2,3,2>: Cost 4 vext3 <1,2,3,4>, <2,3,2,2>
2698544836U, // <4,2,3,3>: Cost 3 vext3 <2,3,3,4>, <2,3,3,4>
2685863630U, // <4,2,3,4>: Cost 3 vext3 <0,2,2,4>, <2,3,4,5>
- 3772434134U, // <4,2,3,5>: Cost 4 vext3 <2,3,5,4>, <2,3,5,4>
+ 2698692310U, // <4,2,3,5>: Cost 3 vext3 <2,3,5,4>, <2,3,5,4>
3772507871U, // <4,2,3,6>: Cost 4 vext3 <2,3,6,4>, <2,3,6,4>
2698839784U, // <4,2,3,7>: Cost 3 vext3 <2,3,7,4>, <2,3,7,4>
2691909358U, // <4,2,3,u>: Cost 3 vext3 <1,2,3,4>, <2,3,u,1>
@@ -3141,7 +3141,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2699208469U, // <4,2,4,3>: Cost 3 vext3 <2,4,3,4>, <2,4,3,4>
2564918582U, // <4,2,4,4>: Cost 3 vext1 <2,4,2,4>, RHS
2622868790U, // <4,2,4,5>: Cost 3 vext2 <0,u,4,2>, RHS
- 2699429680U, // <4,2,4,6>: Cost 3 vext3 <2,4,6,4>, <2,4,6,4>
+ 2229667632U, // <4,2,4,6>: Cost 3 vrev <2,4,6,4>
3800082229U, // <4,2,4,7>: Cost 4 vext3 <7,0,2,4>, <2,4,7,0>
2622869033U, // <4,2,4,u>: Cost 3 vext2 <0,u,4,2>, RHS
2552979558U, // <4,2,5,0>: Cost 3 vext1 <0,4,2,5>, LHS
@@ -3149,17 +3149,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2564925032U, // <4,2,5,2>: Cost 3 vext1 <2,4,2,5>, <2,2,2,2>
2967060582U, // <4,2,5,3>: Cost 3 vzipr <2,3,4,5>, LHS
2552982838U, // <4,2,5,4>: Cost 3 vext1 <0,4,2,5>, RHS
- 3626725123U, // <4,2,5,5>: Cost 4 vext1 <0,4,2,5>, <5,2,4,0>
+ 3987130190U, // <4,2,5,5>: Cost 4 vzipl RHS, <2,5,0,7>
2913388474U, // <4,2,5,6>: Cost 3 vzipl RHS, <2,6,3,7>
3895577910U, // <4,2,5,7>: Cost 4 vuzpr <0,4,u,2>, RHS
2552985390U, // <4,2,5,u>: Cost 3 vext1 <0,4,2,5>, LHS
1479245926U, // <4,2,6,0>: Cost 2 vext1 <0,4,2,6>, LHS
- 2552988468U, // <4,2,6,1>: Cost 3 vext1 <0,4,2,6>, <1,1,1,1>
+ 2552988406U, // <4,2,6,1>: Cost 3 vext1 <0,4,2,6>, <1,0,3,2>
2552989288U, // <4,2,6,2>: Cost 3 vext1 <0,4,2,6>, <2,2,2,2>
2954461286U, // <4,2,6,3>: Cost 3 vzipr <0,2,4,6>, LHS
1479249206U, // <4,2,6,4>: Cost 2 vext1 <0,4,2,6>, RHS
- 2600767184U, // <4,2,6,5>: Cost 3 vext1 <u,4,2,6>, <5,1,7,3>
- 2552992220U, // <4,2,6,6>: Cost 3 vext1 <0,4,2,6>, <6,2,4,0>
+ 2229610281U, // <4,2,6,5>: Cost 3 vrev <2,4,5,6>
+ 2600767994U, // <4,2,6,6>: Cost 3 vext1 <u,4,2,6>, <6,2,7,3>
2600768506U, // <4,2,6,7>: Cost 3 vext1 <u,4,2,6>, <7,0,1,2>
1479251758U, // <4,2,6,u>: Cost 2 vext1 <0,4,2,6>, LHS
2659365909U, // <4,2,7,0>: Cost 3 vext2 <7,0,4,2>, <7,0,4,2>
@@ -3167,17 +3167,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3734434999U, // <4,2,7,2>: Cost 4 vext2 <7,2,4,2>, <7,2,4,2>
2701199368U, // <4,2,7,3>: Cost 3 vext3 <2,7,3,4>, <2,7,3,4>
4175774618U, // <4,2,7,4>: Cost 4 vtrnr <2,4,5,7>, <1,2,3,4>
- 3323023498U, // <4,2,7,5>: Cost 4 vrev <5,7,2,4>
+ 3303360298U, // <4,2,7,5>: Cost 4 vrev <2,4,5,7>
3727136217U, // <4,2,7,6>: Cost 4 vext2 <6,0,4,2>, <7,6,0,4>
3727136364U, // <4,2,7,7>: Cost 4 vext2 <6,0,4,2>, <7,7,7,7>
2659365909U, // <4,2,7,u>: Cost 3 vext2 <7,0,4,2>, <7,0,4,2>
1479262310U, // <4,2,u,0>: Cost 2 vext1 <0,4,2,u>, LHS
- 2553004852U, // <4,2,u,1>: Cost 3 vext1 <0,4,2,u>, <1,1,1,1>
+ 2553004790U, // <4,2,u,1>: Cost 3 vext1 <0,4,2,u>, <1,0,3,2>
2553005672U, // <4,2,u,2>: Cost 3 vext1 <0,4,2,u>, <2,2,2,2>
2954477670U, // <4,2,u,3>: Cost 3 vzipr <0,2,4,u>, LHS
1479265590U, // <4,2,u,4>: Cost 2 vext1 <0,4,2,u>, RHS
2622871706U, // <4,2,u,5>: Cost 3 vext2 <0,u,4,2>, RHS
- 2702084212U, // <4,2,u,6>: Cost 3 vext3 <2,u,6,4>, <2,u,6,4>
+ 2229700404U, // <4,2,u,6>: Cost 3 vrev <2,4,6,u>
2600784890U, // <4,2,u,7>: Cost 3 vext1 <u,4,2,u>, <7,0,1,2>
1479268142U, // <4,2,u,u>: Cost 2 vext1 <0,4,2,u>, LHS
3765651595U, // <4,3,0,0>: Cost 4 vext3 <1,2,3,4>, <3,0,0,0>
@@ -3185,44 +3185,44 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2702452897U, // <4,3,0,2>: Cost 3 vext3 <3,0,2,4>, <3,0,2,4>
3693297946U, // <4,3,0,3>: Cost 4 vext2 <0,3,4,3>, <0,3,4,3>
3760711856U, // <4,3,0,4>: Cost 4 vext3 <0,3,u,4>, <3,0,4,1>
- 4181690062U, // <4,3,0,5>: Cost 4 vtrnr <3,4,5,0>, <2,3,4,5>
- 3324424501U, // <4,3,0,6>: Cost 4 vrev <6,0,3,4>
- 3330397198U, // <4,3,0,7>: Cost 4 vrev <7,0,3,4>
+ 2235533820U, // <4,3,0,5>: Cost 3 vrev <3,4,5,0>
+ 3309349381U, // <4,3,0,6>: Cost 4 vrev <3,4,6,0>
+ 3668563278U, // <4,3,0,7>: Cost 4 vext1 <7,4,3,0>, <7,4,3,0>
2691909845U, // <4,3,0,u>: Cost 3 vext3 <1,2,3,4>, <3,0,u,2>
- 3626762342U, // <4,3,1,0>: Cost 4 vext1 <0,4,3,1>, LHS
+ 2235173328U, // <4,3,1,0>: Cost 3 vrev <3,4,0,1>
3764840678U, // <4,3,1,1>: Cost 4 vext3 <1,1,1,4>, <3,1,1,1>
2630173594U, // <4,3,1,2>: Cost 3 vext2 <2,1,4,3>, <1,2,3,4>
- 2233428219U, // <4,3,1,3>: Cost 3 vrev <3,1,3,4>
+ 2703190267U, // <4,3,1,3>: Cost 3 vext3 <3,1,3,4>, <3,1,3,4>
3760195840U, // <4,3,1,4>: Cost 4 vext3 <0,3,1,4>, <3,1,4,0>
3765651724U, // <4,3,1,5>: Cost 4 vext3 <1,2,3,4>, <3,1,5,3>
- 3325088134U, // <4,3,1,6>: Cost 4 vrev <6,1,3,4>
+ 3309357574U, // <4,3,1,6>: Cost 4 vrev <3,4,6,1>
3769633054U, // <4,3,1,7>: Cost 4 vext3 <1,u,3,4>, <3,1,7,3>
2703558952U, // <4,3,1,u>: Cost 3 vext3 <3,1,u,4>, <3,1,u,4>
- 2582888550U, // <4,3,2,0>: Cost 3 vext1 <5,4,3,2>, LHS
- 1148404634U, // <4,3,2,1>: Cost 2 vrev <1,2,3,4>
- 2582890190U, // <4,3,2,2>: Cost 3 vext1 <5,4,3,2>, <2,3,4,5>
- 2234091852U, // <4,3,2,3>: Cost 3 vrev <3,2,3,4>
- 2582891830U, // <4,3,2,4>: Cost 3 vext1 <5,4,3,2>, RHS
- 2246037246U, // <4,3,2,5>: Cost 3 vrev <5,2,3,4>
+ 3626770534U, // <4,3,2,0>: Cost 4 vext1 <0,4,3,2>, LHS
+ 2630174250U, // <4,3,2,1>: Cost 3 vext2 <2,1,4,3>, <2,1,4,3>
+ 3765651777U, // <4,3,2,2>: Cost 4 vext3 <1,2,3,4>, <3,2,2,2>
+ 2703853900U, // <4,3,2,3>: Cost 3 vext3 <3,2,3,4>, <3,2,3,4>
+ 3626773814U, // <4,3,2,4>: Cost 4 vext1 <0,4,3,2>, RHS
+ 2704001374U, // <4,3,2,5>: Cost 3 vext3 <3,2,5,4>, <3,2,5,4>
3765651814U, // <4,3,2,6>: Cost 4 vext3 <1,2,3,4>, <3,2,6,3>
- 2257982640U, // <4,3,2,7>: Cost 3 vrev <7,2,3,4>
- 1190213513U, // <4,3,2,u>: Cost 2 vrev <u,2,3,4>
+ 3769633135U, // <4,3,2,7>: Cost 4 vext3 <1,u,3,4>, <3,2,7,3>
+ 2634819681U, // <4,3,2,u>: Cost 3 vext2 <2,u,4,3>, <2,u,4,3>
3765651839U, // <4,3,3,0>: Cost 4 vext3 <1,2,3,4>, <3,3,0,1>
- 2222810091U, // <4,3,3,1>: Cost 3 vrev <1,3,3,4>
- 2228782788U, // <4,3,3,2>: Cost 3 vrev <2,3,3,4>
+ 3765651848U, // <4,3,3,1>: Cost 4 vext3 <1,2,3,4>, <3,3,1,1>
+ 3710552404U, // <4,3,3,2>: Cost 4 vext2 <3,2,4,3>, <3,2,4,3>
2691910044U, // <4,3,3,3>: Cost 3 vext3 <1,2,3,4>, <3,3,3,3>
2704591270U, // <4,3,3,4>: Cost 3 vext3 <3,3,4,4>, <3,3,4,4>
3769633202U, // <4,3,3,5>: Cost 4 vext3 <1,u,3,4>, <3,3,5,7>
3703917212U, // <4,3,3,6>: Cost 4 vext2 <2,1,4,3>, <3,6,4,7>
3769633220U, // <4,3,3,7>: Cost 4 vext3 <1,u,3,4>, <3,3,7,7>
- 2264618970U, // <4,3,3,u>: Cost 3 vrev <u,3,3,4>
+ 2691910044U, // <4,3,3,u>: Cost 3 vext3 <1,2,3,4>, <3,3,3,3>
2691910096U, // <4,3,4,0>: Cost 3 vext3 <1,2,3,4>, <3,4,0,1>
2691910106U, // <4,3,4,1>: Cost 3 vext3 <1,2,3,4>, <3,4,1,2>
2564990741U, // <4,3,4,2>: Cost 3 vext1 <2,4,3,4>, <2,4,3,4>
3765651946U, // <4,3,4,3>: Cost 4 vext3 <1,2,3,4>, <3,4,3,0>
2691910136U, // <4,3,4,4>: Cost 3 vext3 <1,2,3,4>, <3,4,4,5>
2686454274U, // <4,3,4,5>: Cost 3 vext3 <0,3,1,4>, <3,4,5,6>
- 2705402377U, // <4,3,4,6>: Cost 3 vext3 <3,4,6,4>, <3,4,6,4>
+ 2235640329U, // <4,3,4,6>: Cost 3 vrev <3,4,6,4>
3801483792U, // <4,3,4,7>: Cost 4 vext3 <7,2,3,4>, <3,4,7,2>
2691910168U, // <4,3,4,u>: Cost 3 vext3 <1,2,3,4>, <3,4,u,1>
2559025254U, // <4,3,5,0>: Cost 3 vext1 <1,4,3,5>, LHS
@@ -3231,7 +3231,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2570971548U, // <4,3,5,3>: Cost 3 vext1 <3,4,3,5>, <3,3,3,3>
2559028534U, // <4,3,5,4>: Cost 3 vext1 <1,4,3,5>, RHS
4163519477U, // <4,3,5,5>: Cost 4 vtrnr <0,4,1,5>, <1,3,4,5>
- 3987131000U, // <4,3,5,6>: Cost 4 vzipl RHS, <3,6,0,7>
+ 3309390346U, // <4,3,5,6>: Cost 4 vrev <3,4,6,5>
2706139747U, // <4,3,5,7>: Cost 3 vext3 <3,5,7,4>, <3,5,7,4>
2559031086U, // <4,3,5,u>: Cost 3 vext1 <1,4,3,5>, LHS
2559033446U, // <4,3,6,0>: Cost 3 vext1 <1,4,3,6>, LHS
@@ -3239,28 +3239,28 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2565007127U, // <4,3,6,2>: Cost 3 vext1 <2,4,3,6>, <2,4,3,6>
2570979740U, // <4,3,6,3>: Cost 3 vext1 <3,4,3,6>, <3,3,3,3>
2559036726U, // <4,3,6,4>: Cost 3 vext1 <1,4,3,6>, RHS
- 3047606786U, // <4,3,6,5>: Cost 3 vtrnl RHS, <3,4,5,6>
+ 1161841154U, // <4,3,6,5>: Cost 2 vrev <3,4,5,6>
4028203932U, // <4,3,6,6>: Cost 4 vzipr <0,2,4,6>, <1,2,3,6>
2706803380U, // <4,3,6,7>: Cost 3 vext3 <3,6,7,4>, <3,6,7,4>
- 2559039278U, // <4,3,6,u>: Cost 3 vext1 <1,4,3,6>, LHS
+ 1162062365U, // <4,3,6,u>: Cost 2 vrev <3,4,u,6>
3769633475U, // <4,3,7,0>: Cost 4 vext3 <1,u,3,4>, <3,7,0,1>
- 2225464623U, // <4,3,7,1>: Cost 3 vrev <1,7,3,4>
- 2231437320U, // <4,3,7,2>: Cost 3 vrev <2,7,3,4>
+ 3769633488U, // <4,3,7,1>: Cost 4 vext3 <1,u,3,4>, <3,7,1,5>
+ 3638757144U, // <4,3,7,2>: Cost 4 vext1 <2,4,3,7>, <2,4,3,7>
3769633508U, // <4,3,7,3>: Cost 4 vext3 <1,u,3,4>, <3,7,3,7>
3769633515U, // <4,3,7,4>: Cost 4 vext3 <1,u,3,4>, <3,7,4,5>
3769633526U, // <4,3,7,5>: Cost 4 vext3 <1,u,3,4>, <3,7,5,7>
- 2255328108U, // <4,3,7,6>: Cost 3 vrev <6,7,3,4>
+ 3662647932U, // <4,3,7,6>: Cost 4 vext1 <6,4,3,7>, <6,4,3,7>
3781208837U, // <4,3,7,7>: Cost 4 vext3 <3,7,7,4>, <3,7,7,4>
- 2267273502U, // <4,3,7,u>: Cost 3 vrev <u,7,3,4>
+ 3769633547U, // <4,3,7,u>: Cost 4 vext3 <1,u,3,4>, <3,7,u,1>
2559049830U, // <4,3,u,0>: Cost 3 vext1 <1,4,3,u>, LHS
- 1152386432U, // <4,3,u,1>: Cost 2 vrev <1,u,3,4>
+ 2691910430U, // <4,3,u,1>: Cost 3 vext3 <1,2,3,4>, <3,u,1,2>
2565023513U, // <4,3,u,2>: Cost 3 vext1 <2,4,3,u>, <2,4,3,u>
- 2238073650U, // <4,3,u,3>: Cost 3 vrev <3,u,3,4>
+ 2707835698U, // <4,3,u,3>: Cost 3 vext3 <3,u,3,4>, <3,u,3,4>
2559053110U, // <4,3,u,4>: Cost 3 vext1 <1,4,3,u>, RHS
- 2691910470U, // <4,3,u,5>: Cost 3 vext3 <1,2,3,4>, <3,u,5,6>
- 2255991741U, // <4,3,u,6>: Cost 3 vrev <6,u,3,4>
+ 1161857540U, // <4,3,u,5>: Cost 2 vrev <3,4,5,u>
+ 2235673101U, // <4,3,u,6>: Cost 3 vrev <3,4,6,u>
2708130646U, // <4,3,u,7>: Cost 3 vext3 <3,u,7,4>, <3,u,7,4>
- 1194195311U, // <4,3,u,u>: Cost 2 vrev <u,u,3,4>
+ 1162078751U, // <4,3,u,u>: Cost 2 vrev <3,4,u,u>
2617573416U, // <4,4,0,0>: Cost 3 vext2 <0,0,4,4>, <0,0,4,4>
1570373734U, // <4,4,0,1>: Cost 2 vext2 <4,4,4,4>, LHS
2779676774U, // <4,4,0,2>: Cost 3 vuzpl <4,6,4,6>, LHS
@@ -3268,9 +3268,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2576977100U, // <4,4,0,4>: Cost 3 vext1 <4,4,4,0>, <4,4,4,0>
2718747538U, // <4,4,0,5>: Cost 3 vext3 <5,6,7,4>, <4,0,5,1>
2718747548U, // <4,4,0,6>: Cost 3 vext3 <5,6,7,4>, <4,0,6,2>
- 3798608809U, // <4,4,0,7>: Cost 4 vext3 <6,7,0,4>, <4,0,7,6>
+ 3668637015U, // <4,4,0,7>: Cost 4 vext1 <7,4,4,0>, <7,4,4,0>
1570374301U, // <4,4,0,u>: Cost 2 vext2 <4,4,4,4>, LHS
- 3626836070U, // <4,4,1,0>: Cost 4 vext1 <0,4,4,1>, LHS
+ 2644116214U, // <4,4,1,0>: Cost 3 vext2 <4,4,4,4>, <1,0,3,2>
2644116276U, // <4,4,1,1>: Cost 3 vext2 <4,4,4,4>, <1,1,1,1>
2691910602U, // <4,4,1,2>: Cost 3 vext3 <1,2,3,4>, <4,1,2,3>
2644116440U, // <4,4,1,3>: Cost 3 vext2 <4,4,4,4>, <1,3,1,3>
@@ -3280,7 +3280,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3768970231U, // <4,4,1,7>: Cost 4 vext3 <1,7,3,4>, <4,1,7,3>
2695891968U, // <4,4,1,u>: Cost 3 vext3 <1,u,3,4>, <4,1,u,3>
3703260634U, // <4,4,2,0>: Cost 4 vext2 <2,0,4,4>, <2,0,4,4>
- 3705251370U, // <4,4,2,1>: Cost 4 vext2 <2,3,4,4>, <2,1,4,3>
+ 3765652499U, // <4,4,2,1>: Cost 4 vext3 <1,2,3,4>, <4,2,1,4>
2644117096U, // <4,4,2,2>: Cost 3 vext2 <4,4,4,4>, <2,2,2,2>
2631509709U, // <4,4,2,3>: Cost 3 vext2 <2,3,4,4>, <2,3,4,4>
2644117269U, // <4,4,2,4>: Cost 3 vext2 <4,4,4,4>, <2,4,3,4>
@@ -3290,21 +3290,21 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2634827874U, // <4,4,2,u>: Cost 3 vext2 <2,u,4,4>, <2,u,4,4>
2644117654U, // <4,4,3,0>: Cost 3 vext2 <4,4,4,4>, <3,0,1,2>
3638797210U, // <4,4,3,1>: Cost 4 vext1 <2,4,4,3>, <1,2,3,4>
- 2691910762U, // <4,4,3,2>: Cost 3 vext3 <1,2,3,4>, <4,3,2,1>
+ 3638798082U, // <4,4,3,2>: Cost 4 vext1 <2,4,4,3>, <2,4,1,3>
2637482406U, // <4,4,3,3>: Cost 3 vext2 <3,3,4,4>, <3,3,4,4>
2638146039U, // <4,4,3,4>: Cost 3 vext2 <3,4,4,4>, <3,4,4,4>
3913287374U, // <4,4,3,5>: Cost 4 vuzpr <3,4,5,4>, <2,3,4,5>
3765652625U, // <4,4,3,6>: Cost 4 vext3 <1,2,3,4>, <4,3,6,4>
- 3798830236U, // <4,4,3,7>: Cost 4 vext3 <6,7,3,4>, <4,3,7,6>
- 2695892128U, // <4,4,3,u>: Cost 3 vext3 <1,u,3,4>, <4,3,u,1>
+ 3713878762U, // <4,4,3,7>: Cost 4 vext2 <3,7,4,4>, <3,7,4,4>
+ 2637482406U, // <4,4,3,u>: Cost 3 vext2 <3,3,4,4>, <3,3,4,4>
1503264870U, // <4,4,4,0>: Cost 2 vext1 <4,4,4,4>, LHS
2577007514U, // <4,4,4,1>: Cost 3 vext1 <4,4,4,4>, <1,2,3,4>
2577008232U, // <4,4,4,2>: Cost 3 vext1 <4,4,4,4>, <2,2,2,2>
- 2235492855U, // <4,4,4,3>: Cost 3 vrev <3,4,4,4>
+ 2571037175U, // <4,4,4,3>: Cost 3 vext1 <3,4,4,4>, <3,4,4,4>
161926454U, // <4,4,4,4>: Cost 1 vdup0 RHS
1570377014U, // <4,4,4,5>: Cost 2 vext2 <4,4,4,4>, RHS
2779680054U, // <4,4,4,6>: Cost 3 vuzpl <4,6,4,6>, RHS
- 2259383643U, // <4,4,4,7>: Cost 3 vrev <7,4,4,4>
+ 2594927963U, // <4,4,4,7>: Cost 3 vext1 <7,4,4,4>, <7,4,4,4>
161926454U, // <4,4,4,u>: Cost 1 vdup0 RHS
2571042918U, // <4,4,5,0>: Cost 3 vext1 <3,4,4,5>, LHS
2571043738U, // <4,4,5,1>: Cost 3 vext1 <3,4,4,5>, <1,2,3,4>
@@ -3316,26 +3316,26 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2594936156U, // <4,4,5,7>: Cost 3 vext1 <7,4,4,5>, <7,4,4,5>
1618169160U, // <4,4,5,u>: Cost 2 vext3 <1,2,3,4>, RHS
2553135206U, // <4,4,6,0>: Cost 3 vext1 <0,4,4,6>, LHS
- 3626877748U, // <4,4,6,1>: Cost 4 vext1 <0,4,4,6>, <1,1,1,1>
+ 3626877686U, // <4,4,6,1>: Cost 4 vext1 <0,4,4,6>, <1,0,3,2>
2565080782U, // <4,4,6,2>: Cost 3 vext1 <2,4,4,6>, <2,3,4,5>
2571053561U, // <4,4,6,3>: Cost 3 vext1 <3,4,4,6>, <3,4,4,6>
2553138486U, // <4,4,6,4>: Cost 3 vext1 <0,4,4,6>, RHS
- 3047607186U, // <4,4,6,5>: Cost 3 vtrnl RHS, <4,0,5,1>
+ 2241555675U, // <4,4,6,5>: Cost 3 vrev <4,4,5,6>
1973865782U, // <4,4,6,6>: Cost 2 vtrnl RHS, RHS
2658055029U, // <4,4,6,7>: Cost 3 vext2 <6,7,4,4>, <6,7,4,4>
1973865800U, // <4,4,6,u>: Cost 2 vtrnl RHS, RHS
2644120570U, // <4,4,7,0>: Cost 3 vext2 <4,4,4,4>, <7,0,1,2>
3638829978U, // <4,4,7,1>: Cost 4 vext1 <2,4,4,7>, <1,2,3,4>
3638830881U, // <4,4,7,2>: Cost 4 vext1 <2,4,4,7>, <2,4,4,7>
- 3790499259U, // <4,4,7,3>: Cost 4 vext3 <5,3,7,4>, <4,7,3,5>
+ 3735115018U, // <4,4,7,3>: Cost 4 vext2 <7,3,4,4>, <7,3,4,4>
2662036827U, // <4,4,7,4>: Cost 3 vext2 <7,4,4,4>, <7,4,4,4>
2713292236U, // <4,4,7,5>: Cost 3 vext3 <4,7,5,4>, <4,7,5,4>
- 2718748118U, // <4,4,7,6>: Cost 3 vext3 <5,6,7,4>, <4,7,6,5>
+ 2713365973U, // <4,4,7,6>: Cost 3 vext3 <4,7,6,4>, <4,7,6,4>
2644121196U, // <4,4,7,7>: Cost 3 vext2 <4,4,4,4>, <7,7,7,7>
- 2720075240U, // <4,4,7,u>: Cost 3 vext3 <5,u,7,4>, <4,7,u,5>
+ 2662036827U, // <4,4,7,u>: Cost 3 vext2 <7,4,4,4>, <7,4,4,4>
1503297638U, // <4,4,u,0>: Cost 2 vext1 <4,4,4,u>, LHS
1570379566U, // <4,4,u,1>: Cost 2 vext2 <4,4,4,4>, LHS
- 2692279807U, // <4,4,u,2>: Cost 3 vext3 <1,2,u,4>, <4,u,2,1>
+ 2779682606U, // <4,4,u,2>: Cost 3 vuzpl <4,6,4,6>, LHS
2571069947U, // <4,4,u,3>: Cost 3 vext1 <3,4,4,u>, <3,4,4,u>
161926454U, // <4,4,u,4>: Cost 1 vdup0 RHS
1841638710U, // <4,4,u,5>: Cost 2 vzipl RHS, RHS
@@ -3347,21 +3347,21 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2618908875U, // <4,5,0,2>: Cost 3 vext2 <0,2,4,5>, <0,2,4,5>
2571078140U, // <4,5,0,3>: Cost 3 vext1 <3,4,5,0>, <3,4,5,0>
2626871634U, // <4,5,0,4>: Cost 3 vext2 <1,5,4,5>, <0,4,1,5>
- 3644821246U, // <4,5,0,5>: Cost 4 vext1 <3,4,5,0>, <5,2,3,4>
+ 3705258414U, // <4,5,0,5>: Cost 4 vext2 <2,3,4,5>, <0,5,2,7>
2594968438U, // <4,5,0,6>: Cost 3 vext1 <7,4,5,0>, <6,7,4,5>
2594968928U, // <4,5,0,7>: Cost 3 vext1 <7,4,5,0>, <7,4,5,0>
1557775005U, // <4,5,0,u>: Cost 2 vext2 <2,3,4,5>, LHS
- 2623554306U, // <4,5,1,0>: Cost 3 vext2 <1,0,4,5>, <1,0,4,5>
+ 2631516918U, // <4,5,1,0>: Cost 3 vext2 <2,3,4,5>, <1,0,3,2>
2624217939U, // <4,5,1,1>: Cost 3 vext2 <1,1,4,5>, <1,1,4,5>
2631517078U, // <4,5,1,2>: Cost 3 vext2 <2,3,4,5>, <1,2,3,0>
2821341286U, // <4,5,1,3>: Cost 3 vuzpr <0,4,1,5>, LHS
- 2239548390U, // <4,5,1,4>: Cost 3 vrev <4,1,5,4>
+ 3895086054U, // <4,5,1,4>: Cost 4 vuzpr <0,4,1,5>, <4,1,5,4>
2626872471U, // <4,5,1,5>: Cost 3 vext2 <1,5,4,5>, <1,5,4,5>
3895083131U, // <4,5,1,6>: Cost 4 vuzpr <0,4,1,5>, <0,1,4,6>
2718748368U, // <4,5,1,7>: Cost 3 vext3 <5,6,7,4>, <5,1,7,3>
2821341291U, // <4,5,1,u>: Cost 3 vuzpr <0,4,1,5>, LHS
2571092070U, // <4,5,2,0>: Cost 3 vext1 <3,4,5,2>, LHS
- 3296035756U, // <4,5,2,1>: Cost 4 vrev <1,2,5,4>
+ 3699287585U, // <4,5,2,1>: Cost 4 vext2 <1,3,4,5>, <2,1,3,3>
2630854269U, // <4,5,2,2>: Cost 3 vext2 <2,2,4,5>, <2,2,4,5>
1557776078U, // <4,5,2,3>: Cost 2 vext2 <2,3,4,5>, <2,3,4,5>
2631517974U, // <4,5,2,4>: Cost 3 vext2 <2,3,4,5>, <2,4,3,5>
@@ -3371,21 +3371,21 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1561094243U, // <4,5,2,u>: Cost 2 vext2 <2,u,4,5>, <2,u,4,5>
2631518358U, // <4,5,3,0>: Cost 3 vext2 <2,3,4,5>, <3,0,1,2>
3895084710U, // <4,5,3,1>: Cost 4 vuzpr <0,4,1,5>, <2,3,0,1>
- 2631518518U, // <4,5,3,2>: Cost 3 vext2 <2,3,4,5>, <3,2,1,0>
+ 2631518540U, // <4,5,3,2>: Cost 3 vext2 <2,3,4,5>, <3,2,3,4>
2631518620U, // <4,5,3,3>: Cost 3 vext2 <2,3,4,5>, <3,3,3,3>
2631518716U, // <4,5,3,4>: Cost 3 vext2 <2,3,4,5>, <3,4,5,0>
2631518784U, // <4,5,3,5>: Cost 3 vext2 <2,3,4,5>, <3,5,3,5>
2658060980U, // <4,5,3,6>: Cost 3 vext2 <6,7,4,5>, <3,6,7,4>
2640145131U, // <4,5,3,7>: Cost 3 vext2 <3,7,4,5>, <3,7,4,5>
- 2631519004U, // <4,5,3,u>: Cost 3 vext2 <2,3,4,5>, <3,u,1,0>
+ 2631519006U, // <4,5,3,u>: Cost 3 vext2 <2,3,4,5>, <3,u,1,2>
2571108454U, // <4,5,4,0>: Cost 3 vext1 <3,4,5,4>, LHS
- 3297363022U, // <4,5,4,1>: Cost 4 vrev <1,4,5,4>
+ 3632907342U, // <4,5,4,1>: Cost 4 vext1 <1,4,5,4>, <1,4,5,4>
2571110094U, // <4,5,4,2>: Cost 3 vext1 <3,4,5,4>, <2,3,4,5>
- 2235566592U, // <4,5,4,3>: Cost 3 vrev <3,4,5,4>
+ 2571110912U, // <4,5,4,3>: Cost 3 vext1 <3,4,5,4>, <3,4,5,4>
2571111734U, // <4,5,4,4>: Cost 3 vext1 <3,4,5,4>, RHS
1557777718U, // <4,5,4,5>: Cost 2 vext2 <2,3,4,5>, RHS
2645454195U, // <4,5,4,6>: Cost 3 vext2 <4,6,4,5>, <4,6,4,5>
- 2259457380U, // <4,5,4,7>: Cost 3 vrev <7,4,5,4>
+ 2718748614U, // <4,5,4,7>: Cost 3 vext3 <5,6,7,4>, <5,4,7,6>
1557777961U, // <4,5,4,u>: Cost 2 vext2 <2,3,4,5>, RHS
1503346790U, // <4,5,5,0>: Cost 2 vext1 <4,4,5,5>, LHS
2913398480U, // <4,5,5,1>: Cost 3 vzipl RHS, <5,1,7,3>
@@ -3402,7 +3402,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1497385474U, // <4,5,6,3>: Cost 2 vext1 <3,4,5,6>, <3,4,5,6>
1497386294U, // <4,5,6,4>: Cost 2 vext1 <3,4,5,6>, RHS
3047608324U, // <4,5,6,5>: Cost 3 vtrnl RHS, <5,5,5,5>
- 2571129554U, // <4,5,6,6>: Cost 3 vext1 <3,4,5,6>, <6,5,4,3>
+ 2571129656U, // <4,5,6,6>: Cost 3 vext1 <3,4,5,6>, <6,6,6,6>
27705344U, // <4,5,6,7>: Cost 0 copy RHS
27705344U, // <4,5,6,u>: Cost 0 copy RHS
2565161062U, // <4,5,7,0>: Cost 3 vext1 <2,4,5,7>, LHS
@@ -3416,7 +3416,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2565166894U, // <4,5,7,u>: Cost 3 vext1 <2,4,5,7>, LHS
1497399398U, // <4,5,u,0>: Cost 2 vext1 <3,4,5,u>, LHS
1557780270U, // <4,5,u,1>: Cost 2 vext2 <2,3,4,5>, LHS
- 2631522163U, // <4,5,u,2>: Cost 3 vext2 <2,3,4,5>, <u,2,1,0>
+ 2631522181U, // <4,5,u,2>: Cost 3 vext2 <2,3,4,5>, <u,2,3,0>
1497401860U, // <4,5,u,3>: Cost 2 vext1 <3,4,5,u>, <3,4,5,u>
1497402678U, // <4,5,u,4>: Cost 2 vext1 <3,4,5,u>, RHS
1557780634U, // <4,5,u,5>: Cost 2 vext2 <2,3,4,5>, RHS
@@ -3428,11 +3428,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1545175244U, // <4,6,0,2>: Cost 2 vext2 <0,2,4,6>, <0,2,4,6>
3692658940U, // <4,6,0,3>: Cost 4 vext2 <0,2,4,6>, <0,3,1,0>
2618917202U, // <4,6,0,4>: Cost 3 vext2 <0,2,4,6>, <0,4,1,5>
- 3709911470U, // <4,6,0,5>: Cost 4 vext2 <3,1,4,6>, <0,5,2,7>
- 2589069968U, // <4,6,0,6>: Cost 3 vext1 <6,4,6,0>, <6,4,6,0>
+ 3852910806U, // <4,6,0,5>: Cost 4 vuzpl RHS, <0,2,5,7>
+ 2253525648U, // <4,6,0,6>: Cost 3 vrev <6,4,6,0>
4040764726U, // <4,6,0,7>: Cost 4 vzipr <2,3,4,0>, RHS
1545175709U, // <4,6,0,u>: Cost 2 vext2 <0,2,4,6>, LHS
- 3692659444U, // <4,6,1,0>: Cost 4 vext2 <0,2,4,6>, <1,0,3,0>
+ 2618917622U, // <4,6,1,0>: Cost 3 vext2 <0,2,4,6>, <1,0,3,2>
2618917684U, // <4,6,1,1>: Cost 3 vext2 <0,2,4,6>, <1,1,1,1>
2618917782U, // <4,6,1,2>: Cost 3 vext2 <0,2,4,6>, <1,2,3,0>
2618917848U, // <4,6,1,3>: Cost 3 vext2 <0,2,4,6>, <1,3,1,3>
@@ -3441,7 +3441,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3692659937U, // <4,6,1,6>: Cost 4 vext2 <0,2,4,6>, <1,6,3,7>
4032146742U, // <4,6,1,7>: Cost 4 vzipr <0,u,4,1>, RHS
2618918253U, // <4,6,1,u>: Cost 3 vext2 <0,2,4,6>, <1,u,1,3>
- 2779170470U, // <4,6,2,0>: Cost 3 vuzpl RHS, <2,3,0,1>
+ 2618918380U, // <4,6,2,0>: Cost 3 vext2 <0,2,4,6>, <2,0,6,4>
2618918460U, // <4,6,2,1>: Cost 3 vext2 <0,2,4,6>, <2,1,6,3>
2618918504U, // <4,6,2,2>: Cost 3 vext2 <0,2,4,6>, <2,2,2,2>
2618918566U, // <4,6,2,3>: Cost 3 vext2 <0,2,4,6>, <2,3,0,1>
@@ -3452,37 +3452,37 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2618918971U, // <4,6,2,u>: Cost 3 vext2 <0,2,4,6>, <2,u,0,1>
2618919062U, // <4,6,3,0>: Cost 3 vext2 <0,2,4,6>, <3,0,1,2>
2636171526U, // <4,6,3,1>: Cost 3 vext2 <3,1,4,6>, <3,1,4,6>
- 2618919222U, // <4,6,3,2>: Cost 3 vext2 <0,2,4,6>, <3,2,1,0>
+ 3692661057U, // <4,6,3,2>: Cost 4 vext2 <0,2,4,6>, <3,2,2,2>
2618919324U, // <4,6,3,3>: Cost 3 vext2 <0,2,4,6>, <3,3,3,3>
2618919426U, // <4,6,3,4>: Cost 3 vext2 <0,2,4,6>, <3,4,5,6>
2638826058U, // <4,6,3,5>: Cost 3 vext2 <3,5,4,6>, <3,5,4,6>
3913303030U, // <4,6,3,6>: Cost 4 vuzpr <3,4,5,6>, <1,3,4,6>
2722730572U, // <4,6,3,7>: Cost 3 vext3 <6,3,7,4>, <6,3,7,4>
- 2618919708U, // <4,6,3,u>: Cost 3 vext2 <0,2,4,6>, <3,u,1,0>
+ 2618919710U, // <4,6,3,u>: Cost 3 vext2 <0,2,4,6>, <3,u,1,2>
2565210214U, // <4,6,4,0>: Cost 3 vext1 <2,4,6,4>, LHS
2718749286U, // <4,6,4,1>: Cost 3 vext3 <5,6,7,4>, <6,4,1,3>
- 2229667632U, // <4,6,4,2>: Cost 3 vrev <2,4,6,4>
- 2235640329U, // <4,6,4,3>: Cost 3 vrev <3,4,6,4>
+ 2565211952U, // <4,6,4,2>: Cost 3 vext1 <2,4,6,4>, <2,4,6,4>
+ 2571184649U, // <4,6,4,3>: Cost 3 vext1 <3,4,6,4>, <3,4,6,4>
2565213494U, // <4,6,4,4>: Cost 3 vext1 <2,4,6,4>, RHS
1545178422U, // <4,6,4,5>: Cost 2 vext2 <0,2,4,6>, RHS
1705430326U, // <4,6,4,6>: Cost 2 vuzpl RHS, RHS
- 2259531117U, // <4,6,4,7>: Cost 3 vrev <7,4,6,4>
+ 2595075437U, // <4,6,4,7>: Cost 3 vext1 <7,4,6,4>, <7,4,6,4>
1545178665U, // <4,6,4,u>: Cost 2 vext2 <0,2,4,6>, RHS
2565218406U, // <4,6,5,0>: Cost 3 vext1 <2,4,6,5>, LHS
2645462736U, // <4,6,5,1>: Cost 3 vext2 <4,6,4,6>, <5,1,7,3>
2913399290U, // <4,6,5,2>: Cost 3 vzipl RHS, <6,2,7,3>
3913305394U, // <4,6,5,3>: Cost 4 vuzpr <3,4,5,6>, <4,5,6,3>
- 2242276659U, // <4,6,5,4>: Cost 3 vrev <4,5,6,4>
+ 2645462982U, // <4,6,5,4>: Cost 3 vext2 <4,6,4,6>, <5,4,7,6>
2779172868U, // <4,6,5,5>: Cost 3 vuzpl RHS, <5,5,5,5>
2913391416U, // <4,6,5,6>: Cost 3 vzipl RHS, <6,6,6,6>
2821426486U, // <4,6,5,7>: Cost 3 vuzpr <0,4,2,6>, RHS
2821426487U, // <4,6,5,u>: Cost 3 vuzpr <0,4,2,6>, RHS
1503428710U, // <4,6,6,0>: Cost 2 vext1 <4,4,6,6>, LHS
- 2577171252U, // <4,6,6,1>: Cost 3 vext1 <4,4,6,6>, <1,1,1,1>
+ 2577171190U, // <4,6,6,1>: Cost 3 vext1 <4,4,6,6>, <1,0,3,2>
2645463546U, // <4,6,6,2>: Cost 3 vext2 <4,6,4,6>, <6,2,7,3>
2577172630U, // <4,6,6,3>: Cost 3 vext1 <4,4,6,6>, <3,0,1,2>
1503431908U, // <4,6,6,4>: Cost 2 vext1 <4,4,6,6>, <4,4,6,6>
- 2577174224U, // <4,6,6,5>: Cost 3 vext1 <4,4,6,6>, <5,1,7,3>
+ 2253501069U, // <4,6,6,5>: Cost 3 vrev <6,4,5,6>
2618921784U, // <4,6,6,6>: Cost 3 vext2 <0,2,4,6>, <6,6,6,6>
2954464566U, // <4,6,6,7>: Cost 3 vzipr <0,2,4,6>, RHS
1503434542U, // <4,6,6,u>: Cost 2 vext1 <4,4,6,6>, LHS
@@ -3492,7 +3492,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2725090156U, // <4,6,7,3>: Cost 3 vext3 <6,7,3,4>, <6,7,3,4>
2645464422U, // <4,6,7,4>: Cost 3 vext2 <4,6,4,6>, <7,4,5,6>
2779174246U, // <4,6,7,5>: Cost 3 vuzpl RHS, <7,4,5,6>
- 2645464582U, // <4,6,7,6>: Cost 3 vext2 <4,6,4,6>, <7,6,5,4>
+ 3852915914U, // <4,6,7,6>: Cost 4 vuzpl RHS, <7,2,6,3>
2779174508U, // <4,6,7,7>: Cost 3 vuzpl RHS, <7,7,7,7>
2779173945U, // <4,6,7,u>: Cost 3 vuzpl RHS, <7,0,u,2>
1503445094U, // <4,6,u,0>: Cost 2 vext1 <4,4,6,u>, LHS
@@ -3509,11 +3509,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2726343685U, // <4,7,0,2>: Cost 3 vext3 <7,0,2,4>, <7,0,2,4>
3701293312U, // <4,7,0,3>: Cost 4 vext2 <1,6,4,7>, <0,3,1,4>
3706601810U, // <4,7,0,4>: Cost 4 vext2 <2,5,4,7>, <0,4,1,5>
- 3318746752U, // <4,7,0,5>: Cost 4 vrev <5,0,7,4>
+ 2259424608U, // <4,7,0,5>: Cost 3 vrev <7,4,5,0>
3695321617U, // <4,7,0,6>: Cost 4 vext2 <0,6,4,7>, <0,6,4,7>
- 3330692146U, // <4,7,0,7>: Cost 4 vrev <7,0,7,4>
+ 3800454194U, // <4,7,0,7>: Cost 4 vext3 <7,0,7,4>, <7,0,7,4>
2632860317U, // <4,7,0,u>: Cost 3 vext2 <2,5,4,7>, LHS
- 3656917094U, // <4,7,1,0>: Cost 4 vext1 <5,4,7,1>, LHS
+ 2259064116U, // <4,7,1,0>: Cost 3 vrev <7,4,0,1>
3700630324U, // <4,7,1,1>: Cost 4 vext2 <1,5,4,7>, <1,1,1,1>
2632860570U, // <4,7,1,2>: Cost 3 vext2 <2,5,4,7>, <1,2,3,4>
3769635936U, // <4,7,1,3>: Cost 4 vext3 <1,u,3,4>, <7,1,3,5>
@@ -3521,7 +3521,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3700630681U, // <4,7,1,5>: Cost 4 vext2 <1,5,4,7>, <1,5,4,7>
3701294314U, // <4,7,1,6>: Cost 4 vext2 <1,6,4,7>, <1,6,4,7>
3793818754U, // <4,7,1,7>: Cost 4 vext3 <5,u,7,4>, <7,1,7,3>
- 2632860570U, // <4,7,1,u>: Cost 3 vext2 <2,5,4,7>, <1,2,3,4>
+ 2259654012U, // <4,7,1,u>: Cost 3 vrev <7,4,u,1>
3656925286U, // <4,7,2,0>: Cost 4 vext1 <5,4,7,2>, LHS
3706603050U, // <4,7,2,1>: Cost 4 vext2 <2,5,4,7>, <2,1,4,3>
3706603112U, // <4,7,2,2>: Cost 4 vext2 <2,5,4,7>, <2,2,2,2>
@@ -3532,103 +3532,103 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3792491731U, // <4,7,2,7>: Cost 4 vext3 <5,6,7,4>, <7,2,7,3>
2634852453U, // <4,7,2,u>: Cost 3 vext2 <2,u,4,7>, <2,u,4,7>
3706603670U, // <4,7,3,0>: Cost 4 vext2 <2,5,4,7>, <3,0,1,2>
- 3656934544U, // <4,7,3,1>: Cost 4 vext1 <5,4,7,3>, <1,5,3,7>
- 2229077736U, // <4,7,3,2>: Cost 3 vrev <2,3,7,4>
+ 3662906266U, // <4,7,3,1>: Cost 4 vext1 <6,4,7,3>, <1,2,3,4>
+ 3725183326U, // <4,7,3,2>: Cost 4 vext2 <5,6,4,7>, <3,2,5,4>
3706603932U, // <4,7,3,3>: Cost 4 vext2 <2,5,4,7>, <3,3,3,3>
3701295618U, // <4,7,3,4>: Cost 4 vext2 <1,6,4,7>, <3,4,5,6>
- 2246995827U, // <4,7,3,5>: Cost 3 vrev <5,3,7,4>
+ 2638834251U, // <4,7,3,5>: Cost 3 vext2 <3,5,4,7>, <3,5,4,7>
2639497884U, // <4,7,3,6>: Cost 3 vext2 <3,6,4,7>, <3,6,4,7>
- 3332683045U, // <4,7,3,7>: Cost 4 vrev <7,3,7,4>
+ 3802445093U, // <4,7,3,7>: Cost 4 vext3 <7,3,7,4>, <7,3,7,4>
2640825150U, // <4,7,3,u>: Cost 3 vext2 <3,u,4,7>, <3,u,4,7>
2718750004U, // <4,7,4,0>: Cost 3 vext3 <5,6,7,4>, <7,4,0,1>
3706604490U, // <4,7,4,1>: Cost 4 vext2 <2,5,4,7>, <4,1,2,3>
3656943474U, // <4,7,4,2>: Cost 4 vext1 <5,4,7,4>, <2,5,4,7>
- 3706604650U, // <4,7,4,3>: Cost 4 vext2 <2,5,4,7>, <4,3,2,1>
- 2729145691U, // <4,7,4,4>: Cost 3 vext3 <7,4,4,4>, <7,4,4,4>
+ 3779884371U, // <4,7,4,3>: Cost 4 vext3 <3,5,7,4>, <7,4,3,5>
+ 2259383643U, // <4,7,4,4>: Cost 3 vrev <7,4,4,4>
2632863030U, // <4,7,4,5>: Cost 3 vext2 <2,5,4,7>, RHS
- 2729293165U, // <4,7,4,6>: Cost 3 vext3 <7,4,6,4>, <7,4,6,4>
+ 2259531117U, // <4,7,4,6>: Cost 3 vrev <7,4,6,4>
3907340074U, // <4,7,4,7>: Cost 4 vuzpr <2,4,5,7>, <2,4,5,7>
2632863273U, // <4,7,4,u>: Cost 3 vext2 <2,5,4,7>, RHS
2913391610U, // <4,7,5,0>: Cost 3 vzipl RHS, <7,0,1,2>
- 3298174129U, // <4,7,5,1>: Cost 4 vrev <1,5,7,4>
+ 3645006848U, // <4,7,5,1>: Cost 4 vext1 <3,4,7,5>, <1,3,5,7>
2589181646U, // <4,7,5,2>: Cost 3 vext1 <6,4,7,5>, <2,3,4,5>
- 2236377699U, // <4,7,5,3>: Cost 3 vrev <3,5,7,4>
+ 3645008403U, // <4,7,5,3>: Cost 4 vext1 <3,4,7,5>, <3,4,7,5>
2913391974U, // <4,7,5,4>: Cost 3 vzipl RHS, <7,4,5,6>
2583211973U, // <4,7,5,5>: Cost 3 vext1 <5,4,7,5>, <5,4,7,5>
- 2913392134U, // <4,7,5,6>: Cost 3 vzipl RHS, <7,6,5,4>
+ 2589184670U, // <4,7,5,6>: Cost 3 vext1 <6,4,7,5>, <6,4,7,5>
2913392236U, // <4,7,5,7>: Cost 3 vzipl RHS, <7,7,7,7>
2913392258U, // <4,7,5,u>: Cost 3 vzipl RHS, <7,u,1,2>
- 2583216230U, // <4,7,6,0>: Cost 3 vext1 <5,4,7,6>, LHS
+ 1509474406U, // <4,7,6,0>: Cost 2 vext1 <5,4,7,6>, LHS
3047609338U, // <4,7,6,1>: Cost 3 vtrnl RHS, <7,0,1,2>
- 4121351169U, // <4,7,6,2>: Cost 4 vtrnl RHS, <7,0,2,0>
- 2237041332U, // <4,7,6,3>: Cost 3 vrev <3,6,7,4>
- 2583219510U, // <4,7,6,4>: Cost 3 vext1 <5,4,7,6>, RHS
- 1175244902U, // <4,7,6,5>: Cost 2 vrev <5,6,7,4>
- 2589192863U, // <4,7,6,6>: Cost 3 vext1 <6,4,7,6>, <6,4,7,6>
+ 2583217768U, // <4,7,6,2>: Cost 3 vext1 <5,4,7,6>, <2,2,2,2>
+ 2583218326U, // <4,7,6,3>: Cost 3 vext1 <5,4,7,6>, <3,0,1,2>
+ 1509477686U, // <4,7,6,4>: Cost 2 vext1 <5,4,7,6>, RHS
+ 1509478342U, // <4,7,6,5>: Cost 2 vext1 <5,4,7,6>, <5,4,7,6>
+ 2583220730U, // <4,7,6,6>: Cost 3 vext1 <5,4,7,6>, <6,2,7,3>
3047609964U, // <4,7,6,7>: Cost 3 vtrnl RHS, <7,7,7,7>
- 1657026081U, // <4,7,6,u>: Cost 2 vext3 <7,6,u,4>, <7,6,u,4>
+ 1509480238U, // <4,7,6,u>: Cost 2 vext1 <5,4,7,6>, LHS
3650994278U, // <4,7,7,0>: Cost 4 vext1 <4,4,7,7>, LHS
3650995098U, // <4,7,7,1>: Cost 4 vext1 <4,4,7,7>, <1,2,3,4>
3650996010U, // <4,7,7,2>: Cost 4 vext1 <4,4,7,7>, <2,4,5,7>
- 3311446789U, // <4,7,7,3>: Cost 4 vrev <3,7,7,4>
- 2668696936U, // <4,7,7,4>: Cost 3 vext2 <u,5,4,7>, <7,4,5,u>
- 2249650359U, // <4,7,7,5>: Cost 3 vrev <5,7,7,4>
- 2255623056U, // <4,7,7,6>: Cost 3 vrev <6,7,7,4>
+ 3804804677U, // <4,7,7,3>: Cost 4 vext3 <7,7,3,4>, <7,7,3,4>
+ 3650997486U, // <4,7,7,4>: Cost 4 vext1 <4,4,7,7>, <4,4,7,7>
+ 2662725039U, // <4,7,7,5>: Cost 3 vext2 <7,5,4,7>, <7,5,4,7>
+ 3662942880U, // <4,7,7,6>: Cost 4 vext1 <6,4,7,7>, <6,4,7,7>
2718750316U, // <4,7,7,7>: Cost 3 vext3 <5,6,7,4>, <7,7,7,7>
2664715938U, // <4,7,7,u>: Cost 3 vext2 <7,u,4,7>, <7,u,4,7>
- 2915382266U, // <4,7,u,0>: Cost 3 vzipl RHS, <7,0,1,2>
+ 1509490790U, // <4,7,u,0>: Cost 2 vext1 <5,4,7,u>, LHS
2632865582U, // <4,7,u,1>: Cost 3 vext2 <2,5,4,7>, LHS
- 2726343685U, // <4,7,u,2>: Cost 3 vext3 <7,0,2,4>, <7,0,2,4>
- 2238368598U, // <4,7,u,3>: Cost 3 vrev <3,u,7,4>
- 2915382630U, // <4,7,u,4>: Cost 3 vzipl RHS, <7,4,5,6>
- 1176572168U, // <4,7,u,5>: Cost 2 vrev <5,u,7,4>
- 2915382790U, // <4,7,u,6>: Cost 3 vzipl RHS, <7,6,5,4>
+ 2583234152U, // <4,7,u,2>: Cost 3 vext1 <5,4,7,u>, <2,2,2,2>
+ 2583234710U, // <4,7,u,3>: Cost 3 vext1 <5,4,7,u>, <3,0,1,2>
+ 1509494070U, // <4,7,u,4>: Cost 2 vext1 <5,4,7,u>, RHS
+ 1509494728U, // <4,7,u,5>: Cost 2 vext1 <5,4,7,u>, <5,4,7,u>
+ 2583237114U, // <4,7,u,6>: Cost 3 vext1 <5,4,7,u>, <6,2,7,3>
3047757420U, // <4,7,u,7>: Cost 3 vtrnl RHS, <7,7,7,7>
- 1658353347U, // <4,7,u,u>: Cost 2 vext3 <7,u,u,4>, <7,u,u,4>
+ 1509496622U, // <4,7,u,u>: Cost 2 vext1 <5,4,7,u>, LHS
2618933248U, // <4,u,0,0>: Cost 3 vext2 <0,2,4,u>, <0,0,0,0>
1545191526U, // <4,u,0,1>: Cost 2 vext2 <0,2,4,u>, LHS
1545191630U, // <4,u,0,2>: Cost 2 vext2 <0,2,4,u>, <0,2,4,u>
- 2233133271U, // <4,u,0,3>: Cost 3 vrev <3,0,u,4>
+ 2691913445U, // <4,u,0,3>: Cost 3 vext3 <1,2,3,4>, <u,0,3,2>
2618933586U, // <4,u,0,4>: Cost 3 vext2 <0,2,4,u>, <0,4,1,5>
- 2736518902U, // <4,u,0,5>: Cost 3 vext3 <u,6,5,4>, <u,0,5,1>
- 2251051362U, // <4,u,0,6>: Cost 3 vrev <6,0,u,4>
- 2257024059U, // <4,u,0,7>: Cost 3 vrev <7,0,u,4>
+ 2265397305U, // <4,u,0,5>: Cost 3 vrev <u,4,5,0>
+ 2595189625U, // <4,u,0,6>: Cost 3 vext1 <7,4,u,0>, <6,7,4,u>
+ 2595190139U, // <4,u,0,7>: Cost 3 vext1 <7,4,u,0>, <7,4,u,0>
1545192093U, // <4,u,0,u>: Cost 2 vext2 <0,2,4,u>, LHS
- 2571305062U, // <4,u,1,0>: Cost 3 vext1 <3,4,u,1>, LHS
+ 2618934006U, // <4,u,1,0>: Cost 3 vext2 <0,2,4,u>, <1,0,3,2>
2618934068U, // <4,u,1,1>: Cost 3 vext2 <0,2,4,u>, <1,1,1,1>
1618171694U, // <4,u,1,2>: Cost 2 vext3 <1,2,3,4>, LHS
2618934232U, // <4,u,1,3>: Cost 3 vext2 <0,2,4,u>, <1,3,1,3>
- 2571308342U, // <4,u,1,4>: Cost 3 vext1 <3,4,u,1>, RHS
+ 2695894848U, // <4,u,1,4>: Cost 3 vext3 <1,u,3,4>, <u,1,4,3>
2618934416U, // <4,u,1,5>: Cost 3 vext2 <0,2,4,u>, <1,5,3,7>
3692676321U, // <4,u,1,6>: Cost 4 vext2 <0,2,4,u>, <1,6,3,7>
2718750555U, // <4,u,1,7>: Cost 3 vext3 <5,6,7,4>, <u,1,7,3>
1618171748U, // <4,u,1,u>: Cost 2 vext3 <1,2,3,4>, LHS
2553397350U, // <4,u,2,0>: Cost 3 vext1 <0,4,u,2>, LHS
- 1148773319U, // <4,u,2,1>: Cost 2 vrev <1,2,u,4>
+ 2630215215U, // <4,u,2,1>: Cost 3 vext2 <2,1,4,u>, <2,1,4,u>
2618934888U, // <4,u,2,2>: Cost 3 vext2 <0,2,4,u>, <2,2,2,2>
1557800657U, // <4,u,2,3>: Cost 2 vext2 <2,3,4,u>, <2,3,4,u>
2618935065U, // <4,u,2,4>: Cost 3 vext2 <0,2,4,u>, <2,4,3,u>
- 2246405931U, // <4,u,2,5>: Cost 3 vrev <5,2,u,4>
+ 2733864859U, // <4,u,2,5>: Cost 3 vext3 <u,2,5,4>, <u,2,5,4>
2618935226U, // <4,u,2,6>: Cost 3 vext2 <0,2,4,u>, <2,6,3,7>
2718750636U, // <4,u,2,7>: Cost 3 vext3 <5,6,7,4>, <u,2,7,3>
1561118822U, // <4,u,2,u>: Cost 2 vext2 <2,u,4,u>, <2,u,4,u>
2618935446U, // <4,u,3,0>: Cost 3 vext2 <0,2,4,u>, <3,0,1,2>
- 2223178776U, // <4,u,3,1>: Cost 3 vrev <1,3,u,4>
- 2618935606U, // <4,u,3,2>: Cost 3 vext2 <0,2,4,u>, <3,2,1,0>
+ 2779318422U, // <4,u,3,1>: Cost 3 vuzpl RHS, <3,0,1,2>
+ 2636851545U, // <4,u,3,2>: Cost 3 vext2 <3,2,4,u>, <3,2,4,u>
2618935708U, // <4,u,3,3>: Cost 3 vext2 <0,2,4,u>, <3,3,3,3>
2618935810U, // <4,u,3,4>: Cost 3 vext2 <0,2,4,u>, <3,4,5,6>
2691913711U, // <4,u,3,5>: Cost 3 vext3 <1,2,3,4>, <u,3,5,7>
- 2253042261U, // <4,u,3,6>: Cost 3 vrev <6,3,u,4>
+ 2588725862U, // <4,u,3,6>: Cost 3 vext1 <6,4,1,3>, <6,4,1,3>
2640169710U, // <4,u,3,7>: Cost 3 vext2 <3,7,4,u>, <3,7,4,u>
- 2618936092U, // <4,u,3,u>: Cost 3 vext2 <0,2,4,u>, <3,u,1,0>
+ 2618936094U, // <4,u,3,u>: Cost 3 vext2 <0,2,4,u>, <3,u,1,2>
1503559782U, // <4,u,4,0>: Cost 2 vext1 <4,4,u,4>, LHS
2692282391U, // <4,u,4,1>: Cost 3 vext3 <1,2,u,4>, <u,4,1,2>
- 2229815106U, // <4,u,4,2>: Cost 3 vrev <2,4,u,4>
- 2235787803U, // <4,u,4,3>: Cost 3 vrev <3,4,u,4>
+ 2565359426U, // <4,u,4,2>: Cost 3 vext1 <2,4,u,4>, <2,4,u,4>
+ 2571332123U, // <4,u,4,3>: Cost 3 vext1 <3,4,u,4>, <3,4,u,4>
161926454U, // <4,u,4,4>: Cost 1 vdup0 RHS
1545194806U, // <4,u,4,5>: Cost 2 vext2 <0,2,4,u>, RHS
1705577782U, // <4,u,4,6>: Cost 2 vuzpl RHS, RHS
- 2259678591U, // <4,u,4,7>: Cost 3 vrev <7,4,u,4>
+ 2718750801U, // <4,u,4,7>: Cost 3 vext3 <5,6,7,4>, <u,4,7,6>
161926454U, // <4,u,4,u>: Cost 1 vdup0 RHS
1479164006U, // <4,u,5,0>: Cost 2 vext1 <0,4,1,5>, LHS
1839650606U, // <4,u,5,1>: Cost 2 vzipl RHS, LHS
@@ -3640,11 +3640,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3089780265U, // <4,u,5,7>: Cost 3 vtrnr <0,4,1,5>, RHS
1618172076U, // <4,u,5,u>: Cost 2 vext3 <1,2,3,4>, RHS
1479688294U, // <4,u,6,0>: Cost 2 vext1 <0,4,u,6>, LHS
- 2553430836U, // <4,u,6,1>: Cost 3 vext1 <0,4,u,6>, <1,1,1,1>
+ 2553430774U, // <4,u,6,1>: Cost 3 vext1 <0,4,u,6>, <1,0,3,2>
1973868334U, // <4,u,6,2>: Cost 2 vtrnl RHS, LHS
1497606685U, // <4,u,6,3>: Cost 2 vext1 <3,4,u,6>, <3,4,u,6>
1479691574U, // <4,u,6,4>: Cost 2 vext1 <0,4,u,6>, RHS
- 1175318639U, // <4,u,6,5>: Cost 2 vrev <5,6,u,4>
+ 1509552079U, // <4,u,6,5>: Cost 2 vext1 <5,4,u,6>, <5,4,u,6>
1973868698U, // <4,u,6,6>: Cost 2 vtrnl RHS, RHS
27705344U, // <4,u,6,7>: Cost 0 copy RHS
27705344U, // <4,u,6,u>: Cost 0 copy RHS
@@ -3671,8 +3671,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2687123476U, // <5,0,0,2>: Cost 3 vext3 <0,4,1,5>, <0,0,2,2>
3710599434U, // <5,0,0,3>: Cost 4 vext2 <3,2,5,0>, <0,3,2,5>
2642166098U, // <5,0,0,4>: Cost 3 vext2 <4,1,5,0>, <0,4,1,5>
- 3711926716U, // <5,0,0,5>: Cost 4 vext2 <3,4,5,0>, <0,5,4,3>
- 3695338003U, // <5,0,0,6>: Cost 4 vext2 <0,6,5,0>, <0,6,5,0>
+ 3657060306U, // <5,0,0,5>: Cost 4 vext1 <5,5,0,0>, <5,5,0,0>
+ 3292094923U, // <5,0,0,6>: Cost 4 vrev <0,5,6,0>
3669005700U, // <5,0,0,7>: Cost 4 vext1 <7,5,0,0>, <7,5,0,0>
2687123530U, // <5,0,0,u>: Cost 3 vext3 <0,4,1,5>, <0,0,u,2>
2559434854U, // <5,0,1,0>: Cost 3 vext1 <1,5,0,1>, LHS
@@ -3698,24 +3698,24 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2686533898U, // <5,0,3,2>: Cost 3 vext3 <0,3,2,5>, <0,3,2,5>
3760349459U, // <5,0,3,3>: Cost 4 vext3 <0,3,3,5>, <0,3,3,5>
2638187004U, // <5,0,3,4>: Cost 3 vext2 <3,4,5,0>, <3,4,5,0>
- 3711928896U, // <5,0,3,5>: Cost 4 vext2 <3,4,5,0>, <3,5,3,5>
+ 3776348452U, // <5,0,3,5>: Cost 4 vext3 <3,0,4,5>, <0,3,5,4>
3713256094U, // <5,0,3,6>: Cost 4 vext2 <3,6,5,0>, <3,6,5,0>
3914064896U, // <5,0,3,7>: Cost 4 vuzpr <3,5,7,0>, <1,3,5,7>
2686976320U, // <5,0,3,u>: Cost 3 vext3 <0,3,u,5>, <0,3,u,5>
2559459430U, // <5,0,4,0>: Cost 3 vext1 <1,5,0,4>, LHS
1613381970U, // <5,0,4,1>: Cost 2 vext3 <0,4,1,5>, <0,4,1,5>
2687123804U, // <5,0,4,2>: Cost 3 vext3 <0,4,1,5>, <0,4,2,6>
- 2235206100U, // <5,0,4,3>: Cost 3 vrev <3,4,0,5>
+ 3761013092U, // <5,0,4,3>: Cost 4 vext3 <0,4,3,5>, <0,4,3,5>
2559462710U, // <5,0,4,4>: Cost 3 vext1 <1,5,0,4>, RHS
2638187830U, // <5,0,4,5>: Cost 3 vext2 <3,4,5,0>, RHS
3761234303U, // <5,0,4,6>: Cost 4 vext3 <0,4,6,5>, <0,4,6,5>
2646150600U, // <5,0,4,7>: Cost 3 vext2 <4,7,5,0>, <4,7,5,0>
1613381970U, // <5,0,4,u>: Cost 2 vext3 <0,4,1,5>, <0,4,1,5>
- 3778707862U, // <5,0,5,0>: Cost 4 vext3 <3,4,0,5>, <0,5,0,1>
+ 3766763926U, // <5,0,5,0>: Cost 4 vext3 <1,4,0,5>, <0,5,0,1>
2919268454U, // <5,0,5,1>: Cost 3 vzipl <5,5,5,5>, LHS
3053486182U, // <5,0,5,2>: Cost 3 vtrnl <5,5,5,5>, LHS
- 3778707888U, // <5,0,5,3>: Cost 4 vext3 <3,4,0,5>, <0,5,3,0>
- 3778707902U, // <5,0,5,4>: Cost 4 vext3 <3,4,0,5>, <0,5,4,5>
+ 3723210589U, // <5,0,5,3>: Cost 4 vext2 <5,3,5,0>, <5,3,5,0>
+ 3766763966U, // <5,0,5,4>: Cost 4 vext3 <1,4,0,5>, <0,5,4,5>
2650796031U, // <5,0,5,5>: Cost 3 vext2 <5,5,5,0>, <5,5,5,0>
3719893090U, // <5,0,5,6>: Cost 4 vext2 <4,7,5,0>, <5,6,7,0>
3914067254U, // <5,0,5,7>: Cost 4 vuzpr <3,5,7,0>, RHS
@@ -3744,28 +3744,28 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689925800U, // <5,0,u,3>: Cost 3 vext3 <0,u,3,5>, <0,u,3,5>
2687124146U, // <5,0,u,4>: Cost 3 vext3 <0,4,1,5>, <0,u,4,6>
2638190746U, // <5,0,u,5>: Cost 3 vext2 <3,4,5,0>, RHS
- 2255778723U, // <5,0,u,6>: Cost 3 vrev <6,u,0,5>
+ 2589356723U, // <5,0,u,6>: Cost 3 vext1 <6,5,0,u>, <6,5,0,u>
2595280230U, // <5,0,u,7>: Cost 3 vext1 <7,5,0,2>, <7,4,5,6>
1613382355U, // <5,0,u,u>: Cost 2 vext3 <0,4,1,5>, LHS
2646818816U, // <5,1,0,0>: Cost 3 vext2 <4,u,5,1>, <0,0,0,0>
1573077094U, // <5,1,0,1>: Cost 2 vext2 <4,u,5,1>, LHS
2646818980U, // <5,1,0,2>: Cost 3 vext2 <4,u,5,1>, <0,2,0,2>
- 3760866036U, // <5,1,0,3>: Cost 4 vext3 <0,4,1,5>, <1,0,3,0>
- 2646819154U, // <5,1,0,4>: Cost 3 vext2 <4,u,5,1>, <0,4,1,5>
+ 2687124214U, // <5,1,0,3>: Cost 3 vext3 <0,4,1,5>, <1,0,3,2>
+ 2641510738U, // <5,1,0,4>: Cost 3 vext2 <4,0,5,1>, <0,4,1,5>
2641510814U, // <5,1,0,5>: Cost 3 vext2 <4,0,5,1>, <0,5,1,0>
3720561142U, // <5,1,0,6>: Cost 4 vext2 <4,u,5,1>, <0,6,1,7>
- 3798909726U, // <5,1,0,7>: Cost 4 vext3 <6,7,4,5>, <1,0,7,6>
+ 3298141357U, // <5,1,0,7>: Cost 4 vrev <1,5,7,0>
1573077661U, // <5,1,0,u>: Cost 2 vext2 <4,u,5,1>, LHS
- 2553536614U, // <5,1,1,0>: Cost 3 vext1 <0,5,1,1>, LHS
+ 2223891567U, // <5,1,1,0>: Cost 3 vrev <1,5,0,1>
2687124276U, // <5,1,1,1>: Cost 3 vext3 <0,4,1,5>, <1,1,1,1>
2646819734U, // <5,1,1,2>: Cost 3 vext2 <4,u,5,1>, <1,2,3,0>
2687124296U, // <5,1,1,3>: Cost 3 vext3 <0,4,1,5>, <1,1,3,3>
2691326803U, // <5,1,1,4>: Cost 3 vext3 <1,1,4,5>, <1,1,4,5>
2691400540U, // <5,1,1,5>: Cost 3 vext3 <1,1,5,5>, <1,1,5,5>
3765216101U, // <5,1,1,6>: Cost 4 vext3 <1,1,6,5>, <1,1,6,5>
- 3701982526U, // <5,1,1,7>: Cost 4 vext2 <1,7,5,1>, <1,7,5,1>
+ 3765289838U, // <5,1,1,7>: Cost 4 vext3 <1,1,7,5>, <1,1,7,5>
2687124341U, // <5,1,1,u>: Cost 3 vext3 <0,4,1,5>, <1,1,u,3>
- 3289776304U, // <5,1,2,0>: Cost 4 vrev <0,2,1,5>
+ 3297641584U, // <5,1,2,0>: Cost 4 vrev <1,5,0,2>
3763520391U, // <5,1,2,1>: Cost 4 vext3 <0,u,1,5>, <1,2,1,3>
2646820456U, // <5,1,2,2>: Cost 3 vext2 <4,u,5,1>, <2,2,2,2>
2687124374U, // <5,1,2,3>: Cost 3 vext3 <0,4,1,5>, <1,2,3,0>
@@ -3776,12 +3776,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2687124419U, // <5,1,2,u>: Cost 3 vext3 <0,4,1,5>, <1,2,u,0>
2577440870U, // <5,1,3,0>: Cost 3 vext1 <4,5,1,3>, LHS
2687124440U, // <5,1,3,1>: Cost 3 vext3 <0,4,1,5>, <1,3,1,3>
- 2228643507U, // <5,1,3,2>: Cost 3 vrev <2,3,1,5>
+ 3759686627U, // <5,1,3,2>: Cost 4 vext3 <0,2,3,5>, <1,3,2,5>
2692580332U, // <5,1,3,3>: Cost 3 vext3 <1,3,3,5>, <1,3,3,5>
2687124469U, // <5,1,3,4>: Cost 3 vext3 <0,4,1,5>, <1,3,4,5>
2685207552U, // <5,1,3,5>: Cost 3 vext3 <0,1,2,5>, <1,3,5,7>
- 2595361654U, // <5,1,3,6>: Cost 3 vext1 <7,5,1,3>, <6,7,4,5>
- 2595362192U, // <5,1,3,7>: Cost 3 vext1 <7,5,1,3>, <7,5,1,3>
+ 3760866313U, // <5,1,3,6>: Cost 4 vext3 <0,4,1,5>, <1,3,6,7>
+ 2692875280U, // <5,1,3,7>: Cost 3 vext3 <1,3,7,5>, <1,3,7,5>
2687124503U, // <5,1,3,u>: Cost 3 vext3 <0,4,1,5>, <1,3,u,3>
1567771538U, // <5,1,4,0>: Cost 2 vext2 <4,0,5,1>, <4,0,5,1>
2693096491U, // <5,1,4,1>: Cost 3 vext3 <1,4,1,5>, <1,4,1,5>
@@ -3790,7 +3790,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2646822096U, // <5,1,4,4>: Cost 3 vext2 <4,u,5,1>, <4,4,4,4>
1573080374U, // <5,1,4,5>: Cost 2 vext2 <4,u,5,1>, RHS
2646822260U, // <5,1,4,6>: Cost 3 vext2 <4,u,5,1>, <4,6,4,6>
- 3720564168U, // <5,1,4,7>: Cost 4 vext2 <4,u,5,1>, <4,7,5,0>
+ 3298174129U, // <5,1,4,7>: Cost 4 vrev <1,5,7,4>
1573080602U, // <5,1,4,u>: Cost 2 vext2 <4,u,5,1>, <4,u,5,1>
2687124591U, // <5,1,5,0>: Cost 3 vext3 <0,4,1,5>, <1,5,0,1>
2646822543U, // <5,1,5,1>: Cost 3 vext2 <4,u,5,1>, <5,1,0,1>
@@ -3816,7 +3816,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2040971366U, // <5,1,7,3>: Cost 2 vtrnr RHS, LHS
2559561014U, // <5,1,7,4>: Cost 3 vext1 <1,5,1,7>, RHS
2595393232U, // <5,1,7,5>: Cost 3 vext1 <7,5,1,7>, <5,1,7,3>
- 2646824454U, // <5,1,7,6>: Cost 3 vext2 <4,u,5,1>, <7,6,5,4>
+ 4188455035U, // <5,1,7,6>: Cost 4 vtrnr RHS, <0,1,4,6>
2646824556U, // <5,1,7,7>: Cost 3 vext2 <4,u,5,1>, <7,7,7,7>
2040971371U, // <5,1,7,u>: Cost 2 vtrnr RHS, LHS
1591662326U, // <5,1,u,0>: Cost 2 vext2 <u,0,5,1>, <u,0,5,1>
@@ -3833,9 +3833,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2641518756U, // <5,2,0,2>: Cost 3 vext2 <4,0,5,2>, <0,2,0,2>
3759760847U, // <5,2,0,3>: Cost 4 vext3 <0,2,4,5>, <2,0,3,2>
3760866775U, // <5,2,0,4>: Cost 4 vext3 <0,4,1,5>, <2,0,4,1>
- 3766912486U, // <5,2,0,5>: Cost 4 vext3 <1,4,2,5>, <2,0,5,7>
- 3775686121U, // <5,2,0,6>: Cost 4 vext3 <2,u,4,5>, <2,0,6,1>
- 3330331654U, // <5,2,0,7>: Cost 4 vrev <7,0,2,5>
+ 3759539680U, // <5,2,0,5>: Cost 4 vext3 <0,2,1,5>, <2,0,5,1>
+ 3760866796U, // <5,2,0,6>: Cost 4 vext3 <0,4,1,5>, <2,0,6,4>
+ 3304114054U, // <5,2,0,7>: Cost 4 vrev <2,5,7,0>
2628911773U, // <5,2,0,u>: Cost 3 vext2 <1,u,5,2>, LHS
2623603464U, // <5,2,1,0>: Cost 3 vext2 <1,0,5,2>, <1,0,5,2>
3698008921U, // <5,2,1,1>: Cost 4 vext2 <1,1,5,2>, <1,1,5,2>
@@ -3844,7 +3844,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3633327414U, // <5,2,1,4>: Cost 4 vext1 <1,5,2,1>, RHS
3759539760U, // <5,2,1,5>: Cost 4 vext3 <0,2,1,5>, <2,1,5,0>
3760866876U, // <5,2,1,6>: Cost 4 vext3 <0,4,1,5>, <2,1,6,3>
- 3330995287U, // <5,2,1,7>: Cost 4 vrev <7,1,2,5>
+ 3304122247U, // <5,2,1,7>: Cost 4 vrev <2,5,7,1>
2687125072U, // <5,2,1,u>: Cost 3 vext3 <0,4,1,5>, <2,1,u,5>
3633332326U, // <5,2,2,0>: Cost 4 vext1 <1,5,2,2>, LHS
3759760992U, // <5,2,2,1>: Cost 4 vext3 <0,2,4,5>, <2,2,1,3>
@@ -3853,7 +3853,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2697963133U, // <5,2,2,4>: Cost 3 vext3 <2,2,4,5>, <2,2,4,5>
3759466120U, // <5,2,2,5>: Cost 4 vext3 <0,2,0,5>, <2,2,5,7>
3760866960U, // <5,2,2,6>: Cost 4 vext3 <0,4,1,5>, <2,2,6,6>
- 3331658920U, // <5,2,2,7>: Cost 4 vrev <7,2,2,5>
+ 3771926168U, // <5,2,2,7>: Cost 4 vext3 <2,2,7,5>, <2,2,7,5>
2687125151U, // <5,2,2,u>: Cost 3 vext3 <0,4,1,5>, <2,2,u,3>
2687125158U, // <5,2,3,0>: Cost 3 vext3 <0,4,1,5>, <2,3,0,1>
2698405555U, // <5,2,3,1>: Cost 3 vext3 <2,3,1,5>, <2,3,1,5>
@@ -3865,13 +3865,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3702655716U, // <5,2,3,7>: Cost 4 vext2 <1,u,5,2>, <3,7,3,7>
1625179890U, // <5,2,3,u>: Cost 2 vext3 <2,3,u,5>, <2,3,u,5>
2641521555U, // <5,2,4,0>: Cost 3 vext2 <4,0,5,2>, <4,0,5,2>
- 3297150004U, // <5,2,4,1>: Cost 4 vrev <1,4,2,5>
+ 3772368642U, // <5,2,4,1>: Cost 4 vext3 <2,3,4,5>, <2,4,1,3>
2699142925U, // <5,2,4,2>: Cost 3 vext3 <2,4,2,5>, <2,4,2,5>
2698626838U, // <5,2,4,3>: Cost 3 vext3 <2,3,4,5>, <2,4,3,5>
2698626848U, // <5,2,4,4>: Cost 3 vext3 <2,3,4,5>, <2,4,4,6>
2628914486U, // <5,2,4,5>: Cost 3 vext2 <1,u,5,2>, RHS
2645503353U, // <5,2,4,6>: Cost 3 vext2 <4,6,5,2>, <4,6,5,2>
- 3332986186U, // <5,2,4,7>: Cost 4 vrev <7,4,2,5>
+ 3304146826U, // <5,2,4,7>: Cost 4 vrev <2,5,7,4>
2628914729U, // <5,2,4,u>: Cost 3 vext2 <1,u,5,2>, RHS
2553643110U, // <5,2,5,0>: Cost 3 vext1 <0,5,2,5>, LHS
3758950227U, // <5,2,5,1>: Cost 4 vext3 <0,1,2,5>, <2,5,1,3>
@@ -3892,7 +3892,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3719246670U, // <5,2,6,7>: Cost 4 vext2 <4,6,5,2>, <6,7,0,1>
2687125479U, // <5,2,6,u>: Cost 3 vext3 <0,4,1,5>, <2,6,u,7>
2565603430U, // <5,2,7,0>: Cost 3 vext1 <2,5,2,7>, LHS
- 3627402240U, // <5,2,7,1>: Cost 4 vext1 <0,5,2,7>, <1,3,5,7>
+ 2553660150U, // <5,2,7,1>: Cost 3 vext1 <0,5,2,7>, <1,0,3,2>
2565605216U, // <5,2,7,2>: Cost 3 vext1 <2,5,2,7>, <2,5,2,7>
2961178726U, // <5,2,7,3>: Cost 3 vzipr <1,3,5,7>, LHS
2565606710U, // <5,2,7,4>: Cost 3 vext1 <2,5,2,7>, RHS
@@ -3907,38 +3907,38 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1628203107U, // <5,2,u,4>: Cost 2 vext3 <2,u,4,5>, <2,u,4,5>
2628917402U, // <5,2,u,5>: Cost 3 vext2 <1,u,5,2>, RHS
2702092405U, // <5,2,u,6>: Cost 3 vext3 <2,u,6,5>, <2,u,6,5>
- 4188463318U, // <5,2,u,7>: Cost 4 vtrnr RHS, <0,2,5,7>
+ 3304179598U, // <5,2,u,7>: Cost 4 vrev <2,5,7,u>
1628498055U, // <5,2,u,u>: Cost 2 vext3 <2,u,u,5>, <2,u,u,5>
3760867467U, // <5,3,0,0>: Cost 4 vext3 <0,4,1,5>, <3,0,0,0>
2687125654U, // <5,3,0,1>: Cost 3 vext3 <0,4,1,5>, <3,0,1,2>
3759761565U, // <5,3,0,2>: Cost 4 vext3 <0,2,4,5>, <3,0,2,0>
3633391766U, // <5,3,0,3>: Cost 4 vext1 <1,5,3,0>, <3,0,1,2>
2687125680U, // <5,3,0,4>: Cost 3 vext3 <0,4,1,5>, <3,0,4,1>
- 3787704506U, // <5,3,0,5>: Cost 4 vext3 <4,u,5,5>, <3,0,5,2>
- 3763742921U, // <5,3,0,6>: Cost 5 vext3 <0,u,4,5>, <3,0,6,u>
- 4182500352U, // <5,3,0,7>: Cost 4 vtrnr <3,5,7,0>, <1,3,5,7>
+ 3760277690U, // <5,3,0,5>: Cost 4 vext3 <0,3,2,5>, <3,0,5,2>
+ 3310013014U, // <5,3,0,6>: Cost 4 vrev <3,5,6,0>
+ 2236344927U, // <5,3,0,7>: Cost 3 vrev <3,5,7,0>
2687125717U, // <5,3,0,u>: Cost 3 vext3 <0,4,1,5>, <3,0,u,2>
- 2595487846U, // <5,3,1,0>: Cost 3 vext1 <7,5,3,1>, LHS
- 2595488768U, // <5,3,1,1>: Cost 3 vext1 <7,5,3,1>, <1,3,5,7>
+ 3760867551U, // <5,3,1,0>: Cost 4 vext3 <0,4,1,5>, <3,1,0,3>
+ 3760867558U, // <5,3,1,1>: Cost 4 vext3 <0,4,1,5>, <3,1,1,1>
2624938923U, // <5,3,1,2>: Cost 3 vext2 <1,2,5,3>, <1,2,5,3>
- 2233436412U, // <5,3,1,3>: Cost 3 vrev <3,1,3,5>
- 2595491126U, // <5,3,1,4>: Cost 3 vext1 <7,5,3,1>, RHS
+ 2703198460U, // <5,3,1,3>: Cost 3 vext3 <3,1,3,5>, <3,1,3,5>
+ 3760867587U, // <5,3,1,4>: Cost 4 vext3 <0,4,1,5>, <3,1,4,3>
2636219536U, // <5,3,1,5>: Cost 3 vext2 <3,1,5,3>, <1,5,3,7>
3698681075U, // <5,3,1,6>: Cost 4 vext2 <1,2,5,3>, <1,6,5,7>
- 2257327200U, // <5,3,1,7>: Cost 3 vrev <7,1,3,5>
+ 2703493408U, // <5,3,1,7>: Cost 3 vext3 <3,1,7,5>, <3,1,7,5>
2628920721U, // <5,3,1,u>: Cost 3 vext2 <1,u,5,3>, <1,u,5,3>
- 3289923778U, // <5,3,2,0>: Cost 4 vrev <0,2,3,5>
- 2687125814U, // <5,3,2,1>: Cost 3 vext3 <0,4,1,5>, <3,2,1,0>
+ 3766765870U, // <5,3,2,0>: Cost 4 vext3 <1,4,0,5>, <3,2,0,1>
+ 3698681379U, // <5,3,2,1>: Cost 4 vext2 <1,2,5,3>, <2,1,3,5>
3760867649U, // <5,3,2,2>: Cost 4 vext3 <0,4,1,5>, <3,2,2,2>
2698627404U, // <5,3,2,3>: Cost 3 vext3 <2,3,4,5>, <3,2,3,4>
- 3633409334U, // <5,3,2,4>: Cost 4 vext1 <1,5,3,2>, RHS
- 3760277850U, // <5,3,2,5>: Cost 4 vext3 <0,3,2,5>, <3,2,5,0>
+ 2703935830U, // <5,3,2,4>: Cost 3 vext3 <3,2,4,5>, <3,2,4,5>
+ 2698627422U, // <5,3,2,5>: Cost 3 vext3 <2,3,4,5>, <3,2,5,4>
3760867686U, // <5,3,2,6>: Cost 4 vext3 <0,4,1,5>, <3,2,6,3>
3769788783U, // <5,3,2,7>: Cost 4 vext3 <1,u,5,5>, <3,2,7,3>
- 2698627445U, // <5,3,2,u>: Cost 3 vext3 <2,3,4,5>, <3,2,u,0>
+ 2701945209U, // <5,3,2,u>: Cost 3 vext3 <2,u,4,5>, <3,2,u,4>
3760867711U, // <5,3,3,0>: Cost 4 vext3 <0,4,1,5>, <3,3,0,1>
2636220684U, // <5,3,3,1>: Cost 3 vext2 <3,1,5,3>, <3,1,5,3>
- 3760867729U, // <5,3,3,2>: Cost 4 vext3 <0,4,1,5>, <3,3,2,1>
+ 3772369298U, // <5,3,3,2>: Cost 4 vext3 <2,3,4,5>, <3,3,2,2>
2687125916U, // <5,3,3,3>: Cost 3 vext3 <0,4,1,5>, <3,3,3,3>
2704599463U, // <5,3,3,4>: Cost 3 vext3 <3,3,4,5>, <3,3,4,5>
2704673200U, // <5,3,3,5>: Cost 3 vext3 <3,3,5,5>, <3,3,5,5>
@@ -3947,12 +3947,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2704894411U, // <5,3,3,u>: Cost 3 vext3 <3,3,u,5>, <3,3,u,5>
2704968148U, // <5,3,4,0>: Cost 3 vext3 <3,4,0,5>, <3,4,0,5>
3698682850U, // <5,3,4,1>: Cost 4 vext2 <1,2,5,3>, <4,1,5,0>
- 2705115622U, // <5,3,4,2>: Cost 3 vext3 <3,4,2,5>, <3,4,2,5>
+ 2642857014U, // <5,3,4,2>: Cost 3 vext2 <4,2,5,3>, <4,2,5,3>
2705189359U, // <5,3,4,3>: Cost 3 vext3 <3,4,3,5>, <3,4,3,5>
2705263096U, // <5,3,4,4>: Cost 3 vext3 <3,4,4,5>, <3,4,4,5>
2685946370U, // <5,3,4,5>: Cost 3 vext3 <0,2,3,5>, <3,4,5,6>
3779152394U, // <5,3,4,6>: Cost 4 vext3 <3,4,6,5>, <3,4,6,5>
- 3779226131U, // <5,3,4,7>: Cost 4 vext3 <3,4,7,5>, <3,4,7,5>
+ 2236377699U, // <5,3,4,7>: Cost 3 vrev <3,5,7,4>
2687126045U, // <5,3,4,u>: Cost 3 vext3 <0,4,1,5>, <3,4,u,6>
2571632742U, // <5,3,5,0>: Cost 3 vext1 <3,5,3,5>, LHS
2559689870U, // <5,3,5,1>: Cost 3 vext1 <1,5,3,5>, <1,5,3,5>
@@ -3961,7 +3961,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2571636022U, // <5,3,5,4>: Cost 3 vext1 <3,5,3,5>, RHS
2559692804U, // <5,3,5,5>: Cost 3 vext1 <1,5,3,5>, <5,5,5,5>
3720581218U, // <5,3,5,6>: Cost 4 vext2 <4,u,5,3>, <5,6,7,0>
- 2706147940U, // <5,3,5,7>: Cost 3 vext3 <3,5,7,5>, <3,5,7,5>
+ 2236385892U, // <5,3,5,7>: Cost 3 vrev <3,5,7,5>
2571638574U, // <5,3,5,u>: Cost 3 vext1 <3,5,3,5>, LHS
2565668966U, // <5,3,6,0>: Cost 3 vext1 <2,5,3,6>, LHS
3633439887U, // <5,3,6,1>: Cost 4 vext1 <1,5,3,6>, <1,5,3,6>
@@ -3969,7 +3969,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2565671426U, // <5,3,6,3>: Cost 3 vext1 <2,5,3,6>, <3,4,5,6>
2565672246U, // <5,3,6,4>: Cost 3 vext1 <2,5,3,6>, RHS
3639414630U, // <5,3,6,5>: Cost 4 vext1 <2,5,3,6>, <5,3,6,0>
- 3639415352U, // <5,3,6,6>: Cost 4 vext1 <2,5,3,6>, <6,3,5,2>
+ 4047521640U, // <5,3,6,6>: Cost 4 vzipr <3,4,5,6>, <2,5,3,6>
2725169844U, // <5,3,6,7>: Cost 3 vext3 <6,7,4,5>, <3,6,7,4>
2565674798U, // <5,3,6,u>: Cost 3 vext1 <2,5,3,6>, LHS
1485963366U, // <5,3,7,0>: Cost 2 vext1 <1,5,3,7>, LHS
@@ -3977,9 +3977,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2559706728U, // <5,3,7,2>: Cost 3 vext1 <1,5,3,7>, <2,2,2,2>
2559707286U, // <5,3,7,3>: Cost 3 vext1 <1,5,3,7>, <3,0,1,2>
1485966646U, // <5,3,7,4>: Cost 2 vext1 <1,5,3,7>, RHS
- 2559709039U, // <5,3,7,5>: Cost 3 vext1 <1,5,3,7>, <5,3,7,0>
+ 2559708880U, // <5,3,7,5>: Cost 3 vext1 <1,5,3,7>, <5,1,7,3>
2601513466U, // <5,3,7,6>: Cost 3 vext1 <u,5,3,7>, <6,2,7,3>
- 2559710480U, // <5,3,7,7>: Cost 3 vext1 <1,5,3,7>, <7,3,5,1>
+ 3114714112U, // <5,3,7,7>: Cost 3 vtrnr RHS, <1,3,5,7>
1485969198U, // <5,3,7,u>: Cost 2 vext1 <1,5,3,7>, LHS
1485971558U, // <5,3,u,0>: Cost 2 vext1 <1,5,3,u>, LHS
1485972625U, // <5,3,u,1>: Cost 2 vext1 <1,5,3,u>, <1,5,3,u>
@@ -3988,133 +3988,133 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1485974838U, // <5,3,u,4>: Cost 2 vext1 <1,5,3,u>, RHS
2687126342U, // <5,3,u,5>: Cost 3 vext3 <0,4,1,5>, <3,u,5,6>
2601521658U, // <5,3,u,6>: Cost 3 vext1 <u,5,3,u>, <6,2,7,3>
- 3114722304U, // <5,3,u,7>: Cost 3 vtrnr RHS, <1,3,5,7>
+ 2236410471U, // <5,3,u,7>: Cost 3 vrev <3,5,7,u>
1485977390U, // <5,3,u,u>: Cost 2 vext1 <1,5,3,u>, LHS
- 2663432192U, // <5,4,0,0>: Cost 3 vext2 <7,6,5,4>, <0,0,0,0>
- 1589690470U, // <5,4,0,1>: Cost 2 vext2 <7,6,5,4>, LHS
- 2663432356U, // <5,4,0,2>: Cost 3 vext2 <7,6,5,4>, <0,2,0,2>
- 2232846516U, // <5,4,0,3>: Cost 3 vrev <3,0,4,5>
+ 3627491430U, // <5,4,0,0>: Cost 4 vext1 <0,5,4,0>, LHS
+ 2636890214U, // <5,4,0,1>: Cost 3 vext2 <3,2,5,4>, LHS
+ 3703333028U, // <5,4,0,2>: Cost 4 vext2 <2,0,5,4>, <0,2,0,2>
+ 3782249348U, // <5,4,0,3>: Cost 4 vext3 <4,0,3,5>, <4,0,3,5>
2642198866U, // <5,4,0,4>: Cost 3 vext2 <4,1,5,4>, <0,4,1,5>
- 2713963410U, // <5,4,0,5>: Cost 3 vext3 <4,u,5,5>, <4,0,5,1>
- 2713963420U, // <5,4,0,6>: Cost 3 vext3 <4,u,5,5>, <4,0,6,2>
- 2256737304U, // <5,4,0,7>: Cost 3 vrev <7,0,4,5>
- 1589691037U, // <5,4,0,u>: Cost 2 vext2 <7,6,5,4>, LHS
- 2215592058U, // <5,4,1,0>: Cost 3 vrev <0,1,4,5>
- 2221564755U, // <5,4,1,1>: Cost 3 vrev <1,1,4,5>
- 2663433110U, // <5,4,1,2>: Cost 3 vext2 <7,6,5,4>, <1,2,3,0>
- 2663433176U, // <5,4,1,3>: Cost 3 vext2 <7,6,5,4>, <1,3,1,3>
- 3627502902U, // <5,4,1,4>: Cost 4 vext1 <0,5,4,1>, RHS
+ 2687126418U, // <5,4,0,5>: Cost 3 vext3 <0,4,1,5>, <4,0,5,1>
+ 2242243887U, // <5,4,0,6>: Cost 3 vrev <4,5,6,0>
+ 3316059448U, // <5,4,0,7>: Cost 4 vrev <4,5,7,0>
+ 2636890781U, // <5,4,0,u>: Cost 3 vext2 <3,2,5,4>, LHS
+ 2241809658U, // <5,4,1,0>: Cost 3 vrev <4,5,0,1>
+ 3698025307U, // <5,4,1,1>: Cost 4 vext2 <1,1,5,4>, <1,1,5,4>
+ 3698688940U, // <5,4,1,2>: Cost 4 vext2 <1,2,5,4>, <1,2,5,4>
+ 3698689024U, // <5,4,1,3>: Cost 4 vext2 <1,2,5,4>, <1,3,5,7>
+ 3700016206U, // <5,4,1,4>: Cost 4 vext2 <1,4,5,4>, <1,4,5,4>
2687126498U, // <5,4,1,5>: Cost 3 vext3 <0,4,1,5>, <4,1,5,0>
- 2709392368U, // <5,4,1,6>: Cost 3 vext3 <4,1,6,5>, <4,1,6,5>
- 3331142761U, // <5,4,1,7>: Cost 4 vrev <7,1,4,5>
- 2916748841U, // <5,4,1,u>: Cost 3 vzipl <5,1,7,3>, RHS
- 2216255691U, // <5,4,2,0>: Cost 3 vrev <0,2,4,5>
- 2222228388U, // <5,4,2,1>: Cost 3 vrev <1,2,4,5>
- 2228201085U, // <5,4,2,2>: Cost 3 vrev <2,2,4,5>
- 2638218958U, // <5,4,2,3>: Cost 3 vext2 <3,4,5,4>, <2,3,4,5>
+ 3760868336U, // <5,4,1,6>: Cost 4 vext3 <0,4,1,5>, <4,1,6,5>
+ 3316067641U, // <5,4,1,7>: Cost 4 vrev <4,5,7,1>
+ 2242399554U, // <5,4,1,u>: Cost 3 vrev <4,5,u,1>
+ 3703334371U, // <5,4,2,0>: Cost 4 vext2 <2,0,5,4>, <2,0,5,4>
+ 3703998004U, // <5,4,2,1>: Cost 4 vext2 <2,1,5,4>, <2,1,5,4>
+ 3704661637U, // <5,4,2,2>: Cost 4 vext2 <2,2,5,4>, <2,2,5,4>
+ 2636891854U, // <5,4,2,3>: Cost 3 vext2 <3,2,5,4>, <2,3,4,5>
3705988903U, // <5,4,2,4>: Cost 4 vext2 <2,4,5,4>, <2,4,5,4>
2698628150U, // <5,4,2,5>: Cost 3 vext3 <2,3,4,5>, <4,2,5,3>
- 2252091873U, // <5,4,2,6>: Cost 3 vrev <6,2,4,5>
- 3331806394U, // <5,4,2,7>: Cost 4 vrev <7,2,4,5>
- 2663434299U, // <5,4,2,u>: Cost 3 vext2 <7,6,5,4>, <2,u,0,1>
- 2589605990U, // <5,4,3,0>: Cost 3 vext1 <6,5,4,3>, LHS
- 2222892021U, // <5,4,3,1>: Cost 3 vrev <1,3,4,5>
- 1155122894U, // <5,4,3,2>: Cost 2 vrev <2,3,4,5>
- 2234837415U, // <5,4,3,3>: Cost 3 vrev <3,3,4,5>
+ 3760868415U, // <5,4,2,6>: Cost 4 vext3 <0,4,1,5>, <4,2,6,3>
+ 3783871562U, // <5,4,2,7>: Cost 4 vext3 <4,2,7,5>, <4,2,7,5>
+ 2666752099U, // <5,4,2,u>: Cost 3 vext2 <u,2,5,4>, <2,u,4,5>
+ 3639459942U, // <5,4,3,0>: Cost 4 vext1 <2,5,4,3>, LHS
+ 3709970701U, // <5,4,3,1>: Cost 4 vext2 <3,1,5,4>, <3,1,5,4>
+ 2636892510U, // <5,4,3,2>: Cost 3 vext2 <3,2,5,4>, <3,2,5,4>
+ 3710634396U, // <5,4,3,3>: Cost 4 vext2 <3,2,5,4>, <3,3,3,3>
2638219776U, // <5,4,3,4>: Cost 3 vext2 <3,4,5,4>, <3,4,5,4>
3766987908U, // <5,4,3,5>: Cost 4 vext3 <1,4,3,5>, <4,3,5,0>
- 2252755506U, // <5,4,3,6>: Cost 3 vrev <6,3,4,5>
- 2258728203U, // <5,4,3,7>: Cost 3 vrev <7,3,4,5>
- 1190959076U, // <5,4,3,u>: Cost 2 vrev <u,3,4,5>
+ 2710719634U, // <5,4,3,6>: Cost 3 vext3 <4,3,6,5>, <4,3,6,5>
+ 3914097664U, // <5,4,3,7>: Cost 4 vuzpr <3,5,7,4>, <1,3,5,7>
+ 2640874308U, // <5,4,3,u>: Cost 3 vext2 <3,u,5,4>, <3,u,5,4>
2583642214U, // <5,4,4,0>: Cost 3 vext1 <5,5,4,4>, LHS
2642201574U, // <5,4,4,1>: Cost 3 vext2 <4,1,5,4>, <4,1,5,4>
- 3303270175U, // <5,4,4,2>: Cost 4 vrev <2,4,4,5>
- 2235501048U, // <5,4,4,3>: Cost 3 vrev <3,4,4,5>
+ 3710635062U, // <5,4,4,2>: Cost 4 vext2 <3,2,5,4>, <4,2,5,3>
+ 3717270664U, // <5,4,4,3>: Cost 4 vext2 <4,3,5,4>, <4,3,5,4>
2713963728U, // <5,4,4,4>: Cost 3 vext3 <4,u,5,5>, <4,4,4,4>
- 1589693750U, // <5,4,4,5>: Cost 2 vext2 <7,6,5,4>, RHS
- 2713963748U, // <5,4,4,6>: Cost 3 vext3 <4,u,5,5>, <4,4,6,6>
+ 1637567706U, // <5,4,4,5>: Cost 2 vext3 <4,4,5,5>, <4,4,5,5>
+ 2242276659U, // <5,4,4,6>: Cost 3 vrev <4,5,6,4>
2646183372U, // <5,4,4,7>: Cost 3 vext2 <4,7,5,4>, <4,7,5,4>
- 1589693993U, // <5,4,4,u>: Cost 2 vext2 <7,6,5,4>, RHS
+ 1637788917U, // <5,4,4,u>: Cost 2 vext3 <4,4,u,5>, <4,4,u,5>
2559762534U, // <5,4,5,0>: Cost 3 vext1 <1,5,4,5>, LHS
- 2224219287U, // <5,4,5,1>: Cost 3 vrev <1,5,4,5>
+ 2559763607U, // <5,4,5,1>: Cost 3 vext1 <1,5,4,5>, <1,5,4,5>
2698628366U, // <5,4,5,2>: Cost 3 vext3 <2,3,4,5>, <4,5,2,3>
3633506454U, // <5,4,5,3>: Cost 4 vext1 <1,5,4,5>, <3,0,1,2>
2559765814U, // <5,4,5,4>: Cost 3 vext1 <1,5,4,5>, RHS
- 2248110075U, // <5,4,5,5>: Cost 3 vrev <5,5,4,5>
+ 2583654395U, // <5,4,5,5>: Cost 3 vext1 <5,5,4,5>, <5,5,4,5>
1613385014U, // <5,4,5,6>: Cost 2 vext3 <0,4,1,5>, RHS
- 2663436456U, // <5,4,5,7>: Cost 3 vext2 <7,6,5,4>, <5,7,5,7>
+ 3901639990U, // <5,4,5,7>: Cost 4 vuzpr <1,5,0,4>, RHS
1613385032U, // <5,4,5,u>: Cost 2 vext3 <0,4,1,5>, RHS
2559770726U, // <5,4,6,0>: Cost 3 vext1 <1,5,4,6>, LHS
2559771648U, // <5,4,6,1>: Cost 3 vext1 <1,5,4,6>, <1,3,5,7>
- 2230855617U, // <5,4,6,2>: Cost 3 vrev <2,6,4,5>
+ 3633514088U, // <5,4,6,2>: Cost 4 vext1 <1,5,4,6>, <2,2,2,2>
2571717122U, // <5,4,6,3>: Cost 3 vext1 <3,5,4,6>, <3,4,5,6>
2559774006U, // <5,4,6,4>: Cost 3 vext1 <1,5,4,6>, RHS
2712636796U, // <5,4,6,5>: Cost 3 vext3 <4,6,5,5>, <4,6,5,5>
- 2254746405U, // <5,4,6,6>: Cost 3 vrev <6,6,4,5>
+ 3760868743U, // <5,4,6,6>: Cost 4 vext3 <0,4,1,5>, <4,6,6,7>
2712784270U, // <5,4,6,7>: Cost 3 vext3 <4,6,7,5>, <4,6,7,5>
2559776558U, // <5,4,6,u>: Cost 3 vext1 <1,5,4,6>, LHS
2565750886U, // <5,4,7,0>: Cost 3 vext1 <2,5,4,7>, LHS
2565751706U, // <5,4,7,1>: Cost 3 vext1 <2,5,4,7>, <1,2,3,4>
2565752690U, // <5,4,7,2>: Cost 3 vext1 <2,5,4,7>, <2,5,4,7>
- 2237491947U, // <5,4,7,3>: Cost 3 vrev <3,7,4,5>
+ 2571725387U, // <5,4,7,3>: Cost 3 vext1 <3,5,4,7>, <3,5,4,7>
2565754166U, // <5,4,7,4>: Cost 3 vext1 <2,5,4,7>, RHS
3114713426U, // <5,4,7,5>: Cost 3 vtrnr RHS, <0,4,1,5>
- 1181668214U, // <5,4,7,6>: Cost 2 vrev <6,7,4,5>
- 2663437921U, // <5,4,7,7>: Cost 3 vext2 <7,6,5,4>, <7,7,6,5>
- 1591023272U, // <5,4,7,u>: Cost 2 vext2 <7,u,5,4>, <7,u,5,4>
- 2220237489U, // <5,4,u,0>: Cost 3 vrev <0,u,4,5>
- 1589696302U, // <5,4,u,1>: Cost 2 vext2 <7,6,5,4>, LHS
- 1158441059U, // <5,4,u,2>: Cost 2 vrev <2,u,4,5>
- 2238155580U, // <5,4,u,3>: Cost 3 vrev <3,u,4,5>
+ 94817590U, // <5,4,7,6>: Cost 1 vrev RHS
+ 2595616175U, // <5,4,7,7>: Cost 3 vext1 <7,5,4,7>, <7,5,4,7>
+ 94965064U, // <5,4,7,u>: Cost 1 vrev RHS
+ 2559787110U, // <5,4,u,0>: Cost 3 vext1 <1,5,4,u>, LHS
+ 2559788186U, // <5,4,u,1>: Cost 3 vext1 <1,5,4,u>, <1,5,4,u>
+ 2242014483U, // <5,4,u,2>: Cost 3 vrev <4,5,2,u>
+ 2667419628U, // <5,4,u,3>: Cost 3 vext2 <u,3,5,4>, <u,3,5,4>
2559790390U, // <5,4,u,4>: Cost 3 vext1 <1,5,4,u>, RHS
1640222238U, // <5,4,u,5>: Cost 2 vext3 <4,u,5,5>, <4,u,5,5>
- 1613385257U, // <5,4,u,6>: Cost 2 vext3 <0,4,1,5>, RHS
+ 94825783U, // <5,4,u,6>: Cost 1 vrev RHS
2714111536U, // <5,4,u,7>: Cost 3 vext3 <4,u,7,5>, <4,u,7,5>
- 1613385275U, // <5,4,u,u>: Cost 2 vext3 <0,4,1,5>, RHS
+ 94973257U, // <5,4,u,u>: Cost 1 vrev RHS
2646851584U, // <5,5,0,0>: Cost 3 vext2 <4,u,5,5>, <0,0,0,0>
1573109862U, // <5,5,0,1>: Cost 2 vext2 <4,u,5,5>, LHS
2646851748U, // <5,5,0,2>: Cost 3 vext2 <4,u,5,5>, <0,2,0,2>
3760279130U, // <5,5,0,3>: Cost 4 vext3 <0,3,2,5>, <5,0,3,2>
2687127138U, // <5,5,0,4>: Cost 3 vext3 <0,4,1,5>, <5,0,4,1>
- 2583687167U, // <5,5,0,5>: Cost 3 vext1 <5,5,5,0>, <5,5,5,0>
+ 2248142847U, // <5,5,0,5>: Cost 3 vrev <5,5,5,0>
3720593910U, // <5,5,0,6>: Cost 4 vext2 <4,u,5,5>, <0,6,1,7>
4182502710U, // <5,5,0,7>: Cost 4 vtrnr <3,5,7,0>, RHS
1573110429U, // <5,5,0,u>: Cost 2 vext2 <4,u,5,5>, LHS
- 2577719398U, // <5,5,1,0>: Cost 3 vext1 <4,5,5,1>, LHS
+ 2646852342U, // <5,5,1,0>: Cost 3 vext2 <4,u,5,5>, <1,0,3,2>
2624291676U, // <5,5,1,1>: Cost 3 vext2 <1,1,5,5>, <1,1,5,5>
2646852502U, // <5,5,1,2>: Cost 3 vext2 <4,u,5,5>, <1,2,3,0>
2646852568U, // <5,5,1,3>: Cost 3 vext2 <4,u,5,5>, <1,3,1,3>
- 2687127218U, // <5,5,1,4>: Cost 3 vext3 <0,4,1,5>, <5,1,4,0>
+ 2715217591U, // <5,5,1,4>: Cost 3 vext3 <5,1,4,5>, <5,1,4,5>
2628936848U, // <5,5,1,5>: Cost 3 vext2 <1,u,5,5>, <1,5,3,7>
3698033907U, // <5,5,1,6>: Cost 4 vext2 <1,1,5,5>, <1,6,5,7>
2713964240U, // <5,5,1,7>: Cost 3 vext3 <4,u,5,5>, <5,1,7,3>
- 2689781462U, // <5,5,1,u>: Cost 3 vext3 <0,u,1,5>, <5,1,u,0>
+ 2628937107U, // <5,5,1,u>: Cost 3 vext2 <1,u,5,5>, <1,u,5,5>
3645497446U, // <5,5,2,0>: Cost 4 vext1 <3,5,5,2>, LHS
- 3758952168U, // <5,5,2,1>: Cost 4 vext3 <0,1,2,5>, <5,2,1,0>
+ 3760869099U, // <5,5,2,1>: Cost 4 vext3 <0,4,1,5>, <5,2,1,3>
2646853224U, // <5,5,2,2>: Cost 3 vext2 <4,u,5,5>, <2,2,2,2>
2698628862U, // <5,5,2,3>: Cost 3 vext3 <2,3,4,5>, <5,2,3,4>
- 3760942851U, // <5,5,2,4>: Cost 4 vext3 <0,4,2,5>, <5,2,4,0>
+ 3772370694U, // <5,5,2,4>: Cost 4 vext3 <2,3,4,5>, <5,2,4,3>
2713964303U, // <5,5,2,5>: Cost 3 vext3 <4,u,5,5>, <5,2,5,3>
2646853562U, // <5,5,2,6>: Cost 3 vext2 <4,u,5,5>, <2,6,3,7>
4038198272U, // <5,5,2,7>: Cost 4 vzipr <1,u,5,2>, <1,3,5,7>
2701946667U, // <5,5,2,u>: Cost 3 vext3 <2,u,4,5>, <5,2,u,4>
2646853782U, // <5,5,3,0>: Cost 3 vext2 <4,u,5,5>, <3,0,1,2>
3698034922U, // <5,5,3,1>: Cost 4 vext2 <1,1,5,5>, <3,1,1,5>
- 2646853942U, // <5,5,3,2>: Cost 3 vext2 <4,u,5,5>, <3,2,1,0>
+ 3702679919U, // <5,5,3,2>: Cost 4 vext2 <1,u,5,5>, <3,2,7,3>
2637564336U, // <5,5,3,3>: Cost 3 vext2 <3,3,5,5>, <3,3,5,5>
2646854146U, // <5,5,3,4>: Cost 3 vext2 <4,u,5,5>, <3,4,5,6>
2638891602U, // <5,5,3,5>: Cost 3 vext2 <3,5,5,5>, <3,5,5,5>
3702680247U, // <5,5,3,6>: Cost 4 vext2 <1,u,5,5>, <3,6,7,7>
3702680259U, // <5,5,3,7>: Cost 4 vext2 <1,u,5,5>, <3,7,0,1>
- 2646854428U, // <5,5,3,u>: Cost 3 vext2 <4,u,5,5>, <3,u,1,0>
+ 2646854430U, // <5,5,3,u>: Cost 3 vext2 <4,u,5,5>, <3,u,1,2>
2646854546U, // <5,5,4,0>: Cost 3 vext2 <4,u,5,5>, <4,0,5,1>
- 3760869263U, // <5,5,4,1>: Cost 4 vext3 <0,4,1,5>, <5,4,1,5>
- 3759763347U, // <5,5,4,2>: Cost 4 vext3 <0,2,4,5>, <5,4,2,0>
- 2698629022U, // <5,5,4,3>: Cost 3 vext3 <2,3,4,5>, <5,4,3,2>
+ 2642209767U, // <5,5,4,1>: Cost 3 vext2 <4,1,5,5>, <4,1,5,5>
+ 3711306806U, // <5,5,4,2>: Cost 4 vext2 <3,3,5,5>, <4,2,5,3>
+ 3645516369U, // <5,5,4,3>: Cost 4 vext1 <3,5,5,4>, <3,5,5,4>
1570458842U, // <5,5,4,4>: Cost 2 vext2 <4,4,5,5>, <4,4,5,5>
1573113142U, // <5,5,4,5>: Cost 2 vext2 <4,u,5,5>, RHS
2645527932U, // <5,5,4,6>: Cost 3 vext2 <4,6,5,5>, <4,6,5,5>
- 2717429701U, // <5,5,4,7>: Cost 3 vext3 <5,4,7,5>, <5,4,7,5>
+ 2713964486U, // <5,5,4,7>: Cost 3 vext3 <4,u,5,5>, <5,4,7,6>
1573113374U, // <5,5,4,u>: Cost 2 vext2 <4,u,5,5>, <4,u,5,5>
1509982310U, // <5,5,5,0>: Cost 2 vext1 <5,5,5,5>, LHS
2646855376U, // <5,5,5,1>: Cost 3 vext2 <4,u,5,5>, <5,1,7,3>
@@ -4140,13 +4140,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2571799124U, // <5,5,7,3>: Cost 3 vext1 <3,5,5,7>, <3,5,5,7>
2571799862U, // <5,5,7,4>: Cost 3 vext1 <3,5,5,7>, RHS
3114717188U, // <5,5,7,5>: Cost 3 vtrnr RHS, <5,5,5,5>
- 2646857222U, // <5,5,7,6>: Cost 3 vext2 <4,u,5,5>, <7,6,5,4>
+ 4034923010U, // <5,5,7,6>: Cost 4 vzipr <1,3,5,7>, <3,4,5,6>
2040974646U, // <5,5,7,7>: Cost 2 vtrnr RHS, RHS
2040974647U, // <5,5,7,u>: Cost 2 vtrnr RHS, RHS
1509982310U, // <5,5,u,0>: Cost 2 vext1 <5,5,5,5>, LHS
1573115694U, // <5,5,u,1>: Cost 2 vext2 <4,u,5,5>, LHS
2571806414U, // <5,5,u,2>: Cost 3 vext1 <3,5,5,u>, <2,3,4,5>
- 2698924258U, // <5,5,u,3>: Cost 3 vext3 <2,3,u,5>, <5,u,3,2>
+ 2571807317U, // <5,5,u,3>: Cost 3 vext1 <3,5,5,u>, <3,5,5,u>
1509985590U, // <5,5,u,4>: Cost 2 vext1 <5,5,5,5>, RHS
229035318U, // <5,5,u,5>: Cost 1 vdup1 RHS
2646857936U, // <5,5,u,6>: Cost 3 vext2 <4,u,5,5>, <u,6,3,7>
@@ -4159,9 +4159,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2638233938U, // <5,6,0,4>: Cost 3 vext2 <3,4,5,6>, <0,4,1,5>
3706003885U, // <5,6,0,5>: Cost 4 vext2 <2,4,5,6>, <0,5,2,6>
3706003967U, // <5,6,0,6>: Cost 4 vext2 <2,4,5,6>, <0,6,2,7>
- 2662122052U, // <5,6,0,7>: Cost 3 vext2 <7,4,5,6>, <0,7,1,4>
+ 4047473974U, // <5,6,0,7>: Cost 4 vzipr <3,4,5,0>, RHS
1564492445U, // <5,6,0,u>: Cost 2 vext2 <3,4,5,6>, LHS
- 3700032228U, // <5,6,1,0>: Cost 4 vext2 <1,4,5,6>, <1,0,1,2>
+ 2638234358U, // <5,6,1,0>: Cost 3 vext2 <3,4,5,6>, <1,0,3,2>
2638234420U, // <5,6,1,1>: Cost 3 vext2 <3,4,5,6>, <1,1,1,1>
2638234518U, // <5,6,1,2>: Cost 3 vext2 <3,4,5,6>, <1,2,3,0>
2638234584U, // <5,6,1,3>: Cost 3 vext2 <3,4,5,6>, <1,3,1,3>
@@ -4171,7 +4171,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2982366518U, // <5,6,1,7>: Cost 3 vzipr <4,u,5,1>, RHS
2628945300U, // <5,6,1,u>: Cost 3 vext2 <1,u,5,6>, <1,u,5,6>
3706004925U, // <5,6,2,0>: Cost 4 vext2 <2,4,5,6>, <2,0,1,2>
- 3711976963U, // <5,6,2,1>: Cost 4 vext2 <3,4,5,6>, <2,1,0,0>
+ 3711976966U, // <5,6,2,1>: Cost 4 vext2 <3,4,5,6>, <2,1,0,3>
2638235240U, // <5,6,2,2>: Cost 3 vext2 <3,4,5,6>, <2,2,2,2>
2638235302U, // <5,6,2,3>: Cost 3 vext2 <3,4,5,6>, <2,3,0,1>
2632263465U, // <5,6,2,4>: Cost 3 vext2 <2,4,5,6>, <2,4,5,6>
@@ -4180,8 +4180,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2713965050U, // <5,6,2,7>: Cost 3 vext3 <4,u,5,5>, <6,2,7,3>
2634917997U, // <5,6,2,u>: Cost 3 vext2 <2,u,5,6>, <2,u,5,6>
2638235798U, // <5,6,3,0>: Cost 3 vext2 <3,4,5,6>, <3,0,1,2>
- 3711977702U, // <5,6,3,1>: Cost 4 vext2 <3,4,5,6>, <3,1,1,1>
- 2638235958U, // <5,6,3,2>: Cost 3 vext2 <3,4,5,6>, <3,2,1,0>
+ 3711977695U, // <5,6,3,1>: Cost 4 vext2 <3,4,5,6>, <3,1,0,3>
+ 3710650720U, // <5,6,3,2>: Cost 4 vext2 <3,2,5,6>, <3,2,5,6>
2638236060U, // <5,6,3,3>: Cost 3 vext2 <3,4,5,6>, <3,3,3,3>
1564494338U, // <5,6,3,4>: Cost 2 vext2 <3,4,5,6>, <3,4,5,6>
2638236234U, // <5,6,3,5>: Cost 3 vext2 <3,4,5,6>, <3,5,4,6>
@@ -4189,18 +4189,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
4034227510U, // <5,6,3,7>: Cost 4 vzipr <1,2,5,3>, RHS
1567148870U, // <5,6,3,u>: Cost 2 vext2 <3,u,5,6>, <3,u,5,6>
2577817702U, // <5,6,4,0>: Cost 3 vext1 <4,5,6,4>, LHS
- 3711978442U, // <5,6,4,1>: Cost 4 vext2 <3,4,5,6>, <4,1,2,3>
+ 3700034544U, // <5,6,4,1>: Cost 4 vext2 <1,4,5,6>, <4,1,6,5>
2723033713U, // <5,6,4,2>: Cost 3 vext3 <6,4,2,5>, <6,4,2,5>
- 2577820162U, // <5,6,4,3>: Cost 3 vext1 <4,5,6,4>, <3,4,5,6>
+ 2638236818U, // <5,6,4,3>: Cost 3 vext2 <3,4,5,6>, <4,3,6,5>
2644208859U, // <5,6,4,4>: Cost 3 vext2 <4,4,5,6>, <4,4,5,6>
1564495158U, // <5,6,4,5>: Cost 2 vext2 <3,4,5,6>, RHS
2645536125U, // <5,6,4,6>: Cost 3 vext2 <4,6,5,6>, <4,6,5,6>
- 2646199758U, // <5,6,4,7>: Cost 3 vext2 <4,7,5,6>, <4,7,5,6>
+ 2723402398U, // <5,6,4,7>: Cost 3 vext3 <6,4,7,5>, <6,4,7,5>
1564495401U, // <5,6,4,u>: Cost 2 vext2 <3,4,5,6>, RHS
2577825894U, // <5,6,5,0>: Cost 3 vext1 <4,5,6,5>, LHS
2662125264U, // <5,6,5,1>: Cost 3 vext2 <7,4,5,6>, <5,1,7,3>
3775836867U, // <5,6,5,2>: Cost 4 vext3 <2,u,6,5>, <6,5,2,6>
- 3711979330U, // <5,6,5,3>: Cost 4 vext2 <3,4,5,6>, <5,3,2,0>
+ 3711979343U, // <5,6,5,3>: Cost 4 vext2 <3,4,5,6>, <5,3,3,4>
2650181556U, // <5,6,5,4>: Cost 3 vext2 <5,4,5,6>, <5,4,5,6>
2662125572U, // <5,6,5,5>: Cost 3 vext2 <7,4,5,6>, <5,5,5,5>
2638237732U, // <5,6,5,6>: Cost 3 vext2 <3,4,5,6>, <5,6,0,1>
@@ -4211,18 +4211,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2662126074U, // <5,6,6,2>: Cost 3 vext2 <7,4,5,6>, <6,2,7,3>
2583808514U, // <5,6,6,3>: Cost 3 vext1 <5,5,6,6>, <3,4,5,6>
2583809334U, // <5,6,6,4>: Cost 3 vext1 <5,5,6,6>, RHS
- 2638238418U, // <5,6,6,5>: Cost 3 vext2 <3,4,5,6>, <6,5,4,3>
+ 2583810062U, // <5,6,6,5>: Cost 3 vext1 <5,5,6,6>, <5,5,6,6>
2638238520U, // <5,6,6,6>: Cost 3 vext2 <3,4,5,6>, <6,6,6,6>
2973781302U, // <5,6,6,7>: Cost 3 vzipr <3,4,5,6>, RHS
2973781303U, // <5,6,6,u>: Cost 3 vzipr <3,4,5,6>, RHS
430358630U, // <5,6,7,0>: Cost 1 vext1 RHS, LHS
- 1504101172U, // <5,6,7,1>: Cost 2 vext1 RHS, <1,1,1,1>
+ 1504101110U, // <5,6,7,1>: Cost 2 vext1 RHS, <1,0,3,2>
1504101992U, // <5,6,7,2>: Cost 2 vext1 RHS, <2,2,2,2>
1504102550U, // <5,6,7,3>: Cost 2 vext1 RHS, <3,0,1,2>
430361910U, // <5,6,7,4>: Cost 1 vext1 RHS, RHS
- 1504104452U, // <5,6,7,5>: Cost 2 vext1 RHS, <5,5,5,5>
+ 1504104390U, // <5,6,7,5>: Cost 2 vext1 RHS, <5,4,7,6>
1504105272U, // <5,6,7,6>: Cost 2 vext1 RHS, <6,6,6,6>
- 1504105990U, // <5,6,7,7>: Cost 2 vext1 RHS, <7,6,5,4>
+ 1504106092U, // <5,6,7,7>: Cost 2 vext1 RHS, <7,7,7,7>
430364462U, // <5,6,7,u>: Cost 1 vext1 RHS, LHS
430366822U, // <5,6,u,0>: Cost 1 vext1 RHS, LHS
1564497710U, // <5,6,u,1>: Cost 2 vext2 <3,4,5,6>, LHS
@@ -4240,9 +4240,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2625634642U, // <5,7,0,4>: Cost 3 vext2 <1,3,5,7>, <0,4,1,5>
2595778728U, // <5,7,0,5>: Cost 3 vext1 <7,5,7,0>, <5,7,5,7>
3699376639U, // <5,7,0,6>: Cost 4 vext2 <1,3,5,7>, <0,6,2,7>
- 2595780035U, // <5,7,0,7>: Cost 3 vext1 <7,5,7,0>, <7,5,7,0>
+ 2260235715U, // <5,7,0,7>: Cost 3 vrev <7,5,7,0>
1551893149U, // <5,7,0,u>: Cost 2 vext2 <1,3,5,7>, LHS
- 2571894886U, // <5,7,1,0>: Cost 3 vext1 <3,5,7,1>, LHS
+ 2625635062U, // <5,7,1,0>: Cost 3 vext2 <1,3,5,7>, <1,0,3,2>
2624308020U, // <5,7,1,1>: Cost 3 vext2 <1,1,5,7>, <1,1,1,1>
2625635222U, // <5,7,1,2>: Cost 3 vext2 <1,3,5,7>, <1,2,3,0>
1551893504U, // <5,7,1,3>: Cost 2 vext2 <1,3,5,7>, <1,3,5,7>
@@ -4252,7 +4252,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3702031684U, // <5,7,1,7>: Cost 4 vext2 <1,7,5,7>, <1,7,5,7>
1555211669U, // <5,7,1,u>: Cost 2 vext2 <1,u,5,7>, <1,u,5,7>
2629617126U, // <5,7,2,0>: Cost 3 vext2 <2,0,5,7>, <2,0,5,7>
- 3699377694U, // <5,7,2,1>: Cost 4 vext2 <1,3,5,7>, <2,1,3,0>
+ 3699377670U, // <5,7,2,1>: Cost 4 vext2 <1,3,5,7>, <2,1,0,3>
2625635944U, // <5,7,2,2>: Cost 3 vext2 <1,3,5,7>, <2,2,2,2>
2625636006U, // <5,7,2,3>: Cost 3 vext2 <1,3,5,7>, <2,3,0,1>
2632271658U, // <5,7,2,4>: Cost 3 vext2 <2,4,5,7>, <2,4,5,7>
@@ -4262,13 +4262,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2625636411U, // <5,7,2,u>: Cost 3 vext2 <1,3,5,7>, <2,u,0,1>
2625636502U, // <5,7,3,0>: Cost 3 vext2 <1,3,5,7>, <3,0,1,2>
2625636604U, // <5,7,3,1>: Cost 3 vext2 <1,3,5,7>, <3,1,3,5>
- 2625636662U, // <5,7,3,2>: Cost 3 vext2 <1,3,5,7>, <3,2,1,0>
+ 3699378478U, // <5,7,3,2>: Cost 4 vext2 <1,3,5,7>, <3,2,0,1>
2625636764U, // <5,7,3,3>: Cost 3 vext2 <1,3,5,7>, <3,3,3,3>
2625636866U, // <5,7,3,4>: Cost 3 vext2 <1,3,5,7>, <3,4,5,6>
2625636959U, // <5,7,3,5>: Cost 3 vext2 <1,3,5,7>, <3,5,7,0>
3699378808U, // <5,7,3,6>: Cost 4 vext2 <1,3,5,7>, <3,6,0,7>
2640235254U, // <5,7,3,7>: Cost 3 vext2 <3,7,5,7>, <3,7,5,7>
- 2625637148U, // <5,7,3,u>: Cost 3 vext2 <1,3,5,7>, <3,u,1,0>
+ 2625637150U, // <5,7,3,u>: Cost 3 vext2 <1,3,5,7>, <3,u,1,2>
2571919462U, // <5,7,4,0>: Cost 3 vext1 <3,5,7,4>, LHS
2571920384U, // <5,7,4,1>: Cost 3 vext1 <3,5,7,4>, <1,3,5,7>
3699379260U, // <5,7,4,2>: Cost 4 vext2 <1,3,5,7>, <4,2,6,0>
@@ -4281,7 +4281,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2583871590U, // <5,7,5,0>: Cost 3 vext1 <5,5,7,5>, LHS
2652180176U, // <5,7,5,1>: Cost 3 vext2 <5,7,5,7>, <5,1,7,3>
2625638177U, // <5,7,5,2>: Cost 3 vext2 <1,3,5,7>, <5,2,7,3>
- 2625638271U, // <5,7,5,3>: Cost 3 vext2 <1,3,5,7>, <5,3,u,7>
+ 2625638262U, // <5,7,5,3>: Cost 3 vext2 <1,3,5,7>, <5,3,7,7>
2583874870U, // <5,7,5,4>: Cost 3 vext1 <5,5,7,5>, RHS
2846281732U, // <5,7,5,5>: Cost 3 vuzpr RHS, <5,5,5,5>
2651517015U, // <5,7,5,6>: Cost 3 vext2 <5,6,5,7>, <5,6,5,7>
@@ -4292,7 +4292,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2846281108U, // <5,7,6,2>: Cost 3 vuzpr RHS, <4,6,u,2>
2589854210U, // <5,7,6,3>: Cost 3 vext1 <6,5,7,6>, <3,4,5,6>
2846281830U, // <5,7,6,4>: Cost 3 vuzpr RHS, <5,6,7,4>
- 2713966086U, // <5,7,6,5>: Cost 3 vext3 <4,u,5,5>, <7,6,5,4>
+ 2725467658U, // <5,7,6,5>: Cost 3 vext3 <6,7,u,5>, <7,6,5,u>
2846281076U, // <5,7,6,6>: Cost 3 vuzpr RHS, <4,6,4,6>
2846279610U, // <5,7,6,7>: Cost 3 vuzpr RHS, <2,6,3,7>
2846279611U, // <5,7,6,u>: Cost 3 vuzpr RHS, <2,6,3,u>
@@ -4307,7 +4307,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1510151982U, // <5,7,7,u>: Cost 2 vext1 <5,5,7,7>, LHS
1510154342U, // <5,7,u,0>: Cost 2 vext1 <5,5,7,u>, LHS
1551898414U, // <5,7,u,1>: Cost 2 vext2 <1,3,5,7>, LHS
- 2625640307U, // <5,7,u,2>: Cost 3 vext2 <1,3,5,7>, <u,2,1,0>
+ 2625640325U, // <5,7,u,2>: Cost 3 vext2 <1,3,5,7>, <u,2,3,0>
1772536477U, // <5,7,u,3>: Cost 2 vuzpr RHS, LHS
1510157622U, // <5,7,u,4>: Cost 2 vext1 <5,5,7,u>, RHS
1551898778U, // <5,7,u,5>: Cost 2 vext2 <1,3,5,7>, RHS
@@ -4317,14 +4317,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2625642496U, // <5,u,0,0>: Cost 3 vext2 <1,3,5,u>, <0,0,0,0>
1551900774U, // <5,u,0,1>: Cost 2 vext2 <1,3,5,u>, LHS
2625642660U, // <5,u,0,2>: Cost 3 vext2 <1,3,5,u>, <0,2,0,2>
- 2233141464U, // <5,u,0,3>: Cost 3 vrev <3,0,u,5>
+ 2698630885U, // <5,u,0,3>: Cost 3 vext3 <2,3,4,5>, <u,0,3,2>
2687129325U, // <5,u,0,4>: Cost 3 vext3 <0,4,1,5>, <u,0,4,1>
- 2595852457U, // <5,u,0,5>: Cost 3 vext1 <7,5,u,0>, <5,7,5,u>
- 2737116928U, // <5,u,0,6>: Cost 3 vext3 <u,7,4,5>, <u,0,6,2>
- 2257032252U, // <5,u,0,7>: Cost 3 vrev <7,0,u,5>
+ 2689783542U, // <5,u,0,5>: Cost 3 vext3 <0,u,1,5>, <u,0,5,1>
+ 2266134675U, // <5,u,0,6>: Cost 3 vrev <u,5,6,0>
+ 2595853772U, // <5,u,0,7>: Cost 3 vext1 <7,5,u,0>, <7,5,u,0>
1551901341U, // <5,u,0,u>: Cost 2 vext2 <1,3,5,u>, LHS
- 2560024678U, // <5,u,1,0>: Cost 3 vext1 <1,5,u,1>, LHS
- 2221859703U, // <5,u,1,1>: Cost 3 vrev <1,1,u,5>
+ 2625643254U, // <5,u,1,0>: Cost 3 vext2 <1,3,5,u>, <1,0,3,2>
+ 2625643316U, // <5,u,1,1>: Cost 3 vext2 <1,3,5,u>, <1,1,1,1>
1613387566U, // <5,u,1,2>: Cost 2 vext3 <0,4,1,5>, LHS
1551901697U, // <5,u,1,3>: Cost 2 vext2 <1,3,5,u>, <1,3,5,u>
2626307154U, // <5,u,1,4>: Cost 3 vext2 <1,4,5,u>, <1,4,5,u>
@@ -4332,8 +4332,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2627634420U, // <5,u,1,6>: Cost 3 vext2 <1,6,5,u>, <1,6,5,u>
2982366536U, // <5,u,1,7>: Cost 3 vzipr <4,u,5,1>, RHS
1613387620U, // <5,u,1,u>: Cost 2 vext3 <0,4,1,5>, LHS
- 2216550639U, // <5,u,2,0>: Cost 3 vrev <0,2,u,5>
- 2687129459U, // <5,u,2,1>: Cost 3 vext3 <0,4,1,5>, <u,2,1,0>
+ 2846286742U, // <5,u,2,0>: Cost 3 vuzpr RHS, <1,2,3,0>
+ 2685796528U, // <5,u,2,1>: Cost 3 vext3 <0,2,1,5>, <0,2,1,5>
2625644136U, // <5,u,2,2>: Cost 3 vext2 <1,3,5,u>, <2,2,2,2>
2687129480U, // <5,u,2,3>: Cost 3 vext3 <0,4,1,5>, <u,2,3,3>
2632279851U, // <5,u,2,4>: Cost 3 vext2 <2,4,5,u>, <2,4,5,u>
@@ -4342,12 +4342,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2713966508U, // <5,u,2,7>: Cost 3 vext3 <4,u,5,5>, <u,2,7,3>
2625644603U, // <5,u,2,u>: Cost 3 vext2 <1,3,5,u>, <2,u,0,1>
2687129532U, // <5,u,3,0>: Cost 3 vext3 <0,4,1,5>, <u,3,0,1>
- 2223186969U, // <5,u,3,1>: Cost 3 vrev <1,3,u,5>
- 1155417842U, // <5,u,3,2>: Cost 2 vrev <2,3,u,5>
+ 2636261649U, // <5,u,3,1>: Cost 3 vext2 <3,1,5,u>, <3,1,5,u>
+ 2636925282U, // <5,u,3,2>: Cost 3 vext2 <3,2,5,u>, <3,2,5,u>
2625644956U, // <5,u,3,3>: Cost 3 vext2 <1,3,5,u>, <3,3,3,3>
1564510724U, // <5,u,3,4>: Cost 2 vext2 <3,4,5,u>, <3,4,5,u>
2625645160U, // <5,u,3,5>: Cost 3 vext2 <1,3,5,u>, <3,5,u,0>
- 2253050454U, // <5,u,3,6>: Cost 3 vrev <6,3,u,5>
+ 2734610422U, // <5,u,3,6>: Cost 3 vext3 <u,3,6,5>, <u,3,6,5>
2640243447U, // <5,u,3,7>: Cost 3 vext2 <3,7,5,u>, <3,7,5,u>
1567165256U, // <5,u,3,u>: Cost 2 vext2 <3,u,5,u>, <3,u,5,u>
1567828889U, // <5,u,4,0>: Cost 2 vext2 <4,0,5,u>, <4,0,5,u>
@@ -4360,7 +4360,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2646216144U, // <5,u,4,7>: Cost 3 vext2 <4,7,5,u>, <4,7,5,u>
1551904297U, // <5,u,4,u>: Cost 2 vext2 <1,3,5,u>, RHS
1509982310U, // <5,u,5,0>: Cost 2 vext1 <5,5,5,5>, LHS
- 2224514235U, // <5,u,5,1>: Cost 3 vrev <1,5,u,5>
+ 2560058555U, // <5,u,5,1>: Cost 3 vext1 <1,5,u,5>, <1,5,u,5>
2698926194U, // <5,u,5,2>: Cost 3 vext3 <2,3,u,5>, <u,5,2,3>
2698631295U, // <5,u,5,3>: Cost 3 vext3 <2,3,4,5>, <u,5,3,7>
1509985590U, // <5,u,5,4>: Cost 2 vext1 <5,5,5,5>, RHS
@@ -4373,7 +4373,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2566039445U, // <5,u,6,2>: Cost 3 vext1 <2,5,u,6>, <2,5,u,6>
2687129808U, // <5,u,6,3>: Cost 3 vext3 <0,4,1,5>, <u,6,3,7>
2566040886U, // <5,u,6,4>: Cost 3 vext1 <2,5,u,6>, RHS
- 2713966815U, // <5,u,6,5>: Cost 3 vext3 <4,u,5,5>, <u,6,5,4>
+ 2920044698U, // <5,u,6,5>: Cost 3 vzipl <5,6,7,0>, RHS
2846289268U, // <5,u,6,6>: Cost 3 vuzpr RHS, <4,6,4,6>
2973781320U, // <5,u,6,7>: Cost 3 vzipr <3,4,5,6>, RHS
2687129853U, // <5,u,6,u>: Cost 3 vext3 <0,4,1,5>, <u,6,u,7>
@@ -4383,7 +4383,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2040971933U, // <5,u,7,3>: Cost 2 vtrnr RHS, LHS
430509384U, // <5,u,7,4>: Cost 1 vext1 RHS, RHS
1504251600U, // <5,u,7,5>: Cost 2 vext1 RHS, <5,1,7,3>
- 1504252410U, // <5,u,7,6>: Cost 2 vext1 RHS, <6,2,7,3>
+ 118708378U, // <5,u,7,6>: Cost 1 vrev RHS
2040974889U, // <5,u,7,7>: Cost 2 vtrnr RHS, RHS
430511918U, // <5,u,7,u>: Cost 1 vext1 RHS, LHS
430514278U, // <5,u,u,0>: Cost 1 vext1 RHS, LHS
@@ -4392,7 +4392,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1772544669U, // <5,u,u,3>: Cost 2 vuzpr RHS, LHS
430517577U, // <5,u,u,4>: Cost 1 vext1 RHS, RHS
229035318U, // <5,u,u,5>: Cost 1 vdup1 RHS
- 1613388173U, // <5,u,u,6>: Cost 2 vext3 <0,4,1,5>, RHS
+ 118716571U, // <5,u,u,6>: Cost 1 vrev RHS
1772547625U, // <5,u,u,7>: Cost 2 vuzpr RHS, RHS
430520110U, // <5,u,u,u>: Cost 1 vext1 RHS, LHS
2686025728U, // <6,0,0,0>: Cost 3 vext3 <0,2,4,6>, <0,0,0,0>
@@ -4401,17 +4401,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3779084320U, // <6,0,0,3>: Cost 4 vext3 <3,4,5,6>, <0,0,3,5>
2642903388U, // <6,0,0,4>: Cost 3 vext2 <4,2,6,0>, <0,4,2,6>
3657723939U, // <6,0,0,5>: Cost 4 vext1 <5,6,0,0>, <5,6,0,0>
- 3706028556U, // <6,0,0,6>: Cost 4 vext2 <2,4,6,0>, <0,6,4,2>
+ 3926676514U, // <6,0,0,6>: Cost 4 vuzpr <5,6,7,0>, <7,0,5,6>
3926675786U, // <6,0,0,7>: Cost 4 vuzpr <5,6,7,0>, <6,0,5,7>
2686025802U, // <6,0,0,u>: Cost 3 vext3 <0,2,4,6>, <0,0,u,2>
2566070374U, // <6,0,1,0>: Cost 3 vext1 <2,6,0,1>, LHS
- 3759767643U, // <6,0,1,1>: Cost 4 vext3 <0,2,4,6>, <0,1,1,1>
+ 3759767642U, // <6,0,1,1>: Cost 4 vext3 <0,2,4,6>, <0,1,1,0>
1612284006U, // <6,0,1,2>: Cost 2 vext3 <0,2,4,6>, LHS
2583988738U, // <6,0,1,3>: Cost 3 vext1 <5,6,0,1>, <3,4,5,6>
2566073654U, // <6,0,1,4>: Cost 3 vext1 <2,6,0,1>, RHS
2583990308U, // <6,0,1,5>: Cost 3 vext1 <5,6,0,1>, <5,6,0,1>
2589963005U, // <6,0,1,6>: Cost 3 vext1 <6,6,0,1>, <6,6,0,1>
- 3651761146U, // <6,0,1,7>: Cost 4 vext1 <4,6,0,1>, <7,0,1,2>
+ 2595935702U, // <6,0,1,7>: Cost 3 vext1 <7,6,0,1>, <7,6,0,1>
1612284060U, // <6,0,1,u>: Cost 2 vext3 <0,2,4,6>, LHS
2686025892U, // <6,0,2,0>: Cost 3 vext3 <0,2,4,6>, <0,2,0,2>
2685804721U, // <6,0,2,1>: Cost 3 vext3 <0,2,1,6>, <0,2,1,6>
@@ -4430,21 +4430,21 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3718638154U, // <6,0,3,5>: Cost 4 vext2 <4,5,6,0>, <3,5,4,6>
3729918619U, // <6,0,3,6>: Cost 4 vext2 <6,4,6,0>, <3,6,4,6>
3926672384U, // <6,0,3,7>: Cost 4 vuzpr <5,6,7,0>, <1,3,5,7>
- 2705342783U, // <6,0,3,u>: Cost 3 vext3 <3,4,5,6>, <0,3,u,4>
+ 2705342784U, // <6,0,3,u>: Cost 3 vext3 <3,4,5,6>, <0,3,u,5>
2687058250U, // <6,0,4,0>: Cost 3 vext3 <0,4,0,6>, <0,4,0,6>
2686026066U, // <6,0,4,1>: Cost 3 vext3 <0,2,4,6>, <0,4,1,5>
1613463900U, // <6,0,4,2>: Cost 2 vext3 <0,4,2,6>, <0,4,2,6>
- 2235214293U, // <6,0,4,3>: Cost 3 vrev <3,4,0,6>
+ 3761021285U, // <6,0,4,3>: Cost 4 vext3 <0,4,3,6>, <0,4,3,6>
2687353198U, // <6,0,4,4>: Cost 3 vext3 <0,4,4,6>, <0,4,4,6>
2632289590U, // <6,0,4,5>: Cost 3 vext2 <2,4,6,0>, RHS
2645560704U, // <6,0,4,6>: Cost 3 vext2 <4,6,6,0>, <4,6,6,0>
- 2259105081U, // <6,0,4,7>: Cost 3 vrev <7,4,0,6>
+ 2646224337U, // <6,0,4,7>: Cost 3 vext2 <4,7,6,0>, <4,7,6,0>
1613906322U, // <6,0,4,u>: Cost 2 vext3 <0,4,u,6>, <0,4,u,6>
- 3721293427U, // <6,0,5,0>: Cost 4 vext2 <5,0,6,0>, <5,0,6,0>
+ 3651788902U, // <6,0,5,0>: Cost 4 vext1 <4,6,0,5>, LHS
2687795620U, // <6,0,5,1>: Cost 3 vext3 <0,5,1,6>, <0,5,1,6>
3761611181U, // <6,0,5,2>: Cost 4 vext3 <0,5,2,6>, <0,5,2,6>
3723284326U, // <6,0,5,3>: Cost 4 vext2 <5,3,6,0>, <5,3,6,0>
- 3791028669U, // <6,0,5,4>: Cost 4 vext3 <5,4,5,6>, <0,5,4,4>
+ 2646224838U, // <6,0,5,4>: Cost 3 vext2 <4,7,6,0>, <5,4,7,6>
3718639630U, // <6,0,5,5>: Cost 4 vext2 <4,5,6,0>, <5,5,6,6>
2652196962U, // <6,0,5,6>: Cost 3 vext2 <5,7,6,0>, <5,6,7,0>
2852932918U, // <6,0,5,7>: Cost 3 vuzpr <5,6,7,0>, RHS
@@ -4454,7 +4454,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3060203622U, // <6,0,6,2>: Cost 3 vtrnl <6,6,6,6>, LHS
3718640178U, // <6,0,6,3>: Cost 4 vext2 <4,5,6,0>, <6,3,4,5>
2656178832U, // <6,0,6,4>: Cost 3 vext2 <6,4,6,0>, <6,4,6,0>
- 3718640338U, // <6,0,6,5>: Cost 4 vext2 <4,5,6,0>, <6,5,4,3>
+ 3725939378U, // <6,0,6,5>: Cost 4 vext2 <5,7,6,0>, <6,5,0,7>
2657506098U, // <6,0,6,6>: Cost 3 vext2 <6,6,6,0>, <6,6,6,0>
2619020110U, // <6,0,6,7>: Cost 3 vext2 <0,2,6,0>, <6,7,0,1>
2925986461U, // <6,0,6,u>: Cost 3 vzipl <6,6,6,6>, LHS
@@ -4463,9 +4463,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2980495524U, // <6,0,7,2>: Cost 3 vzipr RHS, <0,2,0,2>
2572094072U, // <6,0,7,3>: Cost 3 vext1 <3,6,0,7>, <3,6,0,7>
2572094774U, // <6,0,7,4>: Cost 3 vext1 <3,6,0,7>, RHS
- 4054239700U, // <6,0,7,5>: Cost 4 vzipr RHS, <3,4,0,5>
+ 4054238242U, // <6,0,7,5>: Cost 4 vzipr RHS, <1,4,0,5>
3645837653U, // <6,0,7,6>: Cost 4 vext1 <3,6,0,7>, <6,0,7,0>
- 3645838376U, // <6,0,7,7>: Cost 4 vext1 <3,6,0,7>, <7,0,6,3>
+ 4054239054U, // <6,0,7,7>: Cost 4 vzipr RHS, <2,5,0,7>
2572097326U, // <6,0,7,u>: Cost 3 vext1 <3,6,0,7>, LHS
2686026378U, // <6,0,u,0>: Cost 3 vext3 <0,2,4,6>, <0,u,0,2>
2686026386U, // <6,0,u,1>: Cost 3 vext3 <0,2,4,6>, <0,u,1,1>
@@ -4476,15 +4476,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2590020356U, // <6,0,u,6>: Cost 3 vext1 <6,6,0,u>, <6,6,0,u>
2852933161U, // <6,0,u,7>: Cost 3 vuzpr <5,6,7,0>, RHS
1612284627U, // <6,0,u,u>: Cost 2 vext3 <0,2,4,6>, LHS
- 2641584138U, // <6,1,0,0>: Cost 3 vext2 <4,0,6,1>, <0,0,1,1>
+ 2595995750U, // <6,1,0,0>: Cost 3 vext1 <7,6,1,0>, LHS
2646229094U, // <6,1,0,1>: Cost 3 vext2 <4,7,6,1>, LHS
3694092492U, // <6,1,0,2>: Cost 4 vext2 <0,4,6,1>, <0,2,4,6>
- 3121365094U, // <6,1,0,3>: Cost 3 vtrnr <5,6,7,0>, LHS
- 3694092667U, // <6,1,0,4>: Cost 4 vext2 <0,4,6,1>, <0,4,6,1>
+ 2686026486U, // <6,1,0,3>: Cost 3 vext3 <0,2,4,6>, <1,0,3,2>
+ 2595999030U, // <6,1,0,4>: Cost 3 vext1 <7,6,1,0>, RHS
3767730952U, // <6,1,0,5>: Cost 4 vext3 <1,5,4,6>, <1,0,5,2>
- 3696747007U, // <6,1,0,6>: Cost 4 vext2 <0,u,6,1>, <0,6,2,7>
- 2256524286U, // <6,1,0,7>: Cost 3 vrev <7,0,1,6>
- 2646229661U, // <6,1,0,u>: Cost 3 vext2 <4,7,6,1>, LHS
+ 2596000590U, // <6,1,0,6>: Cost 3 vext1 <7,6,1,0>, <6,7,0,1>
+ 2596001246U, // <6,1,0,7>: Cost 3 vext1 <7,6,1,0>, <7,6,1,0>
+ 2686026531U, // <6,1,0,u>: Cost 3 vext3 <0,2,4,6>, <1,0,u,2>
3763602219U, // <6,1,1,0>: Cost 4 vext3 <0,u,2,6>, <1,1,0,1>
2686026548U, // <6,1,1,1>: Cost 3 vext3 <0,2,4,6>, <1,1,1,1>
3764929346U, // <6,1,1,2>: Cost 4 vext3 <1,1,2,6>, <1,1,2,6>
@@ -4492,7 +4492,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2691334996U, // <6,1,1,4>: Cost 3 vext3 <1,1,4,6>, <1,1,4,6>
3760874332U, // <6,1,1,5>: Cost 4 vext3 <0,4,1,6>, <1,1,5,5>
3765224294U, // <6,1,1,6>: Cost 4 vext3 <1,1,6,6>, <1,1,6,6>
- 3330929743U, // <6,1,1,7>: Cost 4 vrev <7,1,1,6>
+ 3669751263U, // <6,1,1,7>: Cost 4 vext1 <7,6,1,1>, <7,6,1,1>
2686026613U, // <6,1,1,u>: Cost 3 vext3 <0,2,4,6>, <1,1,u,3>
2554208358U, // <6,1,2,0>: Cost 3 vext1 <0,6,1,2>, LHS
3763602311U, // <6,1,2,1>: Cost 4 vext3 <0,u,2,6>, <1,2,1,3>
@@ -4501,7 +4501,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2554211638U, // <6,1,2,4>: Cost 3 vext1 <0,6,1,2>, RHS
3760874411U, // <6,1,2,5>: Cost 4 vext3 <0,4,1,6>, <1,2,5,3>
2554212858U, // <6,1,2,6>: Cost 3 vext1 <0,6,1,2>, <6,2,7,3>
- 3331593376U, // <6,1,2,7>: Cost 4 vrev <7,2,1,6>
+ 3802973114U, // <6,1,2,7>: Cost 4 vext3 <7,4,5,6>, <1,2,7,0>
2686026691U, // <6,1,2,u>: Cost 3 vext3 <0,2,4,6>, <1,2,u,0>
2566160486U, // <6,1,3,0>: Cost 3 vext1 <2,6,1,3>, LHS
2686026712U, // <6,1,3,1>: Cost 3 vext3 <0,2,4,6>, <1,3,1,3>
@@ -4555,27 +4555,27 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2687206795U, // <6,1,u,4>: Cost 3 vext3 <0,4,2,6>, <1,u,4,6>
2686027157U, // <6,1,u,5>: Cost 3 vext3 <0,2,4,6>, <1,u,5,7>
2590094093U, // <6,1,u,6>: Cost 3 vext1 <6,6,1,u>, <6,6,1,u>
- 2261833350U, // <6,1,u,7>: Cost 3 vrev <7,u,1,6>
+ 2596066790U, // <6,1,u,7>: Cost 3 vext1 <7,6,1,u>, <7,6,1,u>
2686027177U, // <6,1,u,u>: Cost 3 vext3 <0,2,4,6>, <1,u,u,0>
- 2578153574U, // <6,2,0,0>: Cost 3 vext1 <4,6,2,0>, LHS
+ 2646900736U, // <6,2,0,0>: Cost 3 vext2 <4,u,6,2>, <0,0,0,0>
1573159014U, // <6,2,0,1>: Cost 2 vext2 <4,u,6,2>, LHS
- 2578155174U, // <6,2,0,2>: Cost 3 vext1 <4,6,2,0>, <2,3,0,1>
+ 2646900900U, // <6,2,0,2>: Cost 3 vext2 <4,u,6,2>, <0,2,0,2>
3759769037U, // <6,2,0,3>: Cost 4 vext3 <0,2,4,6>, <2,0,3,0>
- 2578156854U, // <6,2,0,4>: Cost 3 vext1 <4,6,2,0>, RHS
- 3779085798U, // <6,2,0,5>: Cost 4 vext3 <3,4,5,6>, <2,0,5,7>
- 2554270542U, // <6,2,0,6>: Cost 3 vext1 <0,6,2,0>, <6,7,0,1>
- 3651900410U, // <6,2,0,7>: Cost 4 vext1 <4,6,2,0>, <7,0,1,2>
+ 2641592668U, // <6,2,0,4>: Cost 3 vext2 <4,0,6,2>, <0,4,2,6>
+ 3779085794U, // <6,2,0,5>: Cost 4 vext3 <3,4,5,6>, <2,0,5,3>
+ 2686027244U, // <6,2,0,6>: Cost 3 vext3 <0,2,4,6>, <2,0,6,4>
+ 3669816807U, // <6,2,0,7>: Cost 4 vext1 <7,6,2,0>, <7,6,2,0>
1573159581U, // <6,2,0,u>: Cost 2 vext2 <4,u,6,2>, LHS
- 3777021446U, // <6,2,1,0>: Cost 4 vext3 <3,1,4,6>, <2,1,0,3>
+ 2230527897U, // <6,2,1,0>: Cost 3 vrev <2,6,0,1>
2646901556U, // <6,2,1,1>: Cost 3 vext2 <4,u,6,2>, <1,1,1,1>
2646901654U, // <6,2,1,2>: Cost 3 vext2 <4,u,6,2>, <1,2,3,0>
2847047782U, // <6,2,1,3>: Cost 3 vuzpr <4,6,u,2>, LHS
3771049517U, // <6,2,1,4>: Cost 4 vext3 <2,1,4,6>, <2,1,4,6>
2646901904U, // <6,2,1,5>: Cost 3 vext2 <4,u,6,2>, <1,5,3,7>
2686027324U, // <6,2,1,6>: Cost 3 vext3 <0,2,4,6>, <2,1,6,3>
- 3331003480U, // <6,2,1,7>: Cost 4 vrev <7,1,2,6>
- 2847047787U, // <6,2,1,u>: Cost 3 vuzpr <4,6,u,2>, LHS
- 3289858234U, // <6,2,2,0>: Cost 4 vrev <0,2,2,6>
+ 3669825000U, // <6,2,1,7>: Cost 4 vext1 <7,6,2,1>, <7,6,2,1>
+ 2231117793U, // <6,2,1,u>: Cost 3 vrev <2,6,u,1>
+ 3763603029U, // <6,2,2,0>: Cost 4 vext3 <0,u,2,6>, <2,2,0,1>
3759769184U, // <6,2,2,1>: Cost 4 vext3 <0,2,4,6>, <2,2,1,3>
2686027368U, // <6,2,2,2>: Cost 3 vext3 <0,2,4,6>, <2,2,2,2>
2686027378U, // <6,2,2,3>: Cost 3 vext3 <0,2,4,6>, <2,2,3,3>
@@ -4585,13 +4585,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3920794092U, // <6,2,2,7>: Cost 4 vuzpr <4,6,u,2>, <6,2,5,7>
2686027423U, // <6,2,2,u>: Cost 3 vext3 <0,2,4,6>, <2,2,u,3>
2686027430U, // <6,2,3,0>: Cost 3 vext3 <0,2,4,6>, <2,3,0,1>
- 3759769263U, // <6,2,3,1>: Cost 4 vext3 <0,2,4,6>, <2,3,1,1>
- 2228725437U, // <6,2,3,2>: Cost 3 vrev <2,3,2,6>
+ 3759769262U, // <6,2,3,1>: Cost 4 vext3 <0,2,4,6>, <2,3,1,0>
+ 2698487485U, // <6,2,3,2>: Cost 3 vext3 <2,3,2,6>, <2,3,2,6>
2705344196U, // <6,2,3,3>: Cost 3 vext3 <3,4,5,6>, <2,3,3,4>
2686027470U, // <6,2,3,4>: Cost 3 vext3 <0,2,4,6>, <2,3,4,5>
2698708696U, // <6,2,3,5>: Cost 3 vext3 <2,3,5,6>, <2,3,5,6>
2724660961U, // <6,2,3,6>: Cost 3 vext3 <6,6,6,6>, <2,3,6,6>
- 2698856170U, // <6,2,3,7>: Cost 3 vext3 <2,3,7,6>, <2,3,7,6>
+ 2729232104U, // <6,2,3,7>: Cost 3 vext3 <7,4,5,6>, <2,3,7,4>
2686027502U, // <6,2,3,u>: Cost 3 vext3 <0,2,4,6>, <2,3,u,1>
1567853468U, // <6,2,4,0>: Cost 2 vext2 <4,0,6,2>, <4,0,6,2>
3759769351U, // <6,2,4,1>: Cost 4 vext3 <0,2,4,6>, <2,4,1,u>
@@ -4606,7 +4606,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2646904528U, // <6,2,5,1>: Cost 3 vext2 <4,u,6,2>, <5,1,7,3>
3759769440U, // <6,2,5,2>: Cost 4 vext3 <0,2,4,6>, <2,5,2,7>
2699888488U, // <6,2,5,3>: Cost 3 vext3 <2,5,3,6>, <2,5,3,6>
- 3759769458U, // <6,2,5,4>: Cost 4 vext3 <0,2,4,6>, <2,5,4,7>
+ 2230855617U, // <6,2,5,4>: Cost 3 vrev <2,6,4,5>
2646904836U, // <6,2,5,5>: Cost 3 vext2 <4,u,6,2>, <5,5,5,5>
2646904930U, // <6,2,5,6>: Cost 3 vext2 <4,u,6,2>, <5,6,7,0>
2847051062U, // <6,2,5,7>: Cost 3 vuzpr <4,6,u,2>, RHS
@@ -4621,17 +4621,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2646905678U, // <6,2,6,7>: Cost 3 vext2 <4,u,6,2>, <6,7,0,1>
2686027751U, // <6,2,6,u>: Cost 3 vext3 <0,2,4,6>, <2,6,u,7>
2554323046U, // <6,2,7,0>: Cost 3 vext1 <0,6,2,7>, LHS
- 2560296152U, // <6,2,7,1>: Cost 3 vext1 <1,6,2,7>, <1,6,2,7>
+ 2572239606U, // <6,2,7,1>: Cost 3 vext1 <3,6,2,7>, <1,0,3,2>
2566268849U, // <6,2,7,2>: Cost 3 vext1 <2,6,2,7>, <2,6,2,7>
1906753638U, // <6,2,7,3>: Cost 2 vzipr RHS, LHS
2554326326U, // <6,2,7,4>: Cost 3 vext1 <0,6,2,7>, RHS
- 4054237288U, // <6,2,7,5>: Cost 4 vzipr RHS, <0,1,2,5>
+ 3304687564U, // <6,2,7,5>: Cost 4 vrev <2,6,5,7>
2980495708U, // <6,2,7,6>: Cost 3 vzipr RHS, <0,4,2,6>
2646906476U, // <6,2,7,7>: Cost 3 vext2 <4,u,6,2>, <7,7,7,7>
1906753643U, // <6,2,7,u>: Cost 2 vzipr RHS, LHS
1591744256U, // <6,2,u,0>: Cost 2 vext2 <u,0,6,2>, <u,0,6,2>
1573164846U, // <6,2,u,1>: Cost 2 vext2 <4,u,6,2>, LHS
- 2232043602U, // <6,2,u,2>: Cost 3 vrev <2,u,2,6>
+ 2701805650U, // <6,2,u,2>: Cost 3 vext3 <2,u,2,6>, <2,u,2,6>
1906761830U, // <6,2,u,3>: Cost 2 vzipr RHS, LHS
2686027875U, // <6,2,u,4>: Cost 3 vext3 <0,2,4,6>, <2,u,4,5>
1573165210U, // <6,2,u,5>: Cost 2 vext2 <4,u,6,2>, RHS
@@ -4645,33 +4645,33 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2687207601U, // <6,3,0,4>: Cost 3 vext3 <0,4,2,6>, <3,0,4,2>
2705344698U, // <6,3,0,5>: Cost 3 vext3 <3,4,5,6>, <3,0,5,2>
3663917847U, // <6,3,0,6>: Cost 4 vext1 <6,6,3,0>, <6,6,3,0>
- 4195107840U, // <6,3,0,7>: Cost 4 vtrnr <5,6,7,0>, <1,3,5,7>
+ 2237008560U, // <6,3,0,7>: Cost 3 vrev <3,6,7,0>
2686027989U, // <6,3,0,u>: Cost 3 vext3 <0,2,4,6>, <3,0,u,2>
- 2602123366U, // <6,3,1,0>: Cost 3 vext1 <u,6,3,1>, LHS
+ 3759769823U, // <6,3,1,0>: Cost 4 vext3 <0,2,4,6>, <3,1,0,3>
3759769830U, // <6,3,1,1>: Cost 4 vext3 <0,2,4,6>, <3,1,1,1>
3759769841U, // <6,3,1,2>: Cost 4 vext3 <0,2,4,6>, <3,1,2,3>
- 2602125462U, // <6,3,1,3>: Cost 3 vext1 <u,6,3,1>, <3,0,1,2>
+ 3759769848U, // <6,3,1,3>: Cost 4 vext3 <0,2,4,6>, <3,1,3,1>
2703280390U, // <6,3,1,4>: Cost 3 vext3 <3,1,4,6>, <3,1,4,6>
3759769868U, // <6,3,1,5>: Cost 4 vext3 <0,2,4,6>, <3,1,5,3>
3704063194U, // <6,3,1,6>: Cost 4 vext2 <2,1,6,3>, <1,6,3,0>
3767732510U, // <6,3,1,7>: Cost 4 vext3 <1,5,4,6>, <3,1,7,3>
- 2602129198U, // <6,3,1,u>: Cost 3 vext1 <u,6,3,1>, LHS
- 3640041574U, // <6,3,2,0>: Cost 4 vext1 <2,6,3,2>, LHS
- 2686028086U, // <6,3,2,1>: Cost 3 vext3 <0,2,4,6>, <3,2,1,0>
+ 2703280390U, // <6,3,1,u>: Cost 3 vext3 <3,1,4,6>, <3,1,4,6>
+ 3704063468U, // <6,3,2,0>: Cost 4 vext2 <2,1,6,3>, <2,0,6,4>
+ 2630321724U, // <6,3,2,1>: Cost 3 vext2 <2,1,6,3>, <2,1,6,3>
3759769921U, // <6,3,2,2>: Cost 4 vext3 <0,2,4,6>, <3,2,2,2>
3759769928U, // <6,3,2,3>: Cost 4 vext3 <0,2,4,6>, <3,2,3,0>
3704063767U, // <6,3,2,4>: Cost 4 vext2 <2,1,6,3>, <2,4,3,6>
3704063876U, // <6,3,2,5>: Cost 4 vext2 <2,1,6,3>, <2,5,6,7>
2636957626U, // <6,3,2,6>: Cost 3 vext2 <3,2,6,3>, <2,6,3,7>
- 3708045346U, // <6,3,2,7>: Cost 4 vext2 <2,7,6,3>, <2,7,6,3>
- 2689862005U, // <6,3,2,u>: Cost 3 vext3 <0,u,2,6>, <3,2,u,0>
+ 3777907058U, // <6,3,2,7>: Cost 4 vext3 <3,2,7,6>, <3,2,7,6>
+ 2630321724U, // <6,3,2,u>: Cost 3 vext2 <2,1,6,3>, <2,1,6,3>
3759769983U, // <6,3,3,0>: Cost 4 vext3 <0,2,4,6>, <3,3,0,1>
3710036245U, // <6,3,3,1>: Cost 4 vext2 <3,1,6,3>, <3,1,6,3>
2636958054U, // <6,3,3,2>: Cost 3 vext2 <3,2,6,3>, <3,2,6,3>
2686028188U, // <6,3,3,3>: Cost 3 vext3 <0,2,4,6>, <3,3,3,3>
2704607656U, // <6,3,3,4>: Cost 3 vext3 <3,3,4,6>, <3,3,4,6>
3773041072U, // <6,3,3,5>: Cost 4 vext3 <2,4,4,6>, <3,3,5,5>
- 3710700166U, // <6,3,3,6>: Cost 4 vext2 <3,2,6,3>, <3,6,2,3>
+ 3711363731U, // <6,3,3,6>: Cost 4 vext2 <3,3,6,3>, <3,6,3,7>
3767732676U, // <6,3,3,7>: Cost 4 vext3 <1,5,4,6>, <3,3,7,7>
2707999179U, // <6,3,3,u>: Cost 3 vext3 <3,u,5,6>, <3,3,u,5>
2584232038U, // <6,3,4,0>: Cost 3 vext1 <5,6,3,4>, LHS
@@ -4681,11 +4681,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2584235318U, // <6,3,4,4>: Cost 3 vext1 <5,6,3,4>, RHS
1631603202U, // <6,3,4,5>: Cost 2 vext3 <3,4,5,6>, <3,4,5,6>
2654211444U, // <6,3,4,6>: Cost 3 vext2 <6,1,6,3>, <4,6,4,6>
- 3779234324U, // <6,3,4,7>: Cost 4 vext3 <3,4,7,6>, <3,4,7,6>
+ 2237041332U, // <6,3,4,7>: Cost 3 vrev <3,6,7,4>
1631824413U, // <6,3,4,u>: Cost 2 vext3 <3,4,u,6>, <3,4,u,6>
3640066150U, // <6,3,5,0>: Cost 4 vext1 <2,6,3,5>, LHS
3772746288U, // <6,3,5,1>: Cost 4 vext3 <2,4,0,6>, <3,5,1,7>
- 3303868264U, // <6,3,5,2>: Cost 4 vrev <2,5,3,6>
+ 3640067790U, // <6,3,5,2>: Cost 4 vext1 <2,6,3,5>, <2,3,4,5>
3773041216U, // <6,3,5,3>: Cost 4 vext3 <2,4,4,6>, <3,5,3,5>
2705934922U, // <6,3,5,4>: Cost 3 vext3 <3,5,4,6>, <3,5,4,6>
3773041236U, // <6,3,5,5>: Cost 4 vext3 <2,4,4,6>, <3,5,5,7>
@@ -4695,7 +4695,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2602164326U, // <6,3,6,0>: Cost 3 vext1 <u,6,3,6>, LHS
2654212512U, // <6,3,6,1>: Cost 3 vext2 <6,1,6,3>, <6,1,6,3>
2566334393U, // <6,3,6,2>: Cost 3 vext1 <2,6,3,6>, <2,6,3,6>
- 3773631120U, // <6,3,6,3>: Cost 4 vext3 <2,5,3,6>, <3,6,3,4>
+ 3704066588U, // <6,3,6,3>: Cost 4 vext2 <2,1,6,3>, <6,3,2,1>
2602167524U, // <6,3,6,4>: Cost 3 vext1 <u,6,3,6>, <4,4,6,6>
3710702321U, // <6,3,6,5>: Cost 4 vext2 <3,2,6,3>, <6,5,7,7>
2724661933U, // <6,3,6,6>: Cost 3 vext3 <6,6,6,6>, <3,6,6,6>
@@ -4707,11 +4707,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2566342806U, // <6,3,7,3>: Cost 3 vext1 <2,6,3,7>, <3,0,1,2>
1492602166U, // <6,3,7,4>: Cost 2 vext1 <2,6,3,7>, RHS
2602176208U, // <6,3,7,5>: Cost 3 vext1 <u,6,3,7>, <5,1,7,3>
- 2566345288U, // <6,3,7,6>: Cost 3 vext1 <2,6,3,7>, <6,3,7,0>
- 2566346010U, // <6,3,7,7>: Cost 3 vext1 <2,6,3,7>, <7,3,6,2>
+ 2566345210U, // <6,3,7,6>: Cost 3 vext1 <2,6,3,7>, <6,2,7,3>
+ 2980496528U, // <6,3,7,7>: Cost 3 vzipr RHS, <1,5,3,7>
1492604718U, // <6,3,7,u>: Cost 2 vext1 <2,6,3,7>, LHS
1492607078U, // <6,3,u,0>: Cost 2 vext1 <2,6,3,u>, LHS
- 2686028572U, // <6,3,u,1>: Cost 3 vext3 <0,2,4,6>, <3,u,1,0>
+ 2686028574U, // <6,3,u,1>: Cost 3 vext3 <0,2,4,6>, <3,u,1,2>
1492608955U, // <6,3,u,2>: Cost 2 vext1 <2,6,3,u>, <2,6,3,u>
2566350998U, // <6,3,u,3>: Cost 3 vext1 <2,6,3,u>, <3,0,1,2>
1492610358U, // <6,3,u,4>: Cost 2 vext1 <2,6,3,u>, RHS
@@ -4719,50 +4719,50 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2566353489U, // <6,3,u,6>: Cost 3 vext1 <2,6,3,u>, <6,3,u,0>
2980504720U, // <6,3,u,7>: Cost 3 vzipr RHS, <1,5,3,7>
1492612910U, // <6,3,u,u>: Cost 2 vext1 <2,6,3,u>, LHS
- 3703406614U, // <6,4,0,0>: Cost 4 vext2 <2,0,6,4>, <0,0,2,4>
- 2632319078U, // <6,4,0,1>: Cost 3 vext2 <2,4,6,4>, LHS
- 2632319180U, // <6,4,0,2>: Cost 3 vext2 <2,4,6,4>, <0,2,4,6>
+ 3703406592U, // <6,4,0,0>: Cost 4 vext2 <2,0,6,4>, <0,0,0,0>
+ 2629664870U, // <6,4,0,1>: Cost 3 vext2 <2,0,6,4>, LHS
+ 2629664972U, // <6,4,0,2>: Cost 3 vext2 <2,0,6,4>, <0,2,4,6>
3779087232U, // <6,4,0,3>: Cost 4 vext3 <3,4,5,6>, <4,0,3,1>
2642936156U, // <6,4,0,4>: Cost 3 vext2 <4,2,6,4>, <0,4,2,6>
2712570770U, // <6,4,0,5>: Cost 3 vext3 <4,6,4,6>, <4,0,5,1>
- 2712570780U, // <6,4,0,6>: Cost 3 vext3 <4,6,4,6>, <4,0,6,2>
- 3330487321U, // <6,4,0,7>: Cost 4 vrev <7,0,4,6>
- 2632319645U, // <6,4,0,u>: Cost 3 vext2 <2,4,6,4>, LHS
- 3628163174U, // <6,4,1,0>: Cost 4 vext1 <0,6,4,1>, LHS
- 3295314772U, // <6,4,1,1>: Cost 4 vrev <1,1,4,6>
- 3706061718U, // <6,4,1,2>: Cost 4 vext2 <2,4,6,4>, <1,2,3,0>
+ 2687208348U, // <6,4,0,6>: Cost 3 vext3 <0,4,2,6>, <4,0,6,2>
+ 3316723081U, // <6,4,0,7>: Cost 4 vrev <4,6,7,0>
+ 2629665437U, // <6,4,0,u>: Cost 3 vext2 <2,0,6,4>, LHS
+ 2242473291U, // <6,4,1,0>: Cost 3 vrev <4,6,0,1>
+ 3700089652U, // <6,4,1,1>: Cost 4 vext2 <1,4,6,4>, <1,1,1,1>
+ 3703407510U, // <6,4,1,2>: Cost 4 vext2 <2,0,6,4>, <1,2,3,0>
2852962406U, // <6,4,1,3>: Cost 3 vuzpr <5,6,7,4>, LHS
3628166454U, // <6,4,1,4>: Cost 4 vext1 <0,6,4,1>, RHS
3760876514U, // <6,4,1,5>: Cost 4 vext3 <0,4,1,6>, <4,1,5,0>
2687208430U, // <6,4,1,6>: Cost 3 vext3 <0,4,2,6>, <4,1,6,3>
- 3331150954U, // <6,4,1,7>: Cost 4 vrev <7,1,4,6>
- 2852962411U, // <6,4,1,u>: Cost 3 vuzpr <5,6,7,4>, LHS
- 2216263884U, // <6,4,2,0>: Cost 3 vrev <0,2,4,6>
- 3704071741U, // <6,4,2,1>: Cost 4 vext2 <2,1,6,4>, <2,1,6,4>
- 3301951102U, // <6,4,2,2>: Cost 4 vrev <2,2,4,6>
- 3705399007U, // <6,4,2,3>: Cost 4 vext2 <2,3,6,4>, <2,3,6,4>
+ 3316731274U, // <6,4,1,7>: Cost 4 vrev <4,6,7,1>
+ 2243063187U, // <6,4,1,u>: Cost 3 vrev <4,6,u,1>
+ 2629666284U, // <6,4,2,0>: Cost 3 vext2 <2,0,6,4>, <2,0,6,4>
+ 3703408188U, // <6,4,2,1>: Cost 4 vext2 <2,0,6,4>, <2,1,6,3>
+ 3703408232U, // <6,4,2,2>: Cost 4 vext2 <2,0,6,4>, <2,2,2,2>
+ 3703408294U, // <6,4,2,3>: Cost 4 vext2 <2,0,6,4>, <2,3,0,1>
2632320816U, // <6,4,2,4>: Cost 3 vext2 <2,4,6,4>, <2,4,6,4>
2923384118U, // <6,4,2,5>: Cost 3 vzipl <6,2,7,3>, RHS
2687208508U, // <6,4,2,6>: Cost 3 vext3 <0,4,2,6>, <4,2,6,0>
- 3331814587U, // <6,4,2,7>: Cost 4 vrev <7,2,4,6>
+ 3760950341U, // <6,4,2,7>: Cost 4 vext3 <0,4,2,6>, <4,2,7,0>
2634975348U, // <6,4,2,u>: Cost 3 vext2 <2,u,6,4>, <2,u,6,4>
- 3706062998U, // <6,4,3,0>: Cost 4 vext2 <2,4,6,4>, <3,0,1,2>
- 3296642038U, // <6,4,3,1>: Cost 4 vrev <1,3,4,6>
- 2228872911U, // <6,4,3,2>: Cost 3 vrev <2,3,4,6>
- 3706063260U, // <6,4,3,3>: Cost 4 vext2 <2,4,6,4>, <3,3,3,3>
+ 3703408790U, // <6,4,3,0>: Cost 4 vext2 <2,0,6,4>, <3,0,1,2>
+ 3316305238U, // <6,4,3,1>: Cost 4 vrev <4,6,1,3>
+ 3703408947U, // <6,4,3,2>: Cost 4 vext2 <2,0,6,4>, <3,2,0,6>
+ 3703409052U, // <6,4,3,3>: Cost 4 vext2 <2,0,6,4>, <3,3,3,3>
2644929026U, // <6,4,3,4>: Cost 3 vext2 <4,5,6,4>, <3,4,5,6>
3718670922U, // <6,4,3,5>: Cost 4 vext2 <4,5,6,4>, <3,5,4,6>
2705345682U, // <6,4,3,6>: Cost 3 vext3 <3,4,5,6>, <4,3,6,5>
3926705152U, // <6,4,3,7>: Cost 4 vuzpr <5,6,7,4>, <1,3,5,7>
- 2264709093U, // <6,4,3,u>: Cost 3 vrev <u,3,4,6>
+ 2668817222U, // <6,4,3,u>: Cost 3 vext2 <u,5,6,4>, <3,u,5,6>
2590277734U, // <6,4,4,0>: Cost 3 vext1 <6,6,4,4>, LHS
3716017135U, // <6,4,4,1>: Cost 4 vext2 <4,1,6,4>, <4,1,6,4>
2642938944U, // <6,4,4,2>: Cost 3 vext2 <4,2,6,4>, <4,2,6,4>
- 2235509241U, // <6,4,4,3>: Cost 3 vrev <3,4,4,6>
+ 3717344401U, // <6,4,4,3>: Cost 4 vext2 <4,3,6,4>, <4,3,6,4>
2712571088U, // <6,4,4,4>: Cost 3 vext3 <4,6,4,6>, <4,4,4,4>
- 2632322358U, // <6,4,4,5>: Cost 3 vext2 <2,4,6,4>, RHS
+ 2629668150U, // <6,4,4,5>: Cost 3 vext2 <2,0,6,4>, RHS
1637649636U, // <6,4,4,6>: Cost 2 vext3 <4,4,6,6>, <4,4,6,6>
- 2259400029U, // <6,4,4,7>: Cost 3 vrev <7,4,4,6>
+ 2646257109U, // <6,4,4,7>: Cost 3 vext2 <4,7,6,4>, <4,7,6,4>
1637649636U, // <6,4,4,u>: Cost 2 vext3 <4,4,6,6>, <4,4,6,6>
2566398054U, // <6,4,5,0>: Cost 3 vext1 <2,6,4,5>, LHS
3760876805U, // <6,4,5,1>: Cost 4 vext3 <0,4,1,6>, <4,5,1,3>
@@ -4774,7 +4774,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2852965686U, // <6,4,5,7>: Cost 3 vuzpr <5,6,7,4>, RHS
1612287304U, // <6,4,5,u>: Cost 2 vext3 <0,2,4,6>, RHS
1504608358U, // <6,4,6,0>: Cost 2 vext1 <4,6,4,6>, LHS
- 2578350900U, // <6,4,6,1>: Cost 3 vext1 <4,6,4,6>, <1,1,1,1>
+ 2578350838U, // <6,4,6,1>: Cost 3 vext1 <4,6,4,6>, <1,0,3,2>
2578351720U, // <6,4,6,2>: Cost 3 vext1 <4,6,4,6>, <2,2,2,2>
2578352278U, // <6,4,6,3>: Cost 3 vext1 <4,6,4,6>, <3,0,1,2>
1504611638U, // <6,4,6,4>: Cost 2 vext1 <4,6,4,6>, RHS
@@ -4792,11 +4792,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
4054239090U, // <6,4,7,7>: Cost 4 vzipr RHS, <2,5,4,7>
2572392238U, // <6,4,7,u>: Cost 3 vext1 <3,6,4,7>, LHS
1504608358U, // <6,4,u,0>: Cost 2 vext1 <4,6,4,6>, LHS
- 2632324910U, // <6,4,u,1>: Cost 3 vext2 <2,4,6,4>, LHS
+ 2629670702U, // <6,4,u,1>: Cost 3 vext2 <2,0,6,4>, LHS
2566424516U, // <6,4,u,2>: Cost 3 vext1 <2,6,4,u>, <2,6,4,u>
2584340994U, // <6,4,u,3>: Cost 3 vext1 <5,6,4,u>, <3,4,5,6>
1640156694U, // <6,4,u,4>: Cost 2 vext3 <4,u,4,6>, <4,u,4,6>
- 2632325274U, // <6,4,u,5>: Cost 3 vext2 <2,4,6,4>, RHS
+ 2629671066U, // <6,4,u,5>: Cost 3 vext2 <2,0,6,4>, RHS
1612287529U, // <6,4,u,6>: Cost 2 vext3 <0,2,4,6>, RHS
2852965929U, // <6,4,u,7>: Cost 3 vuzpr <5,6,7,4>, RHS
1612287547U, // <6,4,u,u>: Cost 2 vext3 <0,2,4,6>, RHS
@@ -4807,15 +4807,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3760877154U, // <6,5,0,4>: Cost 4 vext3 <0,4,1,6>, <5,0,4,1>
4195110916U, // <6,5,0,5>: Cost 4 vtrnr <5,6,7,0>, <5,5,5,5>
3696779775U, // <6,5,0,6>: Cost 4 vext2 <0,u,6,5>, <0,6,2,7>
- 3121368374U, // <6,5,0,7>: Cost 3 vtrnr <5,6,7,0>, RHS
- 2634982045U, // <6,5,0,u>: Cost 3 vext2 <2,u,6,5>, LHS
- 3652124774U, // <6,5,1,0>: Cost 4 vext1 <4,6,5,1>, LHS
+ 1175212130U, // <6,5,0,7>: Cost 2 vrev <5,6,7,0>
+ 1175285867U, // <6,5,0,u>: Cost 2 vrev <5,6,u,0>
+ 2248445988U, // <6,5,1,0>: Cost 3 vrev <5,6,0,1>
3698107237U, // <6,5,1,1>: Cost 4 vext2 <1,1,6,5>, <1,1,6,5>
3708724118U, // <6,5,1,2>: Cost 4 vext2 <2,u,6,5>, <1,2,3,0>
- 2642281472U, // <6,5,1,3>: Cost 3 vext2 <4,1,6,5>, <1,3,5,7>
- 3760877234U, // <6,5,1,4>: Cost 4 vext3 <0,4,1,6>, <5,1,4,0>
+ 3908575334U, // <6,5,1,3>: Cost 4 vuzpr <2,6,4,5>, LHS
+ 3716023376U, // <6,5,1,4>: Cost 4 vext2 <4,1,6,5>, <1,4,5,6>
3708724368U, // <6,5,1,5>: Cost 4 vext2 <2,u,6,5>, <1,5,3,7>
- 3708724449U, // <6,5,1,6>: Cost 4 vext2 <2,u,6,5>, <1,6,3,7>
+ 3767733960U, // <6,5,1,6>: Cost 4 vext3 <1,5,4,6>, <5,1,6,4>
2712571600U, // <6,5,1,7>: Cost 3 vext3 <4,6,4,6>, <5,1,7,3>
2712571609U, // <6,5,1,u>: Cost 3 vext3 <4,6,4,6>, <5,1,u,3>
2578391142U, // <6,5,2,0>: Cost 3 vext1 <4,6,5,2>, LHS
@@ -4823,30 +4823,30 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3708724840U, // <6,5,2,2>: Cost 4 vext2 <2,u,6,5>, <2,2,2,2>
3705407182U, // <6,5,2,3>: Cost 4 vext2 <2,3,6,5>, <2,3,4,5>
2578394422U, // <6,5,2,4>: Cost 3 vext1 <4,6,5,2>, RHS
- 3652136656U, // <6,5,2,5>: Cost 4 vext1 <4,6,5,2>, <5,1,7,3>
+ 3717351272U, // <6,5,2,5>: Cost 4 vext2 <4,3,6,5>, <2,5,3,6>
2634983354U, // <6,5,2,6>: Cost 3 vext2 <2,u,6,5>, <2,6,3,7>
3115486518U, // <6,5,2,7>: Cost 3 vtrnr <4,6,u,2>, RHS
2634983541U, // <6,5,2,u>: Cost 3 vext2 <2,u,6,5>, <2,u,6,5>
3708725398U, // <6,5,3,0>: Cost 4 vext2 <2,u,6,5>, <3,0,1,2>
3710052631U, // <6,5,3,1>: Cost 4 vext2 <3,1,6,5>, <3,1,6,5>
- 2228946648U, // <6,5,3,2>: Cost 3 vrev <2,3,5,6>
+ 3708725606U, // <6,5,3,2>: Cost 4 vext2 <2,u,6,5>, <3,2,6,3>
3708725660U, // <6,5,3,3>: Cost 4 vext2 <2,u,6,5>, <3,3,3,3>
2643610114U, // <6,5,3,4>: Cost 3 vext2 <4,3,6,5>, <3,4,5,6>
- 3696118365U, // <6,5,3,5>: Cost 4 vext2 <0,7,6,5>, <3,5,6,7>
+ 3717352010U, // <6,5,3,5>: Cost 4 vext2 <4,3,6,5>, <3,5,4,6>
3773632358U, // <6,5,3,6>: Cost 4 vext3 <2,5,3,6>, <5,3,6,0>
- 2640292605U, // <6,5,3,7>: Cost 3 vext2 <3,7,6,5>, <3,7,6,5>
- 2264782830U, // <6,5,3,u>: Cost 3 vrev <u,3,5,6>
- 1522581606U, // <6,5,4,0>: Cost 2 vext1 <7,6,5,4>, LHS
- 2223637584U, // <6,5,4,1>: Cost 3 vrev <1,4,5,6>
- 2229610281U, // <6,5,4,2>: Cost 3 vrev <2,4,5,6>
- 1161841154U, // <6,5,4,3>: Cost 2 vrev <3,4,5,6>
- 1522584886U, // <6,5,4,4>: Cost 2 vext1 <7,6,5,4>, RHS
+ 2248978533U, // <6,5,3,7>: Cost 3 vrev <5,6,7,3>
+ 2249052270U, // <6,5,3,u>: Cost 3 vrev <5,6,u,3>
+ 2596323430U, // <6,5,4,0>: Cost 3 vext1 <7,6,5,4>, LHS
+ 3716025328U, // <6,5,4,1>: Cost 4 vext2 <4,1,6,5>, <4,1,6,5>
+ 3716688961U, // <6,5,4,2>: Cost 4 vext2 <4,2,6,5>, <4,2,6,5>
+ 2643610770U, // <6,5,4,3>: Cost 3 vext2 <4,3,6,5>, <4,3,6,5>
+ 2596326710U, // <6,5,4,4>: Cost 3 vext1 <7,6,5,4>, RHS
2634984758U, // <6,5,4,5>: Cost 3 vext2 <2,u,6,5>, RHS
- 2253501069U, // <6,5,4,6>: Cost 3 vrev <6,4,5,6>
- 1185731942U, // <6,5,4,7>: Cost 2 vrev <7,4,5,6>
- 1522587438U, // <6,5,4,u>: Cost 2 vext1 <7,6,5,4>, LHS
+ 3767734199U, // <6,5,4,6>: Cost 4 vext3 <1,5,4,6>, <5,4,6,0>
+ 1643696070U, // <6,5,4,7>: Cost 2 vext3 <5,4,7,6>, <5,4,7,6>
+ 1643769807U, // <6,5,4,u>: Cost 2 vext3 <5,4,u,6>, <5,4,u,6>
2578415718U, // <6,5,5,0>: Cost 3 vext1 <4,6,5,5>, LHS
- 3652158260U, // <6,5,5,1>: Cost 4 vext1 <4,6,5,5>, <1,1,1,1>
+ 3652158198U, // <6,5,5,1>: Cost 4 vext1 <4,6,5,5>, <1,0,3,2>
3652159080U, // <6,5,5,2>: Cost 4 vext1 <4,6,5,5>, <2,2,2,2>
3652159638U, // <6,5,5,3>: Cost 4 vext1 <4,6,5,5>, <3,0,1,2>
2578418998U, // <6,5,5,4>: Cost 3 vext1 <4,6,5,5>, RHS
@@ -4872,55 +4872,55 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2980497922U, // <6,5,7,6>: Cost 3 vzipr RHS, <3,4,5,6>
3103214902U, // <6,5,7,7>: Cost 3 vtrnr <2,6,3,7>, RHS
2560522030U, // <6,5,7,u>: Cost 3 vext1 <1,6,5,7>, LHS
- 1528586342U, // <6,5,u,0>: Cost 2 vext1 <u,6,5,u>, LHS
+ 2560524390U, // <6,5,u,0>: Cost 3 vext1 <1,6,5,u>, LHS
2560525556U, // <6,5,u,1>: Cost 3 vext1 <1,6,5,u>, <1,6,5,u>
2566498253U, // <6,5,u,2>: Cost 3 vext1 <2,6,5,u>, <2,6,5,u>
- 1164495686U, // <6,5,u,3>: Cost 2 vrev <3,u,5,6>
- 1528589622U, // <6,5,u,4>: Cost 2 vext1 <u,6,5,u>, RHS
+ 2646931439U, // <6,5,u,3>: Cost 3 vext2 <4,u,6,5>, <u,3,5,7>
+ 2560527670U, // <6,5,u,4>: Cost 3 vext1 <1,6,5,u>, RHS
2634987674U, // <6,5,u,5>: Cost 3 vext2 <2,u,6,5>, RHS
2980506114U, // <6,5,u,6>: Cost 3 vzipr RHS, <3,4,5,6>
- 1188386474U, // <6,5,u,7>: Cost 2 vrev <7,u,5,6>
- 1528592611U, // <6,5,u,u>: Cost 2 vext1 <u,6,5,u>, <u,6,5,u>
+ 1175277674U, // <6,5,u,7>: Cost 2 vrev <5,6,7,u>
+ 1175351411U, // <6,5,u,u>: Cost 2 vrev <5,6,u,u>
2578448486U, // <6,6,0,0>: Cost 3 vext1 <4,6,6,0>, LHS
1573191782U, // <6,6,0,1>: Cost 2 vext2 <4,u,6,6>, LHS
2686030124U, // <6,6,0,2>: Cost 3 vext3 <0,2,4,6>, <6,0,2,4>
3779088690U, // <6,6,0,3>: Cost 4 vext3 <3,4,5,6>, <6,0,3,1>
2687209788U, // <6,6,0,4>: Cost 3 vext3 <0,4,2,6>, <6,0,4,2>
3652194000U, // <6,6,0,5>: Cost 4 vext1 <4,6,6,0>, <5,1,7,3>
- 2590397234U, // <6,6,0,6>: Cost 3 vext1 <6,6,6,0>, <6,6,6,0>
+ 2254852914U, // <6,6,0,6>: Cost 3 vrev <6,6,6,0>
4041575734U, // <6,6,0,7>: Cost 4 vzipr <2,4,6,0>, RHS
1573192349U, // <6,6,0,u>: Cost 2 vext2 <4,u,6,6>, LHS
- 3640254566U, // <6,6,1,0>: Cost 4 vext1 <2,6,6,1>, LHS
+ 2646934262U, // <6,6,1,0>: Cost 3 vext2 <4,u,6,6>, <1,0,3,2>
2646934324U, // <6,6,1,1>: Cost 3 vext2 <4,u,6,6>, <1,1,1,1>
2646934422U, // <6,6,1,2>: Cost 3 vext2 <4,u,6,6>, <1,2,3,0>
2846785638U, // <6,6,1,3>: Cost 3 vuzpr <4,6,4,6>, LHS
- 3760877963U, // <6,6,1,4>: Cost 4 vext3 <0,4,1,6>, <6,1,4,0>
+ 3760951694U, // <6,6,1,4>: Cost 4 vext3 <0,4,2,6>, <6,1,4,3>
2646934672U, // <6,6,1,5>: Cost 3 vext2 <4,u,6,6>, <1,5,3,7>
2712572320U, // <6,6,1,6>: Cost 3 vext3 <4,6,4,6>, <6,1,6,3>
3775549865U, // <6,6,1,7>: Cost 4 vext3 <2,u,2,6>, <6,1,7,3>
2846785643U, // <6,6,1,u>: Cost 3 vuzpr <4,6,4,6>, LHS
- 3640262758U, // <6,6,2,0>: Cost 4 vext1 <2,6,6,2>, LHS
+ 3759772094U, // <6,6,2,0>: Cost 4 vext3 <0,2,4,6>, <6,2,0,6>
3704751676U, // <6,6,2,1>: Cost 4 vext2 <2,2,6,6>, <2,1,6,3>
2631009936U, // <6,6,2,2>: Cost 3 vext2 <2,2,6,6>, <2,2,6,6>
2646935206U, // <6,6,2,3>: Cost 3 vext2 <4,u,6,6>, <2,3,0,1>
- 2687209948U, // <6,6,2,4>: Cost 3 vext3 <0,4,2,6>, <6,2,4,0>
+ 3759772127U, // <6,6,2,4>: Cost 4 vext3 <0,2,4,6>, <6,2,4,3>
3704752004U, // <6,6,2,5>: Cost 4 vext2 <2,2,6,6>, <2,5,6,7>
2646935482U, // <6,6,2,6>: Cost 3 vext2 <4,u,6,6>, <2,6,3,7>
2712572410U, // <6,6,2,7>: Cost 3 vext3 <4,6,4,6>, <6,2,7,3>
2712572419U, // <6,6,2,u>: Cost 3 vext3 <4,6,4,6>, <6,2,u,3>
2646935702U, // <6,6,3,0>: Cost 3 vext2 <4,u,6,6>, <3,0,1,2>
3777024534U, // <6,6,3,1>: Cost 4 vext3 <3,1,4,6>, <6,3,1,4>
- 2646935862U, // <6,6,3,2>: Cost 3 vext2 <4,u,6,6>, <3,2,1,0>
+ 3704752453U, // <6,6,3,2>: Cost 4 vext2 <2,2,6,6>, <3,2,2,6>
2646935964U, // <6,6,3,3>: Cost 3 vext2 <4,u,6,6>, <3,3,3,3>
2705347122U, // <6,6,3,4>: Cost 3 vext3 <3,4,5,6>, <6,3,4,5>
- 3773633080U, // <6,6,3,5>: Cost 4 vext3 <2,5,3,6>, <6,3,5,2>
+ 3779678778U, // <6,6,3,5>: Cost 4 vext3 <3,5,4,6>, <6,3,5,4>
2657553069U, // <6,6,3,6>: Cost 3 vext2 <6,6,6,6>, <3,6,6,6>
4039609654U, // <6,6,3,7>: Cost 4 vzipr <2,1,6,3>, RHS
2708001366U, // <6,6,3,u>: Cost 3 vext3 <3,u,5,6>, <6,3,u,5>
- 2646936466U, // <6,6,4,0>: Cost 3 vext2 <4,u,6,6>, <4,0,5,1>
- 3765080676U, // <6,6,4,1>: Cost 4 vext3 <1,1,4,6>, <6,4,1,1>
- 2686030444U, // <6,6,4,2>: Cost 3 vext3 <0,2,4,6>, <6,4,2,0>
- 3766407798U, // <6,6,4,3>: Cost 4 vext3 <1,3,4,6>, <6,4,3,1>
+ 2578481254U, // <6,6,4,0>: Cost 3 vext1 <4,6,6,4>, LHS
+ 3652223734U, // <6,6,4,1>: Cost 4 vext1 <4,6,6,4>, <1,0,3,2>
+ 3760951922U, // <6,6,4,2>: Cost 4 vext3 <0,4,2,6>, <6,4,2,6>
+ 3779089019U, // <6,6,4,3>: Cost 4 vext3 <3,4,5,6>, <6,4,3,6>
1570540772U, // <6,6,4,4>: Cost 2 vext2 <4,4,6,6>, <4,4,6,6>
1573195062U, // <6,6,4,5>: Cost 2 vext2 <4,u,6,6>, RHS
2712572560U, // <6,6,4,6>: Cost 3 vext3 <4,6,4,6>, <6,4,6,0>
@@ -4930,13 +4930,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2646937296U, // <6,6,5,1>: Cost 3 vext2 <4,u,6,6>, <5,1,7,3>
3640289235U, // <6,6,5,2>: Cost 4 vext1 <2,6,6,5>, <2,6,6,5>
3720679279U, // <6,6,5,3>: Cost 4 vext2 <4,u,6,6>, <5,3,7,0>
- 2705347282U, // <6,6,5,4>: Cost 3 vext3 <3,4,5,6>, <6,5,4,3>
+ 2646937542U, // <6,6,5,4>: Cost 3 vext2 <4,u,6,6>, <5,4,7,6>
2646937604U, // <6,6,5,5>: Cost 3 vext2 <4,u,6,6>, <5,5,5,5>
2646937698U, // <6,6,5,6>: Cost 3 vext2 <4,u,6,6>, <5,6,7,0>
2846788918U, // <6,6,5,7>: Cost 3 vuzpr <4,6,4,6>, RHS
- 2708001526U, // <6,6,5,u>: Cost 3 vext3 <3,u,5,6>, <6,5,u,3>
+ 2846788919U, // <6,6,5,u>: Cost 3 vuzpr <4,6,4,6>, RHS
1516699750U, // <6,6,6,0>: Cost 2 vext1 <6,6,6,6>, LHS
- 2590442292U, // <6,6,6,1>: Cost 3 vext1 <6,6,6,6>, <1,1,1,1>
+ 2590442230U, // <6,6,6,1>: Cost 3 vext1 <6,6,6,6>, <1,0,3,2>
2646938106U, // <6,6,6,2>: Cost 3 vext2 <4,u,6,6>, <6,2,7,3>
2590443670U, // <6,6,6,3>: Cost 3 vext1 <6,6,6,6>, <3,0,1,2>
1516703030U, // <6,6,6,4>: Cost 2 vext1 <6,6,6,6>, RHS
@@ -4949,13 +4949,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2566563797U, // <6,6,7,2>: Cost 3 vext1 <2,6,6,7>, <2,6,6,7>
2584480258U, // <6,6,7,3>: Cost 3 vext1 <5,6,6,7>, <3,4,5,6>
2566565174U, // <6,6,7,4>: Cost 3 vext1 <2,6,6,7>, RHS
- 2584481888U, // <6,6,7,5>: Cost 3 vext1 <5,6,6,7>, <5,6,6,7>
+ 2717438846U, // <6,6,7,5>: Cost 3 vext3 <5,4,7,6>, <6,7,5,4>
2980500280U, // <6,6,7,6>: Cost 3 vzipr RHS, <6,6,6,6>
1906756918U, // <6,6,7,7>: Cost 2 vzipr RHS, RHS
1906756919U, // <6,6,7,u>: Cost 2 vzipr RHS, RHS
1516699750U, // <6,6,u,0>: Cost 2 vext1 <6,6,6,6>, LHS
1573197614U, // <6,6,u,1>: Cost 2 vext2 <4,u,6,6>, LHS
- 2686325680U, // <6,6,u,2>: Cost 3 vext3 <0,2,u,6>, <6,u,2,0>
+ 2566571990U, // <6,6,u,2>: Cost 3 vext1 <2,6,6,u>, <2,6,6,u>
2846786205U, // <6,6,u,3>: Cost 3 vuzpr <4,6,4,6>, LHS
1516703030U, // <6,6,u,4>: Cost 2 vext1 <6,6,6,6>, RHS
1573197978U, // <6,6,u,5>: Cost 2 vext2 <4,u,6,6>, RHS
@@ -4971,17 +4971,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2644951542U, // <6,7,0,6>: Cost 3 vext2 RHS, <0,6,1,7>
2584499194U, // <6,7,0,7>: Cost 3 vext1 <5,6,7,0>, <7,0,1,2>
497468061U, // <6,7,0,u>: Cost 1 vext2 RHS, LHS
- 2644951770U, // <6,7,1,0>: Cost 3 vext2 RHS, <1,0,0,1>
+ 1571209974U, // <6,7,1,0>: Cost 2 vext2 RHS, <1,0,3,2>
1571210036U, // <6,7,1,1>: Cost 2 vext2 RHS, <1,1,1,1>
1571210134U, // <6,7,1,2>: Cost 2 vext2 RHS, <1,2,3,0>
1571210200U, // <6,7,1,3>: Cost 2 vext2 RHS, <1,3,1,3>
- 2644952107U, // <6,7,1,4>: Cost 3 vext2 RHS, <1,4,1,5>
+ 2644952098U, // <6,7,1,4>: Cost 3 vext2 RHS, <1,4,0,5>
1571210384U, // <6,7,1,5>: Cost 2 vext2 RHS, <1,5,3,7>
- 2644952262U, // <6,7,1,6>: Cost 3 vext2 RHS, <1,6,0,7>
+ 2644952271U, // <6,7,1,6>: Cost 3 vext2 RHS, <1,6,1,7>
2578535418U, // <6,7,1,7>: Cost 3 vext1 <4,6,7,1>, <7,0,1,2>
1571210605U, // <6,7,1,u>: Cost 2 vext2 RHS, <1,u,1,3>
2644952509U, // <6,7,2,0>: Cost 3 vext2 RHS, <2,0,1,2>
- 2644952579U, // <6,7,2,1>: Cost 3 vext2 RHS, <2,1,0,0>
+ 2644952582U, // <6,7,2,1>: Cost 3 vext2 RHS, <2,1,0,3>
1571210856U, // <6,7,2,2>: Cost 2 vext2 RHS, <2,2,2,2>
1571210918U, // <6,7,2,3>: Cost 2 vext2 RHS, <2,3,0,1>
2644952828U, // <6,7,2,4>: Cost 3 vext2 RHS, <2,4,0,6>
@@ -4990,18 +4990,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2668840938U, // <6,7,2,7>: Cost 3 vext2 RHS, <2,7,0,1>
1571211323U, // <6,7,2,u>: Cost 2 vext2 RHS, <2,u,0,1>
1571211414U, // <6,7,3,0>: Cost 2 vext2 RHS, <3,0,1,2>
- 2644953318U, // <6,7,3,1>: Cost 3 vext2 RHS, <3,1,1,1>
- 1571211574U, // <6,7,3,2>: Cost 2 vext2 RHS, <3,2,1,0>
+ 2644953311U, // <6,7,3,1>: Cost 3 vext2 RHS, <3,1,0,3>
+ 2644953390U, // <6,7,3,2>: Cost 3 vext2 RHS, <3,2,0,1>
1571211676U, // <6,7,3,3>: Cost 2 vext2 RHS, <3,3,3,3>
1571211778U, // <6,7,3,4>: Cost 2 vext2 RHS, <3,4,5,6>
2644953648U, // <6,7,3,5>: Cost 3 vext2 RHS, <3,5,1,7>
2644953720U, // <6,7,3,6>: Cost 3 vext2 RHS, <3,6,0,7>
2644953795U, // <6,7,3,7>: Cost 3 vext2 RHS, <3,7,0,1>
- 1571212060U, // <6,7,3,u>: Cost 2 vext2 RHS, <3,u,1,0>
+ 1571212062U, // <6,7,3,u>: Cost 2 vext2 RHS, <3,u,1,2>
1573202834U, // <6,7,4,0>: Cost 2 vext2 RHS, <4,0,5,1>
2644954058U, // <6,7,4,1>: Cost 3 vext2 RHS, <4,1,2,3>
2644954166U, // <6,7,4,2>: Cost 3 vext2 RHS, <4,2,5,3>
- 2644954218U, // <6,7,4,3>: Cost 3 vext2 RHS, <4,3,2,1>
+ 2644954258U, // <6,7,4,3>: Cost 3 vext2 RHS, <4,3,6,5>
1571212496U, // <6,7,4,4>: Cost 2 vext2 RHS, <4,4,4,4>
497470774U, // <6,7,4,5>: Cost 1 vext2 RHS, RHS
1573203316U, // <6,7,4,6>: Cost 2 vext2 RHS, <4,6,4,6>
@@ -5011,7 +5011,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1573203664U, // <6,7,5,1>: Cost 2 vext2 RHS, <5,1,7,3>
2644954878U, // <6,7,5,2>: Cost 3 vext2 RHS, <5,2,3,4>
2644954991U, // <6,7,5,3>: Cost 3 vext2 RHS, <5,3,7,0>
- 2644955038U, // <6,7,5,4>: Cost 3 vext2 RHS, <5,4,3,2>
+ 1571213254U, // <6,7,5,4>: Cost 2 vext2 RHS, <5,4,7,6>
1571213316U, // <6,7,5,5>: Cost 2 vext2 RHS, <5,5,5,5>
1571213410U, // <6,7,5,6>: Cost 2 vext2 RHS, <5,6,7,0>
1573204136U, // <6,7,5,7>: Cost 2 vext2 RHS, <5,7,5,7>
@@ -5020,8 +5020,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2644955561U, // <6,7,6,1>: Cost 3 vext2 RHS, <6,1,7,3>
1573204474U, // <6,7,6,2>: Cost 2 vext2 RHS, <6,2,7,3>
2644955698U, // <6,7,6,3>: Cost 3 vext2 RHS, <6,3,4,5>
- 2644955756U, // <6,7,6,4>: Cost 3 vext2 RHS, <6,4,2,0>
- 2644955858U, // <6,7,6,5>: Cost 3 vext2 RHS, <6,5,4,3>
+ 2644955789U, // <6,7,6,4>: Cost 3 vext2 RHS, <6,4,5,6>
+ 2644955889U, // <6,7,6,5>: Cost 3 vext2 RHS, <6,5,7,7>
1571214136U, // <6,7,6,6>: Cost 2 vext2 RHS, <6,6,6,6>
1571214158U, // <6,7,6,7>: Cost 2 vext2 RHS, <6,7,0,1>
1573204895U, // <6,7,6,u>: Cost 2 vext2 RHS, <6,u,0,1>
@@ -5030,13 +5030,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2644956362U, // <6,7,7,2>: Cost 3 vext2 RHS, <7,2,6,3>
2572610231U, // <6,7,7,3>: Cost 3 vext1 <3,6,7,7>, <3,6,7,7>
1573205350U, // <6,7,7,4>: Cost 2 vext2 RHS, <7,4,5,6>
- 2644956576U, // <6,7,7,5>: Cost 3 vext2 RHS, <7,5,3,1>
- 1571214854U, // <6,7,7,6>: Cost 2 vext2 RHS, <7,6,5,4>
+ 2646947220U, // <6,7,7,5>: Cost 3 vext2 RHS, <7,5,1,7>
+ 1516786498U, // <6,7,7,6>: Cost 2 vext1 <6,6,7,7>, <6,6,7,7>
1571214956U, // <6,7,7,7>: Cost 2 vext2 RHS, <7,7,7,7>
1573205634U, // <6,7,7,u>: Cost 2 vext2 RHS, <7,u,1,2>
1571215059U, // <6,7,u,0>: Cost 2 vext2 RHS, <u,0,1,2>
497473326U, // <6,7,u,1>: Cost 1 vext2 RHS, LHS
- 1571215219U, // <6,7,u,2>: Cost 2 vext2 RHS, <u,2,1,0>
+ 1571215237U, // <6,7,u,2>: Cost 2 vext2 RHS, <u,2,3,0>
1571215292U, // <6,7,u,3>: Cost 2 vext2 RHS, <u,3,0,1>
1571215423U, // <6,7,u,4>: Cost 2 vext2 RHS, <u,4,5,6>
497473690U, // <6,7,u,5>: Cost 1 vext2 RHS, RHS
@@ -5046,23 +5046,23 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1571217408U, // <6,u,0,0>: Cost 2 vext2 RHS, <0,0,0,0>
497475686U, // <6,u,0,1>: Cost 1 vext2 RHS, LHS
1571217572U, // <6,u,0,2>: Cost 2 vext2 RHS, <0,2,0,2>
- 2644959484U, // <6,u,0,3>: Cost 3 vext2 RHS, <0,3,1,0>
+ 2689865445U, // <6,u,0,3>: Cost 3 vext3 <0,u,2,6>, <u,0,3,2>
1571217746U, // <6,u,0,4>: Cost 2 vext2 RHS, <0,4,1,5>
1510830187U, // <6,u,0,5>: Cost 2 vext1 <5,6,u,0>, <5,6,u,0>
2644959734U, // <6,u,0,6>: Cost 3 vext2 RHS, <0,6,1,7>
- 3121368617U, // <6,u,0,7>: Cost 3 vtrnr <5,6,7,0>, RHS
+ 1193130221U, // <6,u,0,7>: Cost 2 vrev <u,6,7,0>
497476253U, // <6,u,0,u>: Cost 1 vext2 RHS, LHS
- 2566660198U, // <6,u,1,0>: Cost 3 vext1 <2,6,u,1>, LHS
+ 1571218166U, // <6,u,1,0>: Cost 2 vext2 RHS, <1,0,3,2>
1571218228U, // <6,u,1,1>: Cost 2 vext2 RHS, <1,1,1,1>
1612289838U, // <6,u,1,2>: Cost 2 vext3 <0,2,4,6>, LHS
1571218392U, // <6,u,1,3>: Cost 2 vext2 RHS, <1,3,1,3>
2566663478U, // <6,u,1,4>: Cost 3 vext1 <2,6,u,1>, RHS
1571218576U, // <6,u,1,5>: Cost 2 vext2 RHS, <1,5,3,7>
- 2644960454U, // <6,u,1,6>: Cost 3 vext2 RHS, <1,6,0,7>
- 2724665179U, // <6,u,1,7>: Cost 3 vext3 <6,6,6,6>, <u,1,7,3>
+ 2644960463U, // <6,u,1,6>: Cost 3 vext2 RHS, <1,6,1,7>
+ 2717439835U, // <6,u,1,7>: Cost 3 vext3 <5,4,7,6>, <u,1,7,3>
1612289892U, // <6,u,1,u>: Cost 2 vext3 <0,2,4,6>, LHS
1504870502U, // <6,u,2,0>: Cost 2 vext1 <4,6,u,2>, LHS
- 2686031731U, // <6,u,2,1>: Cost 3 vext3 <0,2,4,6>, <u,2,1,0>
+ 2644960774U, // <6,u,2,1>: Cost 3 vext2 RHS, <2,1,0,3>
1571219048U, // <6,u,2,2>: Cost 2 vext2 RHS, <2,2,2,2>
1571219110U, // <6,u,2,3>: Cost 2 vext2 RHS, <2,3,0,1>
1504873782U, // <6,u,2,4>: Cost 2 vext1 <4,6,u,2>, RHS
@@ -5071,28 +5071,28 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712573868U, // <6,u,2,7>: Cost 3 vext3 <4,6,4,6>, <u,2,7,3>
1571219515U, // <6,u,2,u>: Cost 2 vext2 RHS, <2,u,0,1>
1571219606U, // <6,u,3,0>: Cost 2 vext2 RHS, <3,0,1,2>
- 2644961510U, // <6,u,3,1>: Cost 3 vext2 RHS, <3,1,1,1>
- 1571219766U, // <6,u,3,2>: Cost 2 vext2 RHS, <3,2,1,0>
+ 2644961503U, // <6,u,3,1>: Cost 3 vext2 RHS, <3,1,0,3>
+ 2566678499U, // <6,u,3,2>: Cost 3 vext1 <2,6,u,3>, <2,6,u,3>
1571219868U, // <6,u,3,3>: Cost 2 vext2 RHS, <3,3,3,3>
1571219970U, // <6,u,3,4>: Cost 2 vext2 RHS, <3,4,5,6>
2689865711U, // <6,u,3,5>: Cost 3 vext3 <0,u,2,6>, <u,3,5,7>
- 2644961912U, // <6,u,3,6>: Cost 3 vext2 RHS, <3,6,0,7>
+ 2708002806U, // <6,u,3,6>: Cost 3 vext3 <3,u,5,6>, <u,3,6,5>
2644961987U, // <6,u,3,7>: Cost 3 vext2 RHS, <3,7,0,1>
- 1571220252U, // <6,u,3,u>: Cost 2 vext2 RHS, <3,u,1,0>
+ 1571220254U, // <6,u,3,u>: Cost 2 vext2 RHS, <3,u,1,2>
1571220370U, // <6,u,4,0>: Cost 2 vext2 RHS, <4,0,5,1>
- 2223858795U, // <6,u,4,1>: Cost 3 vrev <1,4,u,6>
+ 2644962250U, // <6,u,4,1>: Cost 3 vext2 RHS, <4,1,2,3>
1661245476U, // <6,u,4,2>: Cost 2 vext3 <u,4,2,6>, <u,4,2,6>
- 1162062365U, // <6,u,4,3>: Cost 2 vrev <3,4,u,6>
+ 2686031917U, // <6,u,4,3>: Cost 3 vext3 <0,2,4,6>, <u,4,3,6>
1571220688U, // <6,u,4,4>: Cost 2 vext2 RHS, <4,4,4,4>
497478967U, // <6,u,4,5>: Cost 1 vext2 RHS, RHS
1571220852U, // <6,u,4,6>: Cost 2 vext2 RHS, <4,6,4,6>
- 1185953153U, // <6,u,4,7>: Cost 2 vrev <7,4,u,6>
+ 1661614161U, // <6,u,4,7>: Cost 2 vext3 <u,4,7,6>, <u,4,7,6>
497479209U, // <6,u,4,u>: Cost 1 vext2 RHS, RHS
2566692966U, // <6,u,5,0>: Cost 3 vext1 <2,6,u,5>, LHS
1571221200U, // <6,u,5,1>: Cost 2 vext2 RHS, <5,1,7,3>
2566694885U, // <6,u,5,2>: Cost 3 vext1 <2,6,u,5>, <2,6,u,5>
2689865855U, // <6,u,5,3>: Cost 3 vext3 <0,u,2,6>, <u,5,3,7>
- 2566696246U, // <6,u,5,4>: Cost 3 vext1 <2,6,u,5>, RHS
+ 1571221446U, // <6,u,5,4>: Cost 2 vext2 RHS, <5,4,7,6>
1571221508U, // <6,u,5,5>: Cost 2 vext2 RHS, <5,5,5,5>
1612290202U, // <6,u,5,6>: Cost 2 vext3 <0,2,4,6>, RHS
1571221672U, // <6,u,5,7>: Cost 2 vext2 RHS, <5,7,5,7>
@@ -5102,7 +5102,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1571222010U, // <6,u,6,2>: Cost 2 vext2 RHS, <6,2,7,3>
2686032080U, // <6,u,6,3>: Cost 3 vext3 <0,2,4,6>, <u,6,3,7>
1504906550U, // <6,u,6,4>: Cost 2 vext1 <4,6,u,6>, RHS
- 2644964050U, // <6,u,6,5>: Cost 3 vext2 RHS, <6,5,4,3>
+ 2644964079U, // <6,u,6,5>: Cost 3 vext2 RHS, <6,5,7,5>
296144182U, // <6,u,6,6>: Cost 1 vdup2 RHS
1571222350U, // <6,u,6,7>: Cost 2 vext2 RHS, <6,7,0,1>
296144182U, // <6,u,6,u>: Cost 1 vdup2 RHS
@@ -5112,13 +5112,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1906753692U, // <6,u,7,3>: Cost 2 vzipr RHS, LHS
1492970806U, // <6,u,7,4>: Cost 2 vext1 <2,6,u,7>, RHS
2980495761U, // <6,u,7,5>: Cost 3 vzipr RHS, <0,4,u,5>
- 1571223046U, // <6,u,7,6>: Cost 2 vext2 RHS, <7,6,5,4>
+ 1516860235U, // <6,u,7,6>: Cost 2 vext1 <6,6,u,7>, <6,6,u,7>
1906756936U, // <6,u,7,7>: Cost 2 vzipr RHS, RHS
1492973358U, // <6,u,7,u>: Cost 2 vext1 <2,6,u,7>, LHS
1492975718U, // <6,u,u,0>: Cost 2 vext1 <2,6,u,u>, LHS
497481518U, // <6,u,u,1>: Cost 1 vext2 RHS, LHS
1612290405U, // <6,u,u,2>: Cost 2 vext3 <0,2,4,6>, LHS
- 1164716897U, // <6,u,u,3>: Cost 2 vrev <3,u,u,6>
+ 1571223484U, // <6,u,u,3>: Cost 2 vext2 RHS, <u,3,0,1>
1492978998U, // <6,u,u,4>: Cost 2 vext1 <2,6,u,u>, RHS
497481882U, // <6,u,u,5>: Cost 1 vext2 RHS, RHS
296144182U, // <6,u,u,6>: Cost 1 vdup2 RHS
@@ -5131,7 +5131,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712059941U, // <7,0,0,4>: Cost 3 vext3 RHS, <0,0,4,1>
2651603364U, // <7,0,0,5>: Cost 3 vext2 <5,6,7,0>, <0,5,1,6>
2590618445U, // <7,0,0,6>: Cost 3 vext1 <6,7,0,0>, <6,7,0,0>
- 2651603570U, // <7,0,0,7>: Cost 3 vext2 <5,6,7,0>, <0,7,6,5>
+ 3785801798U, // <7,0,0,7>: Cost 4 vext3 RHS, <0,0,7,7>
1638318153U, // <7,0,0,u>: Cost 2 vext3 RHS, <0,0,u,1>
1516879974U, // <7,0,1,0>: Cost 2 vext1 <6,7,0,1>, LHS
2693922911U, // <7,0,1,1>: Cost 3 vext3 <1,5,3,7>, <0,1,1,5>
@@ -5153,7 +5153,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638318316U, // <7,0,2,u>: Cost 2 vext3 RHS, <0,2,u,2>
2651605142U, // <7,0,3,0>: Cost 3 vext2 <5,6,7,0>, <3,0,1,2>
2712060156U, // <7,0,3,1>: Cost 3 vext3 RHS, <0,3,1,0>
- 2712060166U, // <7,0,3,2>: Cost 3 vext3 RHS, <0,3,2,1>
+ 2712060165U, // <7,0,3,2>: Cost 3 vext3 RHS, <0,3,2,0>
2651605404U, // <7,0,3,3>: Cost 3 vext2 <5,6,7,0>, <3,3,3,3>
2651605506U, // <7,0,3,4>: Cost 3 vext2 <5,6,7,0>, <3,4,5,6>
2638998111U, // <7,0,3,5>: Cost 3 vext2 <3,5,7,0>, <3,5,7,0>
@@ -5173,7 +5173,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2651606736U, // <7,0,5,1>: Cost 3 vext2 <5,6,7,0>, <5,1,7,3>
2712060334U, // <7,0,5,2>: Cost 3 vext3 RHS, <0,5,2,7>
2649616239U, // <7,0,5,3>: Cost 3 vext2 <5,3,7,0>, <5,3,7,0>
- 2590657846U, // <7,0,5,4>: Cost 3 vext1 <6,7,0,5>, RHS
+ 2651606982U, // <7,0,5,4>: Cost 3 vext2 <5,6,7,0>, <5,4,7,6>
2651607044U, // <7,0,5,5>: Cost 3 vext2 <5,6,7,0>, <5,5,5,5>
1577865314U, // <7,0,5,6>: Cost 2 vext2 <5,6,7,0>, <5,6,7,0>
2651607208U, // <7,0,5,7>: Cost 3 vext2 <5,6,7,0>, <5,7,5,7>
@@ -5193,7 +5193,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3712742678U, // <7,0,7,3>: Cost 4 vext2 <3,5,7,0>, <7,3,5,7>
2651608422U, // <7,0,7,4>: Cost 3 vext2 <5,6,7,0>, <7,4,5,6>
2651608513U, // <7,0,7,5>: Cost 3 vext2 <5,6,7,0>, <7,5,6,7>
- 2651608582U, // <7,0,7,6>: Cost 3 vext2 <5,6,7,0>, <7,6,5,4>
+ 2663552532U, // <7,0,7,6>: Cost 3 vext2 <7,6,7,0>, <7,6,7,0>
2651608684U, // <7,0,7,7>: Cost 3 vext2 <5,6,7,0>, <7,7,7,7>
2651608706U, // <7,0,7,u>: Cost 3 vext2 <5,6,7,0>, <7,u,1,2>
1638318730U, // <7,0,u,0>: Cost 2 vext3 RHS, <0,u,0,2>
@@ -5205,15 +5205,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1516942165U, // <7,0,u,6>: Cost 2 vext1 <6,7,0,u>, <6,7,0,u>
2651609344U, // <7,0,u,7>: Cost 3 vext2 <5,6,7,0>, <u,7,0,1>
564576979U, // <7,0,u,u>: Cost 1 vext3 RHS, LHS
- 2712060634U, // <7,1,0,0>: Cost 3 vext3 RHS, <1,0,0,1>
+ 2590687334U, // <7,1,0,0>: Cost 3 vext1 <6,7,1,0>, LHS
2639003750U, // <7,1,0,1>: Cost 3 vext2 <3,5,7,1>, LHS
2793357414U, // <7,1,0,2>: Cost 3 vuzpl <7,0,1,2>, LHS
- 2712060660U, // <7,1,0,3>: Cost 3 vext3 RHS, <1,0,3,0>
- 2712060674U, // <7,1,0,4>: Cost 3 vext3 RHS, <1,0,4,5>
- 2712060680U, // <7,1,0,5>: Cost 3 vext3 RHS, <1,0,5,2>
- 3785802513U, // <7,1,0,6>: Cost 4 vext3 RHS, <1,0,6,2>
- 2735948574U, // <7,1,0,7>: Cost 3 vext3 RHS, <1,0,7,6>
- 2639004317U, // <7,1,0,u>: Cost 3 vext2 <3,5,7,1>, LHS
+ 1638318838U, // <7,1,0,3>: Cost 2 vext3 RHS, <1,0,3,2>
+ 2590690614U, // <7,1,0,4>: Cost 3 vext1 <6,7,1,0>, RHS
+ 2712060679U, // <7,1,0,5>: Cost 3 vext3 RHS, <1,0,5,1>
+ 2590692182U, // <7,1,0,6>: Cost 3 vext1 <6,7,1,0>, <6,7,1,0>
+ 3785802521U, // <7,1,0,7>: Cost 4 vext3 RHS, <1,0,7,1>
+ 1638318883U, // <7,1,0,u>: Cost 2 vext3 RHS, <1,0,u,2>
2712060715U, // <7,1,1,0>: Cost 3 vext3 RHS, <1,1,0,1>
1638318900U, // <7,1,1,1>: Cost 2 vext3 RHS, <1,1,1,1>
3774300994U, // <7,1,1,2>: Cost 4 vext3 <2,6,3,7>, <1,1,2,6>
@@ -5221,7 +5221,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712060755U, // <7,1,1,4>: Cost 3 vext3 RHS, <1,1,4,5>
2691416926U, // <7,1,1,5>: Cost 3 vext3 <1,1,5,7>, <1,1,5,7>
2590700375U, // <7,1,1,6>: Cost 3 vext1 <6,7,1,1>, <6,7,1,1>
- 3765306224U, // <7,1,1,7>: Cost 4 vext3 <1,1,7,7>, <1,1,7,7>
+ 3765158766U, // <7,1,1,7>: Cost 4 vext3 <1,1,5,7>, <1,1,7,5>
1638318965U, // <7,1,1,u>: Cost 2 vext3 RHS, <1,1,u,3>
2712060796U, // <7,1,2,0>: Cost 3 vext3 RHS, <1,2,0,1>
2712060807U, // <7,1,2,1>: Cost 3 vext3 RHS, <1,2,1,3>
@@ -5241,14 +5241,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2692817929U, // <7,1,3,6>: Cost 3 vext3 <1,3,6,7>, <1,3,6,7>
2735948814U, // <7,1,3,7>: Cost 3 vext3 RHS, <1,3,7,3>
1619223579U, // <7,1,3,u>: Cost 2 vext3 <1,3,u,7>, <1,3,u,7>
- 2554888294U, // <7,1,4,0>: Cost 3 vext1 <0,7,1,4>, LHS
+ 2712060962U, // <7,1,4,0>: Cost 3 vext3 RHS, <1,4,0,5>
2712060971U, // <7,1,4,1>: Cost 3 vext3 RHS, <1,4,1,5>
2712060980U, // <7,1,4,2>: Cost 3 vext3 RHS, <1,4,2,5>
2712060989U, // <7,1,4,3>: Cost 3 vext3 RHS, <1,4,3,5>
- 2554891574U, // <7,1,4,4>: Cost 3 vext1 <0,7,1,4>, RHS
+ 3785802822U, // <7,1,4,4>: Cost 4 vext3 RHS, <1,4,4,5>
2639007030U, // <7,1,4,5>: Cost 3 vext2 <3,5,7,1>, RHS
2645642634U, // <7,1,4,6>: Cost 3 vext2 <4,6,7,1>, <4,6,7,1>
- 2554893670U, // <7,1,4,7>: Cost 3 vext1 <0,7,1,4>, <7,4,5,6>
+ 3719384520U, // <7,1,4,7>: Cost 4 vext2 <4,6,7,1>, <4,7,5,0>
2639007273U, // <7,1,4,u>: Cost 3 vext2 <3,5,7,1>, RHS
2572812390U, // <7,1,5,0>: Cost 3 vext1 <3,7,1,5>, LHS
2693776510U, // <7,1,5,1>: Cost 3 vext3 <1,5,1,7>, <1,5,1,7>
@@ -5259,11 +5259,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2651615331U, // <7,1,5,6>: Cost 3 vext2 <5,6,7,1>, <5,6,7,1>
2652278964U, // <7,1,5,7>: Cost 3 vext2 <5,7,7,1>, <5,7,7,1>
1620550845U, // <7,1,5,u>: Cost 2 vext3 <1,5,u,7>, <1,5,u,7>
- 2712061126U, // <7,1,6,0>: Cost 3 vext3 RHS, <1,6,0,7>
+ 3768108230U, // <7,1,6,0>: Cost 4 vext3 <1,6,0,7>, <1,6,0,7>
2694440143U, // <7,1,6,1>: Cost 3 vext3 <1,6,1,7>, <1,6,1,7>
2712061144U, // <7,1,6,2>: Cost 3 vext3 RHS, <1,6,2,7>
2694587617U, // <7,1,6,3>: Cost 3 vext3 <1,6,3,7>, <1,6,3,7>
- 2554907958U, // <7,1,6,4>: Cost 3 vext1 <0,7,1,6>, RHS
+ 3768403178U, // <7,1,6,4>: Cost 4 vext3 <1,6,4,7>, <1,6,4,7>
2694735091U, // <7,1,6,5>: Cost 3 vext3 <1,6,5,7>, <1,6,5,7>
3768550652U, // <7,1,6,6>: Cost 4 vext3 <1,6,6,7>, <1,6,6,7>
2652279630U, // <7,1,6,7>: Cost 3 vext2 <5,7,7,1>, <6,7,0,1>
@@ -5274,7 +5274,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3121938534U, // <7,1,7,3>: Cost 3 vtrnr <5,7,5,7>, LHS
2554916150U, // <7,1,7,4>: Cost 3 vext1 <0,7,1,7>, RHS
3769140548U, // <7,1,7,5>: Cost 4 vext3 <1,7,5,7>, <1,7,5,7>
- 3719386630U, // <7,1,7,6>: Cost 4 vext2 <4,6,7,1>, <7,6,5,4>
+ 3726022164U, // <7,1,7,6>: Cost 4 vext2 <5,7,7,1>, <7,6,7,0>
2554918508U, // <7,1,7,7>: Cost 3 vext1 <0,7,1,7>, <7,7,7,7>
3121938539U, // <7,1,7,u>: Cost 3 vtrnr <5,7,5,7>, LHS
2572836966U, // <7,1,u,0>: Cost 3 vext1 <3,7,1,u>, LHS
@@ -5295,15 +5295,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712061417U, // <7,2,0,6>: Cost 3 vext3 RHS, <2,0,6,1>
3785803251U, // <7,2,0,7>: Cost 4 vext3 RHS, <2,0,7,2>
2696947201U, // <7,2,0,u>: Cost 3 vext3 <2,0,u,7>, <2,0,u,7>
- 2712061443U, // <7,2,1,0>: Cost 3 vext3 RHS, <2,1,0,0>
+ 2712061446U, // <7,2,1,0>: Cost 3 vext3 RHS, <2,1,0,3>
3785803276U, // <7,2,1,1>: Cost 4 vext3 RHS, <2,1,1,0>
3785803285U, // <7,2,1,2>: Cost 4 vext3 RHS, <2,1,2,0>
- 2712061470U, // <7,2,1,3>: Cost 3 vext3 RHS, <2,1,3,0>
+ 2712061471U, // <7,2,1,3>: Cost 3 vext3 RHS, <2,1,3,1>
2712061482U, // <7,2,1,4>: Cost 3 vext3 RHS, <2,1,4,3>
3766486576U, // <7,2,1,5>: Cost 4 vext3 <1,3,5,7>, <2,1,5,0>
2712061500U, // <7,2,1,6>: Cost 3 vext3 RHS, <2,1,6,3>
- 2554942458U, // <7,2,1,7>: Cost 3 vext1 <0,7,2,1>, <7,0,1,2>
- 2712061515U, // <7,2,1,u>: Cost 3 vext3 RHS, <2,1,u,0>
+ 2602718850U, // <7,2,1,7>: Cost 3 vext1 <u,7,2,1>, <7,u,1,2>
+ 2712061516U, // <7,2,1,u>: Cost 3 vext3 RHS, <2,1,u,1>
2712061525U, // <7,2,2,0>: Cost 3 vext3 RHS, <2,2,0,1>
2712061536U, // <7,2,2,1>: Cost 3 vext3 RHS, <2,2,1,3>
1638319720U, // <7,2,2,2>: Cost 2 vext3 RHS, <2,2,2,2>
@@ -5311,7 +5311,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712061565U, // <7,2,2,4>: Cost 3 vext3 RHS, <2,2,4,5>
2698053256U, // <7,2,2,5>: Cost 3 vext3 <2,2,5,7>, <2,2,5,7>
2712061584U, // <7,2,2,6>: Cost 3 vext3 RHS, <2,2,6,6>
- 3771942554U, // <7,2,2,7>: Cost 4 vext3 <2,2,7,7>, <2,2,7,7>
+ 3771795096U, // <7,2,2,7>: Cost 4 vext3 <2,2,5,7>, <2,2,7,5>
1638319775U, // <7,2,2,u>: Cost 2 vext3 RHS, <2,2,u,3>
1638319782U, // <7,2,3,0>: Cost 2 vext3 RHS, <2,3,0,1>
2693924531U, // <7,2,3,1>: Cost 3 vext3 <1,5,3,7>, <2,3,1,5>
@@ -5347,15 +5347,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2572897590U, // <7,2,6,4>: Cost 3 vext1 <3,7,2,6>, RHS
2700707788U, // <7,2,6,5>: Cost 3 vext3 <2,6,5,7>, <2,6,5,7>
2700781525U, // <7,2,6,6>: Cost 3 vext3 <2,6,6,7>, <2,6,6,7>
- 2260588014U, // <7,2,6,7>: Cost 3 vrev <7,6,2,7>
+ 3774597086U, // <7,2,6,7>: Cost 4 vext3 <2,6,7,7>, <2,6,7,7>
1627187175U, // <7,2,6,u>: Cost 2 vext3 <2,6,u,7>, <2,6,u,7>
2735949802U, // <7,2,7,0>: Cost 3 vext3 RHS, <2,7,0,1>
- 3785803768U, // <7,2,7,1>: Cost 4 vext3 RHS, <2,7,1,6>
+ 3780200434U, // <7,2,7,1>: Cost 4 vext3 <3,6,2,7>, <2,7,1,0>
3773564928U, // <7,2,7,2>: Cost 4 vext3 <2,5,2,7>, <2,7,2,5>
2986541158U, // <7,2,7,3>: Cost 3 vzipr <5,5,7,7>, LHS
2554989878U, // <7,2,7,4>: Cost 3 vext1 <0,7,2,7>, RHS
3775113245U, // <7,2,7,5>: Cost 4 vext3 <2,7,5,7>, <2,7,5,7>
- 3785803810U, // <7,2,7,6>: Cost 4 vext3 RHS, <2,7,6,3>
+ 4060283228U, // <7,2,7,6>: Cost 4 vzipr <5,5,7,7>, <0,4,2,6>
2554992236U, // <7,2,7,7>: Cost 3 vext1 <0,7,2,7>, <7,7,7,7>
2986541163U, // <7,2,7,u>: Cost 3 vzipr <5,5,7,7>, LHS
1638320187U, // <7,2,u,0>: Cost 2 vext3 RHS, <2,u,0,1>
@@ -5365,7 +5365,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638320227U, // <7,2,u,4>: Cost 2 vext3 RHS, <2,u,4,5>
2702035054U, // <7,2,u,5>: Cost 3 vext3 <2,u,5,7>, <2,u,5,7>
2702108791U, // <7,2,u,6>: Cost 3 vext3 <2,u,6,7>, <2,u,6,7>
- 2261915280U, // <7,2,u,7>: Cost 3 vrev <7,u,2,7>
+ 2735949945U, // <7,2,u,7>: Cost 3 vext3 RHS, <2,u,7,0>
1628514441U, // <7,2,u,u>: Cost 2 vext3 <2,u,u,7>, <2,u,u,7>
2712062091U, // <7,3,0,0>: Cost 3 vext3 RHS, <3,0,0,0>
1638320278U, // <7,3,0,1>: Cost 2 vext3 RHS, <3,0,1,2>
@@ -5374,26 +5374,26 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712062128U, // <7,3,0,4>: Cost 3 vext3 RHS, <3,0,4,1>
2712062138U, // <7,3,0,5>: Cost 3 vext3 RHS, <3,0,5,2>
2590839656U, // <7,3,0,6>: Cost 3 vext1 <6,7,3,0>, <6,7,3,0>
- 3785803978U, // <7,3,0,7>: Cost 4 vext3 RHS, <3,0,7,0>
+ 3311414017U, // <7,3,0,7>: Cost 4 vrev <3,7,7,0>
1638320341U, // <7,3,0,u>: Cost 2 vext3 RHS, <3,0,u,2>
- 3710108424U, // <7,3,1,0>: Cost 4 vext2 <3,1,7,3>, <1,0,5,2>
+ 2237164227U, // <7,3,1,0>: Cost 3 vrev <3,7,0,1>
2712062182U, // <7,3,1,1>: Cost 3 vext3 RHS, <3,1,1,1>
2712062193U, // <7,3,1,2>: Cost 3 vext3 RHS, <3,1,2,3>
2692745468U, // <7,3,1,3>: Cost 3 vext3 <1,3,5,7>, <3,1,3,5>
2712062214U, // <7,3,1,4>: Cost 3 vext3 RHS, <3,1,4,6>
2693925132U, // <7,3,1,5>: Cost 3 vext3 <1,5,3,7>, <3,1,5,3>
3768183059U, // <7,3,1,6>: Cost 4 vext3 <1,6,1,7>, <3,1,6,1>
- 2712062238U, // <7,3,1,7>: Cost 3 vext3 RHS, <3,1,7,3>
+ 2692745504U, // <7,3,1,7>: Cost 3 vext3 <1,3,5,7>, <3,1,7,5>
2696063273U, // <7,3,1,u>: Cost 3 vext3 <1,u,5,7>, <3,1,u,5>
- 2590851174U, // <7,3,2,0>: Cost 3 vext1 <6,7,3,2>, LHS
- 1638320438U, // <7,3,2,1>: Cost 2 vext3 RHS, <3,2,1,0>
+ 2712062254U, // <7,3,2,0>: Cost 3 vext3 RHS, <3,2,0,1>
+ 2712062262U, // <7,3,2,1>: Cost 3 vext3 RHS, <3,2,1,0>
2712062273U, // <7,3,2,2>: Cost 3 vext3 RHS, <3,2,2,2>
2712062280U, // <7,3,2,3>: Cost 3 vext3 RHS, <3,2,3,0>
- 2590854454U, // <7,3,2,4>: Cost 3 vext1 <6,7,3,2>, RHS
- 3773565276U, // <7,3,2,5>: Cost 4 vext3 <2,5,2,7>, <3,2,5,2>
+ 2712062294U, // <7,3,2,4>: Cost 3 vext3 RHS, <3,2,4,5>
+ 2712062302U, // <7,3,2,5>: Cost 3 vext3 RHS, <3,2,5,4>
2700560742U, // <7,3,2,6>: Cost 3 vext3 <2,6,3,7>, <3,2,6,3>
2712062319U, // <7,3,2,7>: Cost 3 vext3 RHS, <3,2,7,3>
- 1638320501U, // <7,3,2,u>: Cost 2 vext3 RHS, <3,2,u,0>
+ 2712062325U, // <7,3,2,u>: Cost 3 vext3 RHS, <3,2,u,0>
2712062335U, // <7,3,3,0>: Cost 3 vext3 RHS, <3,3,0,1>
2636368158U, // <7,3,3,1>: Cost 3 vext2 <3,1,7,3>, <3,1,7,3>
2637031791U, // <7,3,3,2>: Cost 3 vext2 <3,2,7,3>, <3,2,7,3>
@@ -5405,18 +5405,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638320540U, // <7,3,3,u>: Cost 2 vext3 RHS, <3,3,3,3>
2712062416U, // <7,3,4,0>: Cost 3 vext3 RHS, <3,4,0,1>
2712062426U, // <7,3,4,1>: Cost 3 vext3 RHS, <3,4,1,2>
- 2712062438U, // <7,3,4,2>: Cost 3 vext3 RHS, <3,4,2,5>
+ 2566981640U, // <7,3,4,2>: Cost 3 vext1 <2,7,3,4>, <2,7,3,4>
2712062447U, // <7,3,4,3>: Cost 3 vext3 RHS, <3,4,3,5>
2712062456U, // <7,3,4,4>: Cost 3 vext3 RHS, <3,4,4,5>
1638320642U, // <7,3,4,5>: Cost 2 vext3 RHS, <3,4,5,6>
2648313204U, // <7,3,4,6>: Cost 3 vext2 <5,1,7,3>, <4,6,4,6>
- 3785804302U, // <7,3,4,7>: Cost 4 vext3 RHS, <3,4,7,0>
+ 3311446789U, // <7,3,4,7>: Cost 4 vrev <3,7,7,4>
1638320669U, // <7,3,4,u>: Cost 2 vext3 RHS, <3,4,u,6>
2602819686U, // <7,3,5,0>: Cost 3 vext1 <u,7,3,5>, LHS
1574571728U, // <7,3,5,1>: Cost 2 vext2 <5,1,7,3>, <5,1,7,3>
2648977185U, // <7,3,5,2>: Cost 3 vext2 <5,2,7,3>, <5,2,7,3>
2705869378U, // <7,3,5,3>: Cost 3 vext3 <3,5,3,7>, <3,5,3,7>
- 2712062538U, // <7,3,5,4>: Cost 3 vext3 RHS, <3,5,4,6>
+ 2237491947U, // <7,3,5,4>: Cost 3 vrev <3,7,4,5>
2706016852U, // <7,3,5,5>: Cost 3 vext3 <3,5,5,7>, <3,5,5,7>
2648313954U, // <7,3,5,6>: Cost 3 vext2 <5,1,7,3>, <5,6,7,0>
2692745823U, // <7,3,5,7>: Cost 3 vext3 <1,3,5,7>, <3,5,7,0>
@@ -5436,18 +5436,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2572978916U, // <7,3,7,3>: Cost 3 vext1 <3,7,3,7>, <3,7,3,7>
2693925611U, // <7,3,7,4>: Cost 3 vext3 <1,5,3,7>, <3,7,4,5>
2707344118U, // <7,3,7,5>: Cost 3 vext3 <3,7,5,7>, <3,7,5,7>
- 2648315398U, // <7,3,7,6>: Cost 3 vext2 <5,1,7,3>, <7,6,5,4>
+ 2654950894U, // <7,3,7,6>: Cost 3 vext2 <6,2,7,3>, <7,6,2,7>
2648315500U, // <7,3,7,7>: Cost 3 vext2 <5,1,7,3>, <7,7,7,7>
2693925643U, // <7,3,7,u>: Cost 3 vext3 <1,5,3,7>, <3,7,u,1>
- 2707639066U, // <7,3,u,0>: Cost 3 vext3 <3,u,0,7>, <3,u,0,7>
- 1638320924U, // <7,3,u,1>: Cost 2 vext3 RHS, <3,u,1,0>
+ 2237221578U, // <7,3,u,0>: Cost 3 vrev <3,7,0,u>
+ 1638320926U, // <7,3,u,1>: Cost 2 vext3 RHS, <3,u,1,2>
1593153452U, // <7,3,u,2>: Cost 2 vext2 <u,2,7,3>, <u,2,7,3>
1638320540U, // <7,3,u,3>: Cost 2 vext3 RHS, <3,3,3,3>
- 2707934014U, // <7,3,u,4>: Cost 3 vext3 <3,u,4,7>, <3,u,4,7>
+ 2237516526U, // <7,3,u,4>: Cost 3 vrev <3,7,4,u>
1638320966U, // <7,3,u,5>: Cost 2 vext3 RHS, <3,u,5,6>
2712062796U, // <7,3,u,6>: Cost 3 vext3 RHS, <3,u,6,3>
2692967250U, // <7,3,u,7>: Cost 3 vext3 <1,3,u,7>, <3,u,7,0>
- 1638320987U, // <7,3,u,u>: Cost 2 vext3 RHS, <3,u,u,0>
+ 1638320989U, // <7,3,u,u>: Cost 2 vext3 RHS, <3,u,u,2>
2651635712U, // <7,4,0,0>: Cost 3 vext2 <5,6,7,4>, <0,0,0,0>
1577893990U, // <7,4,0,1>: Cost 2 vext2 <5,6,7,4>, LHS
2651635876U, // <7,4,0,2>: Cost 3 vext2 <5,6,7,4>, <0,2,0,2>
@@ -5457,7 +5457,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638468508U, // <7,4,0,6>: Cost 2 vext3 RHS, <4,0,6,2>
3787795364U, // <7,4,0,7>: Cost 4 vext3 RHS, <4,0,7,1>
1640459181U, // <7,4,0,u>: Cost 2 vext3 RHS, <4,0,u,1>
- 3712770824U, // <7,4,1,0>: Cost 4 vext2 <3,5,7,4>, <1,0,5,2>
+ 2651636470U, // <7,4,1,0>: Cost 3 vext2 <5,6,7,4>, <1,0,3,2>
2651636532U, // <7,4,1,1>: Cost 3 vext2 <5,6,7,4>, <1,1,1,1>
2712062922U, // <7,4,1,2>: Cost 3 vext3 RHS, <4,1,2,3>
2639029248U, // <7,4,1,3>: Cost 3 vext2 <3,5,7,4>, <1,3,5,7>
@@ -5473,25 +5473,25 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3716753194U, // <7,4,2,4>: Cost 4 vext2 <4,2,7,4>, <2,4,5,7>
2712063030U, // <7,4,2,5>: Cost 3 vext3 RHS, <4,2,5,3>
2712063036U, // <7,4,2,6>: Cost 3 vext3 RHS, <4,2,6,0>
- 3785804872U, // <7,4,2,7>: Cost 4 vext3 RHS, <4,2,7,3>
+ 3773123658U, // <7,4,2,7>: Cost 4 vext3 <2,4,5,7>, <4,2,7,5>
2712063054U, // <7,4,2,u>: Cost 3 vext3 RHS, <4,2,u,0>
2651637910U, // <7,4,3,0>: Cost 3 vext2 <5,6,7,4>, <3,0,1,2>
3712772348U, // <7,4,3,1>: Cost 4 vext2 <3,5,7,4>, <3,1,3,5>
- 2712063082U, // <7,4,3,2>: Cost 3 vext3 RHS, <4,3,2,1>
+ 3785804906U, // <7,4,3,2>: Cost 4 vext3 RHS, <4,3,2,1>
2651638172U, // <7,4,3,3>: Cost 3 vext2 <5,6,7,4>, <3,3,3,3>
2651638274U, // <7,4,3,4>: Cost 3 vext2 <5,6,7,4>, <3,4,5,6>
2639030883U, // <7,4,3,5>: Cost 3 vext2 <3,5,7,4>, <3,5,7,4>
- 2712210578U, // <7,4,3,6>: Cost 3 vext3 RHS, <4,3,6,5>
+ 2712063122U, // <7,4,3,6>: Cost 3 vext3 RHS, <4,3,6,5>
3712772836U, // <7,4,3,7>: Cost 4 vext2 <3,5,7,4>, <3,7,3,7>
2641021782U, // <7,4,3,u>: Cost 3 vext2 <3,u,7,4>, <3,u,7,4>
2714053802U, // <7,4,4,0>: Cost 3 vext3 RHS, <4,4,0,2>
3785804978U, // <7,4,4,1>: Cost 4 vext3 RHS, <4,4,1,1>
3716754505U, // <7,4,4,2>: Cost 4 vext2 <4,2,7,4>, <4,2,7,4>
- 3785804997U, // <7,4,4,3>: Cost 4 vext3 RHS, <4,4,3,2>
+ 3785804998U, // <7,4,4,3>: Cost 4 vext3 RHS, <4,4,3,3>
1638321360U, // <7,4,4,4>: Cost 2 vext3 RHS, <4,4,4,4>
1638468826U, // <7,4,4,5>: Cost 2 vext3 RHS, <4,4,5,5>
1638468836U, // <7,4,4,6>: Cost 2 vext3 RHS, <4,4,6,6>
- 2651639254U, // <7,4,4,7>: Cost 3 vext2 <5,6,7,4>, <4,7,6,5>
+ 3785215214U, // <7,4,4,7>: Cost 4 vext3 <4,4,7,7>, <4,4,7,7>
1640459509U, // <7,4,4,u>: Cost 2 vext3 RHS, <4,4,u,5>
1517207654U, // <7,4,5,0>: Cost 2 vext1 <6,7,4,5>, LHS
2573034640U, // <7,4,5,1>: Cost 3 vext1 <3,7,4,5>, <1,5,3,7>
@@ -5504,7 +5504,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
564579656U, // <7,4,5,u>: Cost 1 vext3 RHS, RHS
2712063307U, // <7,4,6,0>: Cost 3 vext3 RHS, <4,6,0,1>
3767668056U, // <7,4,6,1>: Cost 4 vext3 <1,5,3,7>, <4,6,1,5>
- 2712210780U, // <7,4,6,2>: Cost 3 vext3 RHS, <4,6,2,0>
+ 2651640314U, // <7,4,6,2>: Cost 3 vext2 <5,6,7,4>, <6,2,7,3>
2655621708U, // <7,4,6,3>: Cost 3 vext2 <6,3,7,4>, <6,3,7,4>
1638468980U, // <7,4,6,4>: Cost 2 vext3 RHS, <4,6,4,6>
2712063358U, // <7,4,6,5>: Cost 3 vext3 RHS, <4,6,5,7>
@@ -5522,7 +5522,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2713538026U, // <7,4,7,u>: Cost 3 vext3 <4,7,u,7>, <4,7,u,7>
1517232230U, // <7,4,u,0>: Cost 2 vext1 <6,7,4,u>, LHS
1577899822U, // <7,4,u,1>: Cost 2 vext2 <5,6,7,4>, LHS
- 2712063487U, // <7,4,u,2>: Cost 3 vext3 RHS, <4,u,2,1>
+ 2712063489U, // <7,4,u,2>: Cost 3 vext3 RHS, <4,u,2,3>
2573060846U, // <7,4,u,3>: Cost 3 vext1 <3,7,4,u>, <3,7,4,u>
1640312342U, // <7,4,u,4>: Cost 2 vext3 RHS, <4,u,4,6>
1638469146U, // <7,4,u,5>: Cost 2 vext3 RHS, <4,u,5,1>
@@ -5530,54 +5530,54 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2714054192U, // <7,4,u,7>: Cost 3 vext3 RHS, <4,u,7,5>
564579899U, // <7,4,u,u>: Cost 1 vext3 RHS, RHS
2579038310U, // <7,5,0,0>: Cost 3 vext1 <4,7,5,0>, LHS
- 2712063560U, // <7,5,0,1>: Cost 3 vext3 RHS, <5,0,1,2>
+ 2636382310U, // <7,5,0,1>: Cost 3 vext2 <3,1,7,5>, LHS
2796339302U, // <7,5,0,2>: Cost 3 vuzpl <7,4,5,6>, LHS
3646810719U, // <7,5,0,3>: Cost 4 vext1 <3,7,5,0>, <3,5,7,0>
2712063586U, // <7,5,0,4>: Cost 3 vext3 RHS, <5,0,4,1>
2735951467U, // <7,5,0,5>: Cost 3 vext3 RHS, <5,0,5,1>
2735951476U, // <7,5,0,6>: Cost 3 vext3 RHS, <5,0,6,1>
2579043322U, // <7,5,0,7>: Cost 3 vext1 <4,7,5,0>, <7,0,1,2>
- 2712063622U, // <7,5,0,u>: Cost 3 vext3 RHS, <5,0,u,1>
- 2714054287U, // <7,5,1,0>: Cost 3 vext3 RHS, <5,1,0,1>
- 3295396702U, // <7,5,1,1>: Cost 4 vrev <1,1,5,7>
- 3766488736U, // <7,5,1,2>: Cost 4 vext3 <1,3,5,7>, <5,1,2,0>
- 2859384934U, // <7,5,1,3>: Cost 3 vuzpr <6,7,4,5>, LHS
- 2712063666U, // <7,5,1,4>: Cost 3 vext3 RHS, <5,1,4,0>
+ 2636382877U, // <7,5,0,u>: Cost 3 vext2 <3,1,7,5>, LHS
+ 2712211087U, // <7,5,1,0>: Cost 3 vext3 RHS, <5,1,0,1>
+ 3698180916U, // <7,5,1,1>: Cost 4 vext2 <1,1,7,5>, <1,1,1,1>
+ 3710124950U, // <7,5,1,2>: Cost 4 vext2 <3,1,7,5>, <1,2,3,0>
+ 2636383232U, // <7,5,1,3>: Cost 3 vext2 <3,1,7,5>, <1,3,5,7>
+ 2712211127U, // <7,5,1,4>: Cost 3 vext3 RHS, <5,1,4,5>
2590994128U, // <7,5,1,5>: Cost 3 vext1 <6,7,5,1>, <5,1,7,3>
2590995323U, // <7,5,1,6>: Cost 3 vext1 <6,7,5,1>, <6,7,5,1>
1638469328U, // <7,5,1,7>: Cost 2 vext3 RHS, <5,1,7,3>
1638469337U, // <7,5,1,u>: Cost 2 vext3 RHS, <5,1,u,3>
3785805536U, // <7,5,2,0>: Cost 4 vext3 RHS, <5,2,0,1>
- 3766488808U, // <7,5,2,1>: Cost 4 vext3 <1,3,5,7>, <5,2,1,0>
- 3302033032U, // <7,5,2,2>: Cost 4 vrev <2,2,5,7>
+ 3785805544U, // <7,5,2,1>: Cost 4 vext3 RHS, <5,2,1,0>
+ 3704817288U, // <7,5,2,2>: Cost 4 vext2 <2,2,7,5>, <2,2,5,7>
2712063742U, // <7,5,2,3>: Cost 3 vext3 RHS, <5,2,3,4>
- 3785805571U, // <7,5,2,4>: Cost 4 vext3 RHS, <5,2,4,0>
+ 3716761386U, // <7,5,2,4>: Cost 4 vext2 <4,2,7,5>, <2,4,5,7>
2714054415U, // <7,5,2,5>: Cost 3 vext3 RHS, <5,2,5,3>
3774304024U, // <7,5,2,6>: Cost 4 vext3 <2,6,3,7>, <5,2,6,3>
2712063777U, // <7,5,2,7>: Cost 3 vext3 RHS, <5,2,7,3>
2712063787U, // <7,5,2,u>: Cost 3 vext3 RHS, <5,2,u,4>
3634888806U, // <7,5,3,0>: Cost 4 vext1 <1,7,5,3>, LHS
- 2222982144U, // <7,5,3,1>: Cost 3 vrev <1,3,5,7>
- 2228954841U, // <7,5,3,2>: Cost 3 vrev <2,3,5,7>
- 3308669362U, // <7,5,3,3>: Cost 4 vrev <3,3,5,7>
+ 2636384544U, // <7,5,3,1>: Cost 3 vext2 <3,1,7,5>, <3,1,7,5>
+ 3710790001U, // <7,5,3,2>: Cost 4 vext2 <3,2,7,5>, <3,2,7,5>
+ 3710126492U, // <7,5,3,3>: Cost 4 vext2 <3,1,7,5>, <3,3,3,3>
3634892086U, // <7,5,3,4>: Cost 4 vext1 <1,7,5,3>, RHS
2639039076U, // <7,5,3,5>: Cost 3 vext2 <3,5,7,5>, <3,5,7,5>
3713444533U, // <7,5,3,6>: Cost 4 vext2 <3,6,7,5>, <3,6,7,5>
2693926767U, // <7,5,3,7>: Cost 3 vext3 <1,5,3,7>, <5,3,7,0>
2712063864U, // <7,5,3,u>: Cost 3 vext3 RHS, <5,3,u,0>
2579071078U, // <7,5,4,0>: Cost 3 vext1 <4,7,5,4>, LHS
- 2735951762U, // <7,5,4,1>: Cost 3 vext3 RHS, <5,4,1,u>
- 3303360298U, // <7,5,4,2>: Cost 4 vrev <2,4,5,7>
- 2712063902U, // <7,5,4,3>: Cost 3 vext3 RHS, <5,4,3,2>
+ 3646841856U, // <7,5,4,1>: Cost 4 vext1 <3,7,5,4>, <1,3,5,7>
+ 3716762698U, // <7,5,4,2>: Cost 4 vext2 <4,2,7,5>, <4,2,7,5>
+ 3646843491U, // <7,5,4,3>: Cost 4 vext1 <3,7,5,4>, <3,5,7,4>
2579074358U, // <7,5,4,4>: Cost 3 vext1 <4,7,5,4>, RHS
- 2712063924U, // <7,5,4,5>: Cost 3 vext3 RHS, <5,4,5,6>
+ 2636385590U, // <7,5,4,5>: Cost 3 vext2 <3,1,7,5>, RHS
2645675406U, // <7,5,4,6>: Cost 3 vext2 <4,6,7,5>, <4,6,7,5>
- 2712211397U, // <7,5,4,7>: Cost 3 vext3 RHS, <5,4,7,5>
- 2712063947U, // <7,5,4,u>: Cost 3 vext3 RHS, <5,4,u,2>
+ 1638322118U, // <7,5,4,7>: Cost 2 vext3 RHS, <5,4,7,6>
+ 1638469583U, // <7,5,4,u>: Cost 2 vext3 RHS, <5,4,u,6>
2714054611U, // <7,5,5,0>: Cost 3 vext3 RHS, <5,5,0,1>
2652974800U, // <7,5,5,1>: Cost 3 vext2 <5,u,7,5>, <5,1,7,3>
- 3785805799U, // <7,5,5,2>: Cost 4 vext3 RHS, <5,5,2,3>
- 2236254804U, // <7,5,5,3>: Cost 3 vrev <3,5,5,7>
+ 3710127905U, // <7,5,5,2>: Cost 4 vext2 <3,1,7,5>, <5,2,7,3>
+ 3785805808U, // <7,5,5,3>: Cost 4 vext3 RHS, <5,5,3,3>
2712211450U, // <7,5,5,4>: Cost 3 vext3 RHS, <5,5,4,4>
1638322180U, // <7,5,5,5>: Cost 2 vext3 RHS, <5,5,5,5>
2712064014U, // <7,5,5,6>: Cost 3 vext3 RHS, <5,5,6,6>
@@ -5585,7 +5585,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638469665U, // <7,5,5,u>: Cost 2 vext3 RHS, <5,5,u,7>
2712064036U, // <7,5,6,0>: Cost 3 vext3 RHS, <5,6,0,1>
2714054707U, // <7,5,6,1>: Cost 3 vext3 RHS, <5,6,1,7>
- 3304687564U, // <7,5,6,2>: Cost 4 vrev <2,6,5,7>
+ 3785805879U, // <7,5,6,2>: Cost 4 vext3 RHS, <5,6,2,2>
2712064066U, // <7,5,6,3>: Cost 3 vext3 RHS, <5,6,3,4>
2712064076U, // <7,5,6,4>: Cost 3 vext3 RHS, <5,6,4,5>
2714054743U, // <7,5,6,5>: Cost 3 vext3 RHS, <5,6,5,7>
@@ -5602,95 +5602,95 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712211636U, // <7,5,7,7>: Cost 3 vext3 RHS, <5,7,7,1>
1638469823U, // <7,5,7,u>: Cost 2 vext3 RHS, <5,7,u,3>
1511333990U, // <7,5,u,0>: Cost 2 vext1 <5,7,5,u>, LHS
- 2226300309U, // <7,5,u,1>: Cost 3 vrev <1,u,5,7>
- 2585077352U, // <7,5,u,2>: Cost 3 vext1 <5,7,5,u>, <2,2,2,2>
+ 2636388142U, // <7,5,u,1>: Cost 3 vext2 <3,1,7,5>, LHS
+ 2712211671U, // <7,5,u,2>: Cost 3 vext3 RHS, <5,u,2,0>
2573134583U, // <7,5,u,3>: Cost 3 vext1 <3,7,5,u>, <3,7,5,u>
1511337270U, // <7,5,u,4>: Cost 2 vext1 <5,7,5,u>, RHS
1638469881U, // <7,5,u,5>: Cost 2 vext3 RHS, <5,u,5,7>
2712064258U, // <7,5,u,6>: Cost 3 vext3 RHS, <5,u,6,7>
1638469892U, // <7,5,u,7>: Cost 2 vext3 RHS, <5,u,7,0>
1638469904U, // <7,5,u,u>: Cost 2 vext3 RHS, <5,u,u,3>
- 2585084006U, // <7,6,0,0>: Cost 3 vext1 <5,7,6,0>, LHS
- 2712064289U, // <7,6,0,1>: Cost 3 vext3 RHS, <6,0,1,2>
+ 2650324992U, // <7,6,0,0>: Cost 3 vext2 <5,4,7,6>, <0,0,0,0>
+ 1576583270U, // <7,6,0,1>: Cost 2 vext2 <5,4,7,6>, LHS
2712064300U, // <7,6,0,2>: Cost 3 vext3 RHS, <6,0,2,4>
- 3785806130U, // <7,6,0,3>: Cost 4 vext3 RHS, <6,0,3,1>
+ 2255295336U, // <7,6,0,3>: Cost 3 vrev <6,7,3,0>
2712064316U, // <7,6,0,4>: Cost 3 vext3 RHS, <6,0,4,2>
2585088098U, // <7,6,0,5>: Cost 3 vext1 <5,7,6,0>, <5,6,7,0>
2735952204U, // <7,6,0,6>: Cost 3 vext3 RHS, <6,0,6,0>
2712211799U, // <7,6,0,7>: Cost 3 vext3 RHS, <6,0,7,2>
- 2712064352U, // <7,6,0,u>: Cost 3 vext3 RHS, <6,0,u,2>
- 2579120230U, // <7,6,1,0>: Cost 3 vext1 <4,7,6,1>, LHS
- 3785806193U, // <7,6,1,1>: Cost 4 vext3 RHS, <6,1,1,1>
- 3774304633U, // <7,6,1,2>: Cost 4 vext3 <2,6,3,7>, <6,1,2,0>
- 3766489479U, // <7,6,1,3>: Cost 4 vext3 <1,3,5,7>, <6,1,3,5>
+ 1576583837U, // <7,6,0,u>: Cost 2 vext2 <5,4,7,6>, LHS
+ 1181340494U, // <7,6,1,0>: Cost 2 vrev <6,7,0,1>
+ 2650325812U, // <7,6,1,1>: Cost 3 vext2 <5,4,7,6>, <1,1,1,1>
+ 2650325910U, // <7,6,1,2>: Cost 3 vext2 <5,4,7,6>, <1,2,3,0>
+ 2650325976U, // <7,6,1,3>: Cost 3 vext2 <5,4,7,6>, <1,3,1,3>
2579123510U, // <7,6,1,4>: Cost 3 vext1 <4,7,6,1>, RHS
- 3767669143U, // <7,6,1,5>: Cost 4 vext3 <1,5,3,7>, <6,1,5,3>
+ 2650326160U, // <7,6,1,5>: Cost 3 vext2 <5,4,7,6>, <1,5,3,7>
2714055072U, // <7,6,1,6>: Cost 3 vext3 RHS, <6,1,6,3>
2712064425U, // <7,6,1,7>: Cost 3 vext3 RHS, <6,1,7,3>
- 2579126062U, // <7,6,1,u>: Cost 3 vext1 <4,7,6,1>, LHS
- 2714055097U, // <7,6,2,0>: Cost 3 vext3 RHS, <6,2,0,1>
+ 1181930390U, // <7,6,1,u>: Cost 2 vrev <6,7,u,1>
+ 2712211897U, // <7,6,2,0>: Cost 3 vext3 RHS, <6,2,0,1>
2714055108U, // <7,6,2,1>: Cost 3 vext3 RHS, <6,2,1,3>
- 3785806284U, // <7,6,2,2>: Cost 4 vext3 RHS, <6,2,2,2>
- 2631747306U, // <7,6,2,3>: Cost 3 vext2 <2,3,7,6>, <2,3,7,6>
- 2712064476U, // <7,6,2,4>: Cost 3 vext3 RHS, <6,2,4,0>
+ 2650326632U, // <7,6,2,2>: Cost 3 vext2 <5,4,7,6>, <2,2,2,2>
+ 2650326694U, // <7,6,2,3>: Cost 3 vext2 <5,4,7,6>, <2,3,0,1>
+ 2714055137U, // <7,6,2,4>: Cost 3 vext3 RHS, <6,2,4,5>
2714055148U, // <7,6,2,5>: Cost 3 vext3 RHS, <6,2,5,7>
- 2591077253U, // <7,6,2,6>: Cost 3 vext1 <6,7,6,2>, <6,7,6,2>
+ 2650326970U, // <7,6,2,6>: Cost 3 vext2 <5,4,7,6>, <2,6,3,7>
1638470138U, // <7,6,2,7>: Cost 2 vext3 RHS, <6,2,7,3>
1638470147U, // <7,6,2,u>: Cost 2 vext3 RHS, <6,2,u,3>
- 3640934502U, // <7,6,3,0>: Cost 4 vext1 <2,7,6,3>, LHS
- 3296797705U, // <7,6,3,1>: Cost 4 vrev <1,3,6,7>
- 2229028578U, // <7,6,3,2>: Cost 3 vrev <2,3,6,7>
- 3646909179U, // <7,6,3,3>: Cost 4 vext1 <3,7,6,3>, <3,7,6,3>
+ 2650327190U, // <7,6,3,0>: Cost 3 vext2 <5,4,7,6>, <3,0,1,2>
+ 2255172441U, // <7,6,3,1>: Cost 3 vrev <6,7,1,3>
+ 2255246178U, // <7,6,3,2>: Cost 3 vrev <6,7,2,3>
+ 2650327452U, // <7,6,3,3>: Cost 3 vext2 <5,4,7,6>, <3,3,3,3>
2712064562U, // <7,6,3,4>: Cost 3 vext3 RHS, <6,3,4,5>
- 3785806392U, // <7,6,3,5>: Cost 4 vext3 RHS, <6,3,5,2>
+ 2650327627U, // <7,6,3,5>: Cost 3 vext2 <5,4,7,6>, <3,5,4,7>
3713452726U, // <7,6,3,6>: Cost 4 vext2 <3,6,7,6>, <3,6,7,6>
2700563016U, // <7,6,3,7>: Cost 3 vext3 <2,6,3,7>, <6,3,7,0>
2712064593U, // <7,6,3,u>: Cost 3 vext3 RHS, <6,3,u,0>
- 2585116774U, // <7,6,4,0>: Cost 3 vext1 <5,7,6,4>, LHS
+ 2650327954U, // <7,6,4,0>: Cost 3 vext2 <5,4,7,6>, <4,0,5,1>
2735952486U, // <7,6,4,1>: Cost 3 vext3 RHS, <6,4,1,3>
- 2712064620U, // <7,6,4,2>: Cost 3 vext3 RHS, <6,4,2,0>
- 3785806454U, // <7,6,4,3>: Cost 4 vext3 RHS, <6,4,3,1>
+ 2735952497U, // <7,6,4,2>: Cost 3 vext3 RHS, <6,4,2,5>
+ 2255328108U, // <7,6,4,3>: Cost 3 vrev <6,7,3,4>
2712212100U, // <7,6,4,4>: Cost 3 vext3 RHS, <6,4,4,6>
- 2712064653U, // <7,6,4,5>: Cost 3 vext3 RHS, <6,4,5,6>
+ 1576586550U, // <7,6,4,5>: Cost 2 vext2 <5,4,7,6>, RHS
2714055312U, // <7,6,4,6>: Cost 3 vext3 RHS, <6,4,6,0>
2712212126U, // <7,6,4,7>: Cost 3 vext3 RHS, <6,4,7,5>
- 2712064674U, // <7,6,4,u>: Cost 3 vext3 RHS, <6,4,u,0>
+ 1576586793U, // <7,6,4,u>: Cost 2 vext2 <5,4,7,6>, RHS
2579152998U, // <7,6,5,0>: Cost 3 vext1 <4,7,6,5>, LHS
- 3785806519U, // <7,6,5,1>: Cost 4 vext3 RHS, <6,5,1,3>
+ 2650328784U, // <7,6,5,1>: Cost 3 vext2 <5,4,7,6>, <5,1,7,3>
2714055364U, // <7,6,5,2>: Cost 3 vext3 RHS, <6,5,2,7>
- 2236328541U, // <7,6,5,3>: Cost 3 vrev <3,5,6,7>
- 94817590U, // <7,6,5,4>: Cost 1 vrev RHS
- 2555269218U, // <7,6,5,5>: Cost 3 vext1 <0,7,6,5>, <5,6,7,0>
- 2651656296U, // <7,6,5,6>: Cost 3 vext2 <5,6,7,6>, <5,6,7,6>
+ 3785806538U, // <7,6,5,3>: Cost 4 vext3 RHS, <6,5,3,4>
+ 1576587206U, // <7,6,5,4>: Cost 2 vext2 <5,4,7,6>, <5,4,7,6>
+ 2650329092U, // <7,6,5,5>: Cost 3 vext2 <5,4,7,6>, <5,5,5,5>
+ 2650329186U, // <7,6,5,6>: Cost 3 vext2 <5,4,7,6>, <5,6,7,0>
2712064753U, // <7,6,5,7>: Cost 3 vext3 RHS, <6,5,7,7>
- 118708378U, // <7,6,5,u>: Cost 1 vrev RHS
+ 1181963162U, // <7,6,5,u>: Cost 2 vrev <6,7,u,5>
2714055421U, // <7,6,6,0>: Cost 3 vext3 RHS, <6,6,0,1>
2714055432U, // <7,6,6,1>: Cost 3 vext3 RHS, <6,6,1,3>
- 2652983802U, // <7,6,6,2>: Cost 3 vext2 <5,u,7,6>, <6,2,7,3>
- 2236992174U, // <7,6,6,3>: Cost 3 vrev <3,6,6,7>
+ 2650329594U, // <7,6,6,2>: Cost 3 vext2 <5,4,7,6>, <6,2,7,3>
+ 3785806619U, // <7,6,6,3>: Cost 4 vext3 RHS, <6,6,3,4>
2712212260U, // <7,6,6,4>: Cost 3 vext3 RHS, <6,6,4,4>
2714055472U, // <7,6,6,5>: Cost 3 vext3 RHS, <6,6,5,7>
1638323000U, // <7,6,6,6>: Cost 2 vext3 RHS, <6,6,6,6>
1638470466U, // <7,6,6,7>: Cost 2 vext3 RHS, <6,6,7,7>
1638470475U, // <7,6,6,u>: Cost 2 vext3 RHS, <6,6,u,7>
1638323022U, // <7,6,7,0>: Cost 2 vext3 RHS, <6,7,0,1>
- 2712064855U, // <7,6,7,1>: Cost 3 vext3 RHS, <6,7,1,1>
+ 2712064854U, // <7,6,7,1>: Cost 3 vext3 RHS, <6,7,1,0>
2712064865U, // <7,6,7,2>: Cost 3 vext3 RHS, <6,7,2,2>
2712064872U, // <7,6,7,3>: Cost 3 vext3 RHS, <6,7,3,0>
1638323062U, // <7,6,7,4>: Cost 2 vext3 RHS, <6,7,4,5>
- 2712064895U, // <7,6,7,5>: Cost 3 vext3 RHS, <6,7,5,5>
+ 2712064894U, // <7,6,7,5>: Cost 3 vext3 RHS, <6,7,5,4>
2712064905U, // <7,6,7,6>: Cost 3 vext3 RHS, <6,7,6,6>
- 2712064914U, // <7,6,7,7>: Cost 3 vext3 RHS, <6,7,7,6>
+ 2712064915U, // <7,6,7,7>: Cost 3 vext3 RHS, <6,7,7,7>
1638323094U, // <7,6,7,u>: Cost 2 vext3 RHS, <6,7,u,1>
1638470559U, // <7,6,u,0>: Cost 2 vext3 RHS, <6,u,0,1>
- 2712064937U, // <7,6,u,1>: Cost 3 vext3 RHS, <6,u,1,2>
- 2712064944U, // <7,6,u,2>: Cost 3 vext3 RHS, <6,u,2,0>
+ 1576589102U, // <7,6,u,1>: Cost 2 vext2 <5,4,7,6>, LHS
+ 2712212402U, // <7,6,u,2>: Cost 3 vext3 RHS, <6,u,2,2>
2712212409U, // <7,6,u,3>: Cost 3 vext3 RHS, <6,u,3,0>
- 96808489U, // <7,6,u,4>: Cost 1 vrev RHS
- 2712064977U, // <7,6,u,5>: Cost 3 vext3 RHS, <6,u,5,6>
+ 1638470599U, // <7,6,u,4>: Cost 2 vext3 RHS, <6,u,4,5>
+ 1576589466U, // <7,6,u,5>: Cost 2 vext2 <5,4,7,6>, RHS
1638323000U, // <7,6,u,6>: Cost 2 vext3 RHS, <6,6,6,6>
1638470624U, // <7,6,u,7>: Cost 2 vext3 RHS, <6,u,7,3>
- 120699277U, // <7,6,u,u>: Cost 1 vrev RHS
+ 1638470631U, // <7,6,u,u>: Cost 2 vext3 RHS, <6,u,u,1>
2712065007U, // <7,7,0,0>: Cost 3 vext3 RHS, <7,0,0,0>
1638323194U, // <7,7,0,1>: Cost 2 vext3 RHS, <7,0,1,2>
2712065025U, // <7,7,0,2>: Cost 3 vext3 RHS, <7,0,2,0>
@@ -5700,7 +5700,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2591134604U, // <7,7,0,6>: Cost 3 vext1 <6,7,7,0>, <6,7,7,0>
2591134714U, // <7,7,0,7>: Cost 3 vext1 <6,7,7,0>, <7,0,1,2>
1638323257U, // <7,7,0,u>: Cost 2 vext3 RHS, <7,0,u,2>
- 2585165926U, // <7,7,1,0>: Cost 3 vext1 <5,7,7,1>, LHS
+ 2712065091U, // <7,7,1,0>: Cost 3 vext3 RHS, <7,1,0,3>
2712065098U, // <7,7,1,1>: Cost 3 vext3 RHS, <7,1,1,1>
2712065109U, // <7,7,1,2>: Cost 3 vext3 RHS, <7,1,2,3>
2692748384U, // <7,7,1,3>: Cost 3 vext3 <1,3,5,7>, <7,1,3,5>
@@ -5720,13 +5720,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2701890780U, // <7,7,2,u>: Cost 3 vext3 <2,u,3,7>, <7,2,u,3>
2712065251U, // <7,7,3,0>: Cost 3 vext3 RHS, <7,3,0,1>
3766490350U, // <7,7,3,1>: Cost 4 vext3 <1,3,5,7>, <7,3,1,3>
- 2712065269U, // <7,7,3,2>: Cost 3 vext3 RHS, <7,3,2,1>
+ 3774305530U, // <7,7,3,2>: Cost 4 vext3 <2,6,3,7>, <7,3,2,6>
2637728196U, // <7,7,3,3>: Cost 3 vext2 <3,3,7,7>, <3,3,7,7>
2712065291U, // <7,7,3,4>: Cost 3 vext3 RHS, <7,3,4,5>
- 2693928208U, // <7,7,3,5>: Cost 3 vext3 <1,5,3,7>, <7,3,5,1>
- 2700563738U, // <7,7,3,6>: Cost 3 vext3 <2,6,3,7>, <7,3,6,2>
+ 2585186486U, // <7,7,3,5>: Cost 3 vext1 <5,7,7,3>, <5,7,7,3>
+ 2639719095U, // <7,7,3,6>: Cost 3 vext2 <3,6,7,7>, <3,6,7,7>
2640382728U, // <7,7,3,7>: Cost 3 vext2 <3,7,7,7>, <3,7,7,7>
- 2701890860U, // <7,7,3,u>: Cost 3 vext3 <2,u,3,7>, <7,3,u,2>
+ 2641046361U, // <7,7,3,u>: Cost 3 vext2 <3,u,7,7>, <3,u,7,7>
2712212792U, // <7,7,4,0>: Cost 3 vext3 RHS, <7,4,0,5>
3646989312U, // <7,7,4,1>: Cost 4 vext1 <3,7,7,4>, <1,3,5,7>
3785807176U, // <7,7,4,2>: Cost 4 vext3 RHS, <7,4,2,3>
@@ -5738,44 +5738,44 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638323585U, // <7,7,4,u>: Cost 2 vext3 RHS, <7,4,u,6>
2585198694U, // <7,7,5,0>: Cost 3 vext1 <5,7,7,5>, LHS
2712212884U, // <7,7,5,1>: Cost 3 vext3 RHS, <7,5,1,7>
- 3771798936U, // <7,7,5,2>: Cost 4 vext3 <2,2,5,7>, <7,5,2,2>
- 2692748704U, // <7,7,5,3>: Cost 3 vext3 <1,3,5,7>, <7,5,3,1>
- 2585201974U, // <7,7,5,4>: Cost 3 vext1 <5,7,7,5>, RHS
+ 3711471393U, // <7,7,5,2>: Cost 4 vext2 <3,3,7,7>, <5,2,7,3>
+ 2649673590U, // <7,7,5,3>: Cost 3 vext2 <5,3,7,7>, <5,3,7,7>
+ 2712065455U, // <7,7,5,4>: Cost 3 vext3 RHS, <7,5,4,7>
1577259032U, // <7,7,5,5>: Cost 2 vext2 <5,5,7,7>, <5,5,7,7>
2712065473U, // <7,7,5,6>: Cost 3 vext3 RHS, <7,5,6,7>
2712212936U, // <7,7,5,7>: Cost 3 vext3 RHS, <7,5,7,5>
1579249931U, // <7,7,5,u>: Cost 2 vext2 <5,u,7,7>, <5,u,7,7>
2591178854U, // <7,7,6,0>: Cost 3 vext1 <6,7,7,6>, LHS
- 3785807333U, // <7,7,6,1>: Cost 4 vext3 RHS, <7,6,1,7>
+ 2735953374U, // <7,7,6,1>: Cost 3 vext3 RHS, <7,6,1,0>
2712212974U, // <7,7,6,2>: Cost 3 vext3 RHS, <7,6,2,7>
- 3766564337U, // <7,7,6,3>: Cost 4 vext3 <1,3,6,7>, <7,6,3,1>
+ 2655646287U, // <7,7,6,3>: Cost 3 vext2 <6,3,7,7>, <6,3,7,7>
2591182134U, // <7,7,6,4>: Cost 3 vext1 <6,7,7,6>, RHS
- 1638323718U, // <7,7,6,5>: Cost 2 vext3 RHS, <7,6,5,4>
+ 2656973553U, // <7,7,6,5>: Cost 3 vext2 <6,5,7,7>, <6,5,7,7>
1583895362U, // <7,7,6,6>: Cost 2 vext2 <6,6,7,7>, <6,6,7,7>
2712065556U, // <7,7,6,7>: Cost 3 vext3 RHS, <7,6,7,0>
- 1640314401U, // <7,7,6,u>: Cost 2 vext3 RHS, <7,6,u,4>
+ 1585222628U, // <7,7,6,u>: Cost 2 vext2 <6,u,7,7>, <6,u,7,7>
1523417190U, // <7,7,7,0>: Cost 2 vext1 <7,7,7,7>, LHS
- 2597159732U, // <7,7,7,1>: Cost 3 vext1 <7,7,7,7>, <1,1,1,1>
+ 2597159670U, // <7,7,7,1>: Cost 3 vext1 <7,7,7,7>, <1,0,3,2>
2597160552U, // <7,7,7,2>: Cost 3 vext1 <7,7,7,7>, <2,2,2,2>
2597161110U, // <7,7,7,3>: Cost 3 vext1 <7,7,7,7>, <3,0,1,2>
1523420470U, // <7,7,7,4>: Cost 2 vext1 <7,7,7,7>, RHS
2651002296U, // <7,7,7,5>: Cost 3 vext2 <5,5,7,7>, <7,5,5,7>
- 2712065633U, // <7,7,7,6>: Cost 3 vext3 RHS, <7,7,6,5>
+ 2657637906U, // <7,7,7,6>: Cost 3 vext2 <6,6,7,7>, <7,6,6,7>
363253046U, // <7,7,7,7>: Cost 1 vdup3 RHS
363253046U, // <7,7,7,u>: Cost 1 vdup3 RHS
1523417190U, // <7,7,u,0>: Cost 2 vext1 <7,7,7,7>, LHS
1638471298U, // <7,7,u,1>: Cost 2 vext3 RHS, <7,u,1,2>
- 2712213130U, // <7,7,u,2>: Cost 3 vext3 RHS, <7,u,2,1>
- 2692970131U, // <7,7,u,3>: Cost 3 vext3 <1,3,u,7>, <7,u,3,1>
+ 2712213132U, // <7,7,u,2>: Cost 3 vext3 RHS, <7,u,2,3>
+ 2712213138U, // <7,7,u,3>: Cost 3 vext3 RHS, <7,u,3,0>
1523420470U, // <7,7,u,4>: Cost 2 vext1 <7,7,7,7>, RHS
- 1638471336U, // <7,7,u,5>: Cost 2 vext3 RHS, <7,u,5,4>
+ 1638471338U, // <7,7,u,5>: Cost 2 vext3 RHS, <7,u,5,6>
1595840756U, // <7,7,u,6>: Cost 2 vext2 <u,6,7,7>, <u,6,7,7>
363253046U, // <7,7,u,7>: Cost 1 vdup3 RHS
363253046U, // <7,7,u,u>: Cost 1 vdup3 RHS
1638318080U, // <7,u,0,0>: Cost 2 vext3 RHS, <0,0,0,0>
1638323923U, // <7,u,0,1>: Cost 2 vext3 RHS, <u,0,1,2>
1662211804U, // <7,u,0,2>: Cost 2 vext3 RHS, <u,0,2,2>
- 2712065763U, // <7,u,0,3>: Cost 3 vext3 RHS, <u,0,3,0>
+ 1638323941U, // <7,u,0,3>: Cost 2 vext3 RHS, <u,0,3,2>
2712065773U, // <7,u,0,4>: Cost 3 vext3 RHS, <u,0,4,1>
1662359286U, // <7,u,0,5>: Cost 2 vext3 RHS, <u,0,5,1>
1662359296U, // <7,u,0,6>: Cost 2 vext3 RHS, <u,0,6,2>
@@ -5791,11 +5791,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1640462171U, // <7,u,1,7>: Cost 2 vext3 RHS, <u,1,7,3>
564582244U, // <7,u,1,u>: Cost 1 vext3 RHS, LHS
1638318244U, // <7,u,2,0>: Cost 2 vext3 RHS, <0,2,0,2>
- 1638324083U, // <7,u,2,1>: Cost 2 vext3 RHS, <u,2,1,0>
+ 2712065907U, // <7,u,2,1>: Cost 3 vext3 RHS, <u,2,1,0>
1638319720U, // <7,u,2,2>: Cost 2 vext3 RHS, <2,2,2,2>
1638324101U, // <7,u,2,3>: Cost 2 vext3 RHS, <u,2,3,0>
1638318284U, // <7,u,2,4>: Cost 2 vext3 RHS, <0,2,4,6>
- 2712065950U, // <7,u,2,5>: Cost 3 vext3 RHS, <u,2,5,7>
+ 2712065947U, // <7,u,2,5>: Cost 3 vext3 RHS, <u,2,5,4>
2700564387U, // <7,u,2,6>: Cost 3 vext3 <2,6,3,7>, <u,2,6,3>
1640314796U, // <7,u,2,7>: Cost 2 vext3 RHS, <u,2,7,3>
1638324146U, // <7,u,2,u>: Cost 2 vext3 RHS, <u,2,u,0>
@@ -5811,17 +5811,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2712066061U, // <7,u,4,0>: Cost 3 vext3 RHS, <u,4,0,1>
1662212122U, // <7,u,4,1>: Cost 2 vext3 RHS, <u,4,1,5>
1662212132U, // <7,u,4,2>: Cost 2 vext3 RHS, <u,4,2,6>
- 2712066089U, // <7,u,4,3>: Cost 3 vext3 RHS, <u,4,3,2>
+ 2712066092U, // <7,u,4,3>: Cost 3 vext3 RHS, <u,4,3,5>
1638321360U, // <7,u,4,4>: Cost 2 vext3 RHS, <4,4,4,4>
1638324287U, // <7,u,4,5>: Cost 2 vext3 RHS, <u,4,5,6>
1662359624U, // <7,u,4,6>: Cost 2 vext3 RHS, <u,4,6,6>
- 2987183432U, // <7,u,4,7>: Cost 3 vzipr <5,6,7,4>, RHS
+ 1640314961U, // <7,u,4,7>: Cost 2 vext3 RHS, <u,4,7,6>
1638324314U, // <7,u,4,u>: Cost 2 vext3 RHS, <u,4,u,6>
1517502566U, // <7,u,5,0>: Cost 2 vext1 <6,7,u,5>, LHS
1574612693U, // <7,u,5,1>: Cost 2 vext2 <5,1,7,u>, <5,1,7,u>
2712066162U, // <7,u,5,2>: Cost 3 vext3 RHS, <u,5,2,3>
1638324351U, // <7,u,5,3>: Cost 2 vext3 RHS, <u,5,3,7>
- 94965064U, // <7,u,5,4>: Cost 1 vrev RHS
+ 1576603592U, // <7,u,5,4>: Cost 2 vext2 <5,4,7,u>, <5,4,7,u>
1577267225U, // <7,u,5,5>: Cost 2 vext2 <5,5,7,u>, <5,5,7,u>
564582554U, // <7,u,5,6>: Cost 1 vext3 RHS, RHS
1640462499U, // <7,u,5,7>: Cost 2 vext3 RHS, <u,5,7,7>
@@ -5831,7 +5831,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1581249023U, // <7,u,6,2>: Cost 2 vext2 <6,2,7,u>, <6,2,7,u>
1638324432U, // <7,u,6,3>: Cost 2 vext3 RHS, <u,6,3,7>
1638468980U, // <7,u,6,4>: Cost 2 vext3 RHS, <4,6,4,6>
- 1638471903U, // <7,u,6,5>: Cost 2 vext3 RHS, <u,6,5,4>
+ 2712066274U, // <7,u,6,5>: Cost 3 vext3 RHS, <u,6,5,7>
1583903555U, // <7,u,6,6>: Cost 2 vext2 <6,6,7,u>, <6,6,7,u>
1640315117U, // <7,u,6,7>: Cost 2 vext3 RHS, <u,6,7,0>
1638324477U, // <7,u,6,u>: Cost 2 vext3 RHS, <u,6,u,7>
@@ -5845,10 +5845,10 @@ static const unsigned PerfectShuffleTable[6561+1] = {
363253046U, // <7,u,7,7>: Cost 1 vdup3 RHS
363253046U, // <7,u,7,u>: Cost 1 vdup3 RHS
1638324561U, // <7,u,u,0>: Cost 2 vext3 RHS, <u,u,0,1>
- 1638324569U, // <7,u,u,1>: Cost 2 vext3 RHS, <u,u,1,0>
+ 1638324571U, // <7,u,u,1>: Cost 2 vext3 RHS, <u,u,1,2>
564582757U, // <7,u,u,2>: Cost 1 vext3 RHS, LHS
1638324587U, // <7,u,u,3>: Cost 2 vext3 RHS, <u,u,3,0>
- 96955963U, // <7,u,u,4>: Cost 1 vrev RHS
+ 1638324601U, // <7,u,u,4>: Cost 2 vext3 RHS, <u,u,4,5>
1638324611U, // <7,u,u,5>: Cost 2 vext3 RHS, <u,u,5,6>
564582797U, // <7,u,u,6>: Cost 1 vext3 RHS, RHS
363253046U, // <7,u,u,7>: Cost 1 vdup3 RHS
@@ -5856,11 +5856,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
135053414U, // <u,0,0,0>: Cost 1 vdup0 LHS
1611489290U, // <u,0,0,1>: Cost 2 vext3 LHS, <0,0,1,1>
1611489300U, // <u,0,0,2>: Cost 2 vext3 LHS, <0,0,2,2>
- 2232576147U, // <u,0,0,3>: Cost 3 vrev <3,0,0,u>
+ 2568054923U, // <u,0,0,3>: Cost 3 vext1 <3,0,0,0>, <3,0,0,0>
1481706806U, // <u,0,0,4>: Cost 2 vext1 <0,u,0,0>, RHS
2555449040U, // <u,0,0,5>: Cost 3 vext1 <0,u,0,0>, <5,1,7,3>
2591282078U, // <u,0,0,6>: Cost 3 vext1 <6,u,0,0>, <6,u,0,0>
- 2256466935U, // <u,0,0,7>: Cost 3 vrev <7,0,0,u>
+ 2591945711U, // <u,0,0,7>: Cost 3 vext1 <7,0,0,0>, <7,0,0,0>
135053414U, // <u,0,0,u>: Cost 1 vdup0 LHS
1493655654U, // <u,0,1,0>: Cost 2 vext1 <2,u,0,1>, LHS
1860550758U, // <u,0,1,1>: Cost 2 vzipl LHS, LHS
@@ -5882,28 +5882,28 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1611489516U, // <u,0,2,u>: Cost 2 vext3 LHS, <0,2,u,2>
2954067968U, // <u,0,3,0>: Cost 3 vzipr LHS, <0,0,0,0>
2685231356U, // <u,0,3,1>: Cost 3 vext3 LHS, <0,3,1,0>
- 1154852525U, // <u,0,3,2>: Cost 2 vrev <2,3,0,u>
+ 72589981U, // <u,0,3,2>: Cost 1 vrev LHS
2625137052U, // <u,0,3,3>: Cost 3 vext2 <1,2,u,0>, <3,3,3,3>
2625137154U, // <u,0,3,4>: Cost 3 vext2 <1,2,u,0>, <3,4,5,6>
2639071848U, // <u,0,3,5>: Cost 3 vext2 <3,5,u,0>, <3,5,u,0>
- 2586661226U, // <u,0,3,6>: Cost 3 vext1 <6,1,0,3>, <6,1,0,3>
- 2258457834U, // <u,0,3,7>: Cost 3 vrev <7,3,0,u>
- 1567320923U, // <u,0,3,u>: Cost 2 vext2 <3,u,u,0>, <3,u,u,0>
+ 2639735481U, // <u,0,3,6>: Cost 3 vext2 <3,6,u,0>, <3,6,u,0>
+ 2597279354U, // <u,0,3,7>: Cost 3 vext1 <7,u,0,3>, <7,u,0,3>
+ 73032403U, // <u,0,3,u>: Cost 1 vrev LHS
2687074636U, // <u,0,4,0>: Cost 3 vext3 <0,4,0,u>, <0,4,0,u>
1611489618U, // <u,0,4,1>: Cost 2 vext3 LHS, <0,4,1,5>
1611489628U, // <u,0,4,2>: Cost 2 vext3 LHS, <0,4,2,6>
- 2235230679U, // <u,0,4,3>: Cost 3 vrev <3,4,0,u>
+ 3629222038U, // <u,0,4,3>: Cost 4 vext1 <0,u,0,4>, <3,0,1,2>
2555481398U, // <u,0,4,4>: Cost 3 vext1 <0,u,0,4>, RHS
1551396150U, // <u,0,4,5>: Cost 2 vext2 <1,2,u,0>, RHS
2651680116U, // <u,0,4,6>: Cost 3 vext2 <5,6,u,0>, <4,6,4,6>
- 2259121467U, // <u,0,4,7>: Cost 3 vrev <7,4,0,u>
+ 2646150600U, // <u,0,4,7>: Cost 3 vext2 <4,7,5,0>, <4,7,5,0>
1611932050U, // <u,0,4,u>: Cost 2 vext3 LHS, <0,4,u,6>
- 2573402214U, // <u,0,5,0>: Cost 3 vext1 <3,u,0,5>, LHS
+ 2561458278U, // <u,0,5,0>: Cost 3 vext1 <1,u,0,5>, LHS
1863532646U, // <u,0,5,1>: Cost 2 vzipl RHS, LHS
2712068526U, // <u,0,5,2>: Cost 3 vext3 RHS, <0,5,2,7>
- 2573404310U, // <u,0,5,3>: Cost 3 vext1 <3,u,0,5>, <3,0,1,2>
- 2573405494U, // <u,0,5,4>: Cost 3 vext1 <3,u,0,5>, RHS
- 2247839706U, // <u,0,5,5>: Cost 3 vrev <5,5,0,u>
+ 2649689976U, // <u,0,5,3>: Cost 3 vext2 <5,3,u,0>, <5,3,u,0>
+ 2220237489U, // <u,0,5,4>: Cost 3 vrev <0,u,4,5>
+ 2651680772U, // <u,0,5,5>: Cost 3 vext2 <5,6,u,0>, <5,5,5,5>
1577939051U, // <u,0,5,6>: Cost 2 vext2 <5,6,u,0>, <5,6,u,0>
2830077238U, // <u,0,5,7>: Cost 3 vuzpr <1,u,3,0>, RHS
1579266317U, // <u,0,5,u>: Cost 2 vext2 <5,u,u,0>, <5,u,u,0>
@@ -5912,37 +5912,37 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1997750374U, // <u,0,6,2>: Cost 2 vtrnl RHS, LHS
2655662673U, // <u,0,6,3>: Cost 3 vext2 <6,3,u,0>, <6,3,u,0>
2555497782U, // <u,0,6,4>: Cost 3 vext1 <0,u,0,6>, RHS
- 2248503339U, // <u,0,6,5>: Cost 3 vrev <5,6,0,u>
+ 2651681459U, // <u,0,6,5>: Cost 3 vext2 <5,6,u,0>, <6,5,0,u>
2651681592U, // <u,0,6,6>: Cost 3 vext2 <5,6,u,0>, <6,6,6,6>
2651681614U, // <u,0,6,7>: Cost 3 vext2 <5,6,u,0>, <6,7,0,1>
1997750428U, // <u,0,6,u>: Cost 2 vtrnl RHS, LHS
2567446630U, // <u,0,7,0>: Cost 3 vext1 <2,u,0,7>, LHS
2567447446U, // <u,0,7,1>: Cost 3 vext1 <2,u,0,7>, <1,2,3,0>
2567448641U, // <u,0,7,2>: Cost 3 vext1 <2,u,0,7>, <2,u,0,7>
- 2237221578U, // <u,0,7,3>: Cost 3 vrev <3,7,0,u>
+ 2573421338U, // <u,0,7,3>: Cost 3 vext1 <3,u,0,7>, <3,u,0,7>
2567449910U, // <u,0,7,4>: Cost 3 vext1 <2,u,0,7>, RHS
2651682242U, // <u,0,7,5>: Cost 3 vext2 <5,6,u,0>, <7,5,6,u>
- 1181397845U, // <u,0,7,6>: Cost 2 vrev <6,7,0,u>
+ 2591339429U, // <u,0,7,6>: Cost 3 vext1 <6,u,0,7>, <6,u,0,7>
2651682412U, // <u,0,7,7>: Cost 3 vext2 <5,6,u,0>, <7,7,7,7>
- 1193343239U, // <u,0,7,u>: Cost 2 vrev <u,7,0,u>
+ 2567452462U, // <u,0,7,u>: Cost 3 vext1 <2,u,0,7>, LHS
135053414U, // <u,0,u,0>: Cost 1 vdup0 LHS
1611489938U, // <u,0,u,1>: Cost 2 vext3 LHS, <0,u,1,1>
537748125U, // <u,0,u,2>: Cost 1 vext3 LHS, LHS
2685674148U, // <u,0,u,3>: Cost 3 vext3 LHS, <0,u,3,1>
1611932338U, // <u,0,u,4>: Cost 2 vext3 LHS, <0,u,4,6>
1551399066U, // <u,0,u,5>: Cost 2 vext2 <1,2,u,0>, RHS
- 1182061478U, // <u,0,u,6>: Cost 2 vrev <6,u,0,u>
+ 1517605798U, // <u,0,u,6>: Cost 2 vext1 <6,u,0,u>, <6,u,0,u>
2830077481U, // <u,0,u,7>: Cost 3 vuzpr <1,u,3,0>, RHS
537748179U, // <u,0,u,u>: Cost 1 vext3 LHS, LHS
- 1499693158U, // <u,1,0,0>: Cost 2 vext1 <3,u,1,0>, LHS
+ 1544101961U, // <u,1,0,0>: Cost 2 vext2 <0,0,u,1>, <0,0,u,1>
1558036582U, // <u,1,0,1>: Cost 2 vext2 <2,3,u,1>, LHS
2619171051U, // <u,1,0,2>: Cost 3 vext2 <0,2,u,1>, <0,2,u,1>
- 1158908060U, // <u,1,0,3>: Cost 2 vrev <3,0,1,u>
- 1499696438U, // <u,1,0,4>: Cost 2 vext1 <3,u,1,0>, RHS
- 2712068872U, // <u,1,0,5>: Cost 3 vext3 RHS, <1,0,5,2>
- 2250567975U, // <u,1,0,6>: Cost 3 vrev <6,0,1,u>
- 1182798848U, // <u,1,0,7>: Cost 2 vrev <7,0,1,u>
- 1558037149U, // <u,1,0,u>: Cost 2 vext2 <2,3,u,1>, LHS
+ 1611490038U, // <u,1,0,3>: Cost 2 vext3 LHS, <1,0,3,2>
+ 2555522358U, // <u,1,0,4>: Cost 3 vext1 <0,u,1,0>, RHS
+ 2712068871U, // <u,1,0,5>: Cost 3 vext3 RHS, <1,0,5,1>
+ 2591355815U, // <u,1,0,6>: Cost 3 vext1 <6,u,1,0>, <6,u,1,0>
+ 2597328512U, // <u,1,0,7>: Cost 3 vext1 <7,u,1,0>, <7,u,1,0>
+ 1611490083U, // <u,1,0,u>: Cost 2 vext3 LHS, <1,0,u,2>
1481785446U, // <u,1,1,0>: Cost 2 vext1 <0,u,1,1>, LHS
202162278U, // <u,1,1,1>: Cost 1 vdup1 LHS
2555528808U, // <u,1,1,2>: Cost 3 vext1 <0,u,1,1>, <2,2,2,2>
@@ -5950,7 +5950,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1481788726U, // <u,1,1,4>: Cost 2 vext1 <0,u,1,1>, RHS
2689876828U, // <u,1,1,5>: Cost 3 vext3 LHS, <1,1,5,5>
2591364008U, // <u,1,1,6>: Cost 3 vext1 <6,u,1,1>, <6,u,1,1>
- 2257204305U, // <u,1,1,7>: Cost 3 vrev <7,1,1,u>
+ 2592691274U, // <u,1,1,7>: Cost 3 vext1 <7,1,1,1>, <7,1,1,1>
202162278U, // <u,1,1,u>: Cost 1 vdup1 LHS
1499709542U, // <u,1,2,0>: Cost 2 vext1 <3,u,1,2>, LHS
2689876871U, // <u,1,2,1>: Cost 3 vext3 LHS, <1,2,1,3>
@@ -5973,18 +5973,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1567992749U, // <u,1,4,0>: Cost 2 vext2 <4,0,u,1>, <4,0,u,1>
2693121070U, // <u,1,4,1>: Cost 3 vext3 <1,4,1,u>, <1,4,1,u>
2693194807U, // <u,1,4,2>: Cost 3 vext3 <1,4,2,u>, <1,4,2,u>
- 2685232189U, // <u,1,4,3>: Cost 3 vext3 LHS, <1,4,3,5>
+ 1152386432U, // <u,1,4,3>: Cost 2 vrev <1,u,3,4>
2555555126U, // <u,1,4,4>: Cost 3 vext1 <0,u,1,4>, RHS
1558039862U, // <u,1,4,5>: Cost 2 vext2 <2,3,u,1>, RHS
2645716371U, // <u,1,4,6>: Cost 3 vext2 <4,6,u,1>, <4,6,u,1>
2597361284U, // <u,1,4,7>: Cost 3 vext1 <7,u,1,4>, <7,u,1,4>
- 1558040105U, // <u,1,4,u>: Cost 2 vext2 <2,3,u,1>, RHS
+ 1152755117U, // <u,1,4,u>: Cost 2 vrev <1,u,u,4>
1481818214U, // <u,1,5,0>: Cost 2 vext1 <0,u,1,5>, LHS
- 2555560756U, // <u,1,5,1>: Cost 3 vext1 <0,u,1,5>, <1,1,1,1>
+ 2555560694U, // <u,1,5,1>: Cost 3 vext1 <0,u,1,5>, <1,0,3,2>
2555561576U, // <u,1,5,2>: Cost 3 vext1 <0,u,1,5>, <2,2,2,2>
1611490448U, // <u,1,5,3>: Cost 2 vext3 LHS, <1,5,3,7>
1481821494U, // <u,1,5,4>: Cost 2 vext1 <0,u,1,5>, RHS
- 2555563734U, // <u,1,5,5>: Cost 3 vext1 <0,u,1,5>, <5,1,u,0>
+ 2651025435U, // <u,1,5,5>: Cost 3 vext2 <5,5,u,1>, <5,5,u,1>
2651689068U, // <u,1,5,6>: Cost 3 vext2 <5,6,u,1>, <5,6,u,1>
2823966006U, // <u,1,5,7>: Cost 3 vuzpr <0,u,1,1>, RHS
1611932861U, // <u,1,5,u>: Cost 2 vext3 LHS, <1,5,u,7>
@@ -6002,8 +6002,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2573493926U, // <u,1,7,2>: Cost 3 vext1 <3,u,1,7>, <2,3,0,1>
2042962022U, // <u,1,7,3>: Cost 2 vtrnr RHS, LHS
2561551670U, // <u,1,7,4>: Cost 3 vext1 <1,u,1,7>, RHS
- 2980643154U, // <u,1,7,5>: Cost 3 vzipr RHS, <0,4,1,5>
- 2255213406U, // <u,1,7,6>: Cost 3 vrev <6,7,1,u>
+ 2226300309U, // <u,1,7,5>: Cost 3 vrev <1,u,5,7>
+ 2658325990U, // <u,1,7,6>: Cost 3 vext2 <6,7,u,1>, <7,6,1,u>
2658326124U, // <u,1,7,7>: Cost 3 vext2 <6,7,u,1>, <7,7,7,7>
2042962027U, // <u,1,7,u>: Cost 2 vtrnr RHS, LHS
1481842790U, // <u,1,u,0>: Cost 2 vext1 <0,u,1,u>, LHS
@@ -6013,37 +6013,37 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1481846070U, // <u,1,u,4>: Cost 2 vext1 <0,u,1,u>, RHS
1611933077U, // <u,1,u,5>: Cost 2 vext3 LHS, <1,u,5,7>
2685674910U, // <u,1,u,6>: Cost 3 vext3 LHS, <1,u,6,7>
- 1188107912U, // <u,1,u,7>: Cost 2 vrev <7,u,1,u>
+ 1523652232U, // <u,1,u,7>: Cost 2 vext1 <7,u,1,u>, <7,u,1,u>
835584U, // <u,1,u,u>: Cost 0 copy LHS
1544110154U, // <u,2,0,0>: Cost 2 vext2 <0,0,u,2>, <0,0,u,2>
1545437286U, // <u,2,0,1>: Cost 2 vext2 <0,2,u,2>, LHS
1545437420U, // <u,2,0,2>: Cost 2 vext2 <0,2,u,2>, <0,2,u,2>
2685232589U, // <u,2,0,3>: Cost 3 vext3 LHS, <2,0,3,0>
2619179346U, // <u,2,0,4>: Cost 3 vext2 <0,2,u,2>, <0,4,1,5>
- 2696734183U, // <u,2,0,5>: Cost 3 vext3 <2,0,5,u>, <2,0,5,u>
- 2712069609U, // <u,2,0,6>: Cost 3 vext3 RHS, <2,0,6,1>
- 2256614409U, // <u,2,0,7>: Cost 3 vrev <7,0,2,u>
+ 2712069606U, // <u,2,0,5>: Cost 3 vext3 RHS, <2,0,5,7>
+ 2689877484U, // <u,2,0,6>: Cost 3 vext3 LHS, <2,0,6,4>
+ 2659656273U, // <u,2,0,7>: Cost 3 vext2 <7,0,u,2>, <0,7,2,u>
1545437853U, // <u,2,0,u>: Cost 2 vext2 <0,2,u,2>, LHS
- 67985515U, // <u,2,1,0>: Cost 1 vrev LHS
+ 1550082851U, // <u,2,1,0>: Cost 2 vext2 <1,0,u,2>, <1,0,u,2>
2619179828U, // <u,2,1,1>: Cost 3 vext2 <0,2,u,2>, <1,1,1,1>
2619179926U, // <u,2,1,2>: Cost 3 vext2 <0,2,u,2>, <1,2,3,0>
- 2685232670U, // <u,2,1,3>: Cost 3 vext3 LHS, <2,1,3,0>
+ 2685232671U, // <u,2,1,3>: Cost 3 vext3 LHS, <2,1,3,1>
2555604278U, // <u,2,1,4>: Cost 3 vext1 <0,u,2,1>, RHS
2619180176U, // <u,2,1,5>: Cost 3 vext2 <0,2,u,2>, <1,5,3,7>
2689877564U, // <u,2,1,6>: Cost 3 vext3 LHS, <2,1,6,3>
- 2257278042U, // <u,2,1,7>: Cost 3 vrev <7,1,2,u>
- 115767091U, // <u,2,1,u>: Cost 1 vrev LHS
+ 2602718850U, // <u,2,1,7>: Cost 3 vext1 <u,7,2,1>, <7,u,1,2>
+ 1158703235U, // <u,2,1,u>: Cost 2 vrev <2,u,u,1>
1481867366U, // <u,2,2,0>: Cost 2 vext1 <0,u,2,2>, LHS
- 2555609908U, // <u,2,2,1>: Cost 3 vext1 <0,u,2,2>, <1,1,1,1>
+ 2555609846U, // <u,2,2,1>: Cost 3 vext1 <0,u,2,2>, <1,0,3,2>
269271142U, // <u,2,2,2>: Cost 1 vdup2 LHS
1611490930U, // <u,2,2,3>: Cost 2 vext3 LHS, <2,2,3,3>
1481870646U, // <u,2,2,4>: Cost 2 vext1 <0,u,2,2>, RHS
2689877640U, // <u,2,2,5>: Cost 3 vext3 LHS, <2,2,5,7>
2619180986U, // <u,2,2,6>: Cost 3 vext2 <0,2,u,2>, <2,6,3,7>
- 2257941675U, // <u,2,2,7>: Cost 3 vrev <7,2,2,u>
+ 2593436837U, // <u,2,2,7>: Cost 3 vext1 <7,2,2,2>, <7,2,2,2>
269271142U, // <u,2,2,u>: Cost 1 vdup2 LHS
408134301U, // <u,2,3,0>: Cost 1 vext1 LHS, LHS
- 1481876276U, // <u,2,3,1>: Cost 2 vext1 LHS, <1,1,1,1>
+ 1481876214U, // <u,2,3,1>: Cost 2 vext1 LHS, <1,0,3,2>
1481877096U, // <u,2,3,2>: Cost 2 vext1 LHS, <2,2,2,2>
1880326246U, // <u,2,3,3>: Cost 2 vzipr LHS, LHS
408137014U, // <u,2,3,4>: Cost 1 vext1 LHS, RHS
@@ -6058,19 +6058,19 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2555628854U, // <u,2,4,4>: Cost 3 vext1 <0,u,2,4>, RHS
1545440566U, // <u,2,4,5>: Cost 2 vext2 <0,2,u,2>, RHS
1571982740U, // <u,2,4,6>: Cost 2 vext2 <4,6,u,2>, <4,6,u,2>
- 2659659225U, // <u,2,4,7>: Cost 3 vext2 <7,0,u,2>, <4,7,6,u>
+ 2592125957U, // <u,2,4,7>: Cost 3 vext1 <7,0,2,4>, <7,0,2,4>
1545440809U, // <u,2,4,u>: Cost 2 vext2 <0,2,u,2>, RHS
2555633766U, // <u,2,5,0>: Cost 3 vext1 <0,u,2,5>, LHS
2561606550U, // <u,2,5,1>: Cost 3 vext1 <1,u,2,5>, <1,2,3,0>
2689877856U, // <u,2,5,2>: Cost 3 vext3 LHS, <2,5,2,7>
2685233000U, // <u,2,5,3>: Cost 3 vext3 LHS, <2,5,3,6>
- 2555637046U, // <u,2,5,4>: Cost 3 vext1 <0,u,2,5>, RHS
+ 1158441059U, // <u,2,5,4>: Cost 2 vrev <2,u,4,5>
2645725188U, // <u,2,5,5>: Cost 3 vext2 <4,6,u,2>, <5,5,5,5>
2689877892U, // <u,2,5,6>: Cost 3 vext3 LHS, <2,5,6,7>
2823900470U, // <u,2,5,7>: Cost 3 vuzpr <0,u,0,2>, RHS
- 2685675413U, // <u,2,5,u>: Cost 3 vext3 LHS, <2,5,u,6>
+ 1158736007U, // <u,2,5,u>: Cost 2 vrev <2,u,u,5>
1481900134U, // <u,2,6,0>: Cost 2 vext1 <0,u,2,6>, LHS
- 2555642676U, // <u,2,6,1>: Cost 3 vext1 <0,u,2,6>, <1,1,1,1>
+ 2555642614U, // <u,2,6,1>: Cost 3 vext1 <0,u,2,6>, <1,0,3,2>
2555643496U, // <u,2,6,2>: Cost 3 vext1 <0,u,2,6>, <2,2,2,2>
1611491258U, // <u,2,6,3>: Cost 2 vext3 LHS, <2,6,3,7>
1481903414U, // <u,2,6,4>: Cost 2 vext1 <0,u,2,6>, RHS
@@ -6079,7 +6079,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2645726030U, // <u,2,6,7>: Cost 3 vext2 <4,6,u,2>, <6,7,0,1>
1611933671U, // <u,2,6,u>: Cost 2 vext3 LHS, <2,6,u,7>
1585919033U, // <u,2,7,0>: Cost 2 vext2 <7,0,u,2>, <7,0,u,2>
- 2800079866U, // <u,2,7,1>: Cost 3 vuzpl LHS, <7,0,1,2>
+ 2573566710U, // <u,2,7,1>: Cost 3 vext1 <3,u,2,7>, <1,0,3,2>
2567596115U, // <u,2,7,2>: Cost 3 vext1 <2,u,2,7>, <2,u,2,7>
1906901094U, // <u,2,7,3>: Cost 2 vzipr RHS, LHS
2555653430U, // <u,2,7,4>: Cost 3 vext1 <0,u,2,7>, RHS
@@ -6087,7 +6087,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2980643164U, // <u,2,7,6>: Cost 3 vzipr RHS, <0,4,2,6>
2645726828U, // <u,2,7,7>: Cost 3 vext2 <4,6,u,2>, <7,7,7,7>
1906901099U, // <u,2,7,u>: Cost 2 vzipr RHS, LHS
- 72630946U, // <u,2,u,0>: Cost 1 vrev LHS
+ 408175266U, // <u,2,u,0>: Cost 1 vext1 LHS, LHS
1545443118U, // <u,2,u,1>: Cost 2 vext2 <0,2,u,2>, LHS
269271142U, // <u,2,u,2>: Cost 1 vdup2 LHS
1611491416U, // <u,2,u,3>: Cost 2 vext3 LHS, <2,u,3,3>
@@ -6101,11 +6101,11 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1544781988U, // <u,3,0,2>: Cost 2 vext2 LHS, <0,2,0,2>
2618523900U, // <u,3,0,3>: Cost 3 vext2 LHS, <0,3,1,0>
1544782162U, // <u,3,0,4>: Cost 2 vext2 LHS, <0,4,1,5>
- 2712070330U, // <u,3,0,5>: Cost 3 vext3 RHS, <3,0,5,2>
+ 2238188352U, // <u,3,0,5>: Cost 3 vrev <3,u,5,0>
2623169023U, // <u,3,0,6>: Cost 3 vext2 LHS, <0,6,2,7>
- 2597475986U, // <u,3,0,7>: Cost 3 vext1 <7,u,3,0>, <7,u,3,0>
+ 2238335826U, // <u,3,0,7>: Cost 3 vrev <3,u,7,0>
471040669U, // <u,3,0,u>: Cost 1 vext2 LHS, LHS
- 2618524404U, // <u,3,1,0>: Cost 3 vext2 LHS, <1,0,3,0>
+ 1544782582U, // <u,3,1,0>: Cost 2 vext2 LHS, <1,0,3,2>
1544782644U, // <u,3,1,1>: Cost 2 vext2 LHS, <1,1,1,1>
1544782742U, // <u,3,1,2>: Cost 2 vext2 LHS, <1,2,3,0>
1544782808U, // <u,3,1,3>: Cost 2 vext2 LHS, <1,3,1,3>
@@ -6114,22 +6114,22 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2618524897U, // <u,3,1,6>: Cost 3 vext2 LHS, <1,6,3,7>
2703517987U, // <u,3,1,7>: Cost 3 vext3 <3,1,7,u>, <3,1,7,u>
1544783213U, // <u,3,1,u>: Cost 2 vext2 LHS, <1,u,1,3>
- 2618525133U, // <u,3,2,0>: Cost 3 vext2 LHS, <2,0,3,0>
- 1611491638U, // <u,3,2,1>: Cost 2 vext3 LHS, <3,2,1,0>
+ 1529716838U, // <u,3,2,0>: Cost 2 vext1 <u,u,3,2>, LHS
+ 1164167966U, // <u,3,2,1>: Cost 2 vrev <3,u,1,2>
1544783464U, // <u,3,2,2>: Cost 2 vext2 LHS, <2,2,2,2>
1544783526U, // <u,3,2,3>: Cost 2 vext2 LHS, <2,3,0,1>
- 2618525462U, // <u,3,2,4>: Cost 3 vext2 LHS, <2,4,3,5>
+ 1529720118U, // <u,3,2,4>: Cost 2 vext1 <u,u,3,2>, RHS
2618525544U, // <u,3,2,5>: Cost 3 vext2 LHS, <2,5,3,6>
1544783802U, // <u,3,2,6>: Cost 2 vext2 LHS, <2,6,3,7>
2704181620U, // <u,3,2,7>: Cost 3 vext3 <3,2,7,u>, <3,2,7,u>
1544783931U, // <u,3,2,u>: Cost 2 vext2 LHS, <2,u,0,1>
1544784022U, // <u,3,3,0>: Cost 2 vext2 LHS, <3,0,1,2>
1487922559U, // <u,3,3,1>: Cost 2 vext1 <1,u,3,3>, <1,u,3,3>
- 1544784182U, // <u,3,3,2>: Cost 2 vext2 LHS, <3,2,1,0>
+ 1493895256U, // <u,3,3,2>: Cost 2 vext1 <2,u,3,3>, <2,u,3,3>
336380006U, // <u,3,3,3>: Cost 1 vdup3 LHS
1544784386U, // <u,3,3,4>: Cost 2 vext2 LHS, <3,4,5,6>
2824054478U, // <u,3,3,5>: Cost 3 vuzpr LHS, <2,3,4,5>
- 2591527868U, // <u,3,3,6>: Cost 3 vext1 <6,u,3,3>, <6,u,3,3>
+ 2238286668U, // <u,3,3,6>: Cost 3 vrev <3,u,6,3>
2954069136U, // <u,3,3,7>: Cost 3 vzipr LHS, <1,5,3,7>
336380006U, // <u,3,3,u>: Cost 1 vdup3 LHS
1487929446U, // <u,3,4,0>: Cost 2 vext1 <1,u,3,4>, LHS
@@ -6139,13 +6139,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1487932726U, // <u,3,4,4>: Cost 2 vext1 <1,u,3,4>, RHS
471043382U, // <u,3,4,5>: Cost 1 vext2 LHS, RHS
1592561012U, // <u,3,4,6>: Cost 2 vext2 LHS, <4,6,4,6>
- 2597508758U, // <u,3,4,7>: Cost 3 vext1 <7,u,3,4>, <7,u,3,4>
+ 2238368598U, // <u,3,4,7>: Cost 3 vrev <3,u,7,4>
471043625U, // <u,3,4,u>: Cost 1 vext2 LHS, RHS
2555707494U, // <u,3,5,0>: Cost 3 vext1 <0,u,3,5>, LHS
1574645465U, // <u,3,5,1>: Cost 2 vext2 <5,1,u,3>, <5,1,u,3>
2567653106U, // <u,3,5,2>: Cost 3 vext1 <2,u,3,5>, <2,3,u,5>
2555709954U, // <u,3,5,3>: Cost 3 vext1 <0,u,3,5>, <3,4,5,6>
- 2555710774U, // <u,3,5,4>: Cost 3 vext1 <0,u,3,5>, RHS
+ 1592561606U, // <u,3,5,4>: Cost 2 vext2 LHS, <5,4,7,6>
1592561668U, // <u,3,5,5>: Cost 2 vext2 LHS, <5,5,5,5>
1592561762U, // <u,3,5,6>: Cost 2 vext2 LHS, <5,6,7,0>
1750314294U, // <u,3,5,7>: Cost 2 vuzpr LHS, RHS
@@ -6154,23 +6154,23 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2561688962U, // <u,3,6,1>: Cost 3 vext1 <1,u,3,6>, <1,u,3,6>
1581281795U, // <u,3,6,2>: Cost 2 vext2 <6,2,u,3>, <6,2,u,3>
2706541204U, // <u,3,6,3>: Cost 3 vext3 <3,6,3,u>, <3,6,3,u>
- 2623173228U, // <u,3,6,4>: Cost 3 vext2 LHS, <6,4,2,0>
- 2248724550U, // <u,3,6,5>: Cost 3 vrev <5,6,3,u>
+ 2623173261U, // <u,3,6,4>: Cost 3 vext2 LHS, <6,4,5,6>
+ 1164495686U, // <u,3,6,5>: Cost 2 vrev <3,u,5,6>
1592562488U, // <u,3,6,6>: Cost 2 vext2 LHS, <6,6,6,6>
1592562510U, // <u,3,6,7>: Cost 2 vext2 LHS, <6,7,0,1>
- 1592562591U, // <u,3,6,u>: Cost 2 vext2 LHS, <6,u,0,1>
+ 1164716897U, // <u,3,6,u>: Cost 2 vrev <3,u,u,6>
1487954022U, // <u,3,7,0>: Cost 2 vext1 <1,u,3,7>, LHS
1487955331U, // <u,3,7,1>: Cost 2 vext1 <1,u,3,7>, <1,u,3,7>
1493928028U, // <u,3,7,2>: Cost 2 vext1 <2,u,3,7>, <2,u,3,7>
2561697942U, // <u,3,7,3>: Cost 3 vext1 <1,u,3,7>, <3,0,1,2>
1487957302U, // <u,3,7,4>: Cost 2 vext1 <1,u,3,7>, RHS
2707352311U, // <u,3,7,5>: Cost 3 vext3 <3,7,5,u>, <3,7,5,u>
- 1592563206U, // <u,3,7,6>: Cost 2 vext2 LHS, <7,6,5,4>
+ 2655024623U, // <u,3,7,6>: Cost 3 vext2 <6,2,u,3>, <7,6,2,u>
1592563308U, // <u,3,7,7>: Cost 2 vext2 LHS, <7,7,7,7>
1487959854U, // <u,3,7,u>: Cost 2 vext1 <1,u,3,7>, LHS
1544787667U, // <u,3,u,0>: Cost 2 vext2 LHS, <u,0,1,2>
471045934U, // <u,3,u,1>: Cost 1 vext2 LHS, LHS
- 1544787827U, // <u,3,u,2>: Cost 2 vext2 LHS, <u,2,1,0>
+ 1549432709U, // <u,3,u,2>: Cost 2 vext2 LHS, <u,2,3,0>
336380006U, // <u,3,u,3>: Cost 1 vdup3 LHS
1544788031U, // <u,3,u,4>: Cost 2 vext2 LHS, <u,4,5,6>
471046298U, // <u,3,u,5>: Cost 1 vext2 LHS, RHS
@@ -6180,14 +6180,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2625167360U, // <u,4,0,0>: Cost 3 vext2 <1,2,u,4>, <0,0,0,0>
1551425638U, // <u,4,0,1>: Cost 2 vext2 <1,2,u,4>, LHS
2619195630U, // <u,4,0,2>: Cost 3 vext2 <0,2,u,4>, <0,2,u,4>
- 2232871095U, // <u,4,0,3>: Cost 3 vrev <3,0,4,u>
+ 2619343104U, // <u,4,0,3>: Cost 3 vext2 <0,3,1,4>, <0,3,1,4>
2625167698U, // <u,4,0,4>: Cost 3 vext2 <1,2,u,4>, <0,4,1,5>
1638329234U, // <u,4,0,5>: Cost 2 vext3 RHS, <4,0,5,1>
1638329244U, // <u,4,0,6>: Cost 2 vext3 RHS, <4,0,6,2>
- 2256761883U, // <u,4,0,7>: Cost 3 vrev <7,0,4,u>
+ 3787803556U, // <u,4,0,7>: Cost 4 vext3 RHS, <4,0,7,1>
1551426205U, // <u,4,0,u>: Cost 2 vext2 <1,2,u,4>, LHS
2555748454U, // <u,4,1,0>: Cost 3 vext1 <0,u,4,1>, LHS
- 2221589334U, // <u,4,1,1>: Cost 3 vrev <1,1,4,u>
+ 2625168180U, // <u,4,1,1>: Cost 3 vext2 <1,2,u,4>, <1,1,1,1>
1551426503U, // <u,4,1,2>: Cost 2 vext2 <1,2,u,4>, <1,2,u,4>
2625168344U, // <u,4,1,3>: Cost 3 vext2 <1,2,u,4>, <1,3,1,3>
2555751734U, // <u,4,1,4>: Cost 3 vext1 <0,u,4,1>, RHS
@@ -6195,8 +6195,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2689879022U, // <u,4,1,6>: Cost 3 vext3 LHS, <4,1,6,3>
2592248852U, // <u,4,1,7>: Cost 3 vext1 <7,0,4,1>, <7,0,4,1>
1555408301U, // <u,4,1,u>: Cost 2 vext2 <1,u,u,4>, <1,u,u,4>
- 2216280270U, // <u,4,2,0>: Cost 3 vrev <0,2,4,u>
- 2222252967U, // <u,4,2,1>: Cost 3 vrev <1,2,4,u>
+ 2555756646U, // <u,4,2,0>: Cost 3 vext1 <0,u,4,2>, LHS
+ 2625168943U, // <u,4,2,1>: Cost 3 vext2 <1,2,u,4>, <2,1,4,u>
2625169000U, // <u,4,2,2>: Cost 3 vext2 <1,2,u,4>, <2,2,2,2>
2619197134U, // <u,4,2,3>: Cost 3 vext2 <0,2,u,4>, <2,3,4,5>
2555759926U, // <u,4,2,4>: Cost 3 vext1 <0,u,4,2>, RHS
@@ -6205,22 +6205,22 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2592257045U, // <u,4,2,7>: Cost 3 vext1 <7,0,4,2>, <7,0,4,2>
1994771784U, // <u,4,2,u>: Cost 2 vtrnl LHS, RHS
2625169558U, // <u,4,3,0>: Cost 3 vext2 <1,2,u,4>, <3,0,1,2>
- 2222916600U, // <u,4,3,1>: Cost 3 vrev <1,3,4,u>
- 1155147473U, // <u,4,3,2>: Cost 2 vrev <2,3,4,u>
+ 2567709594U, // <u,4,3,1>: Cost 3 vext1 <2,u,4,3>, <1,2,3,4>
+ 2567710817U, // <u,4,3,2>: Cost 3 vext1 <2,u,4,3>, <2,u,4,3>
2625169820U, // <u,4,3,3>: Cost 3 vext2 <1,2,u,4>, <3,3,3,3>
2625169922U, // <u,4,3,4>: Cost 3 vext2 <1,2,u,4>, <3,4,5,6>
2954069710U, // <u,4,3,5>: Cost 3 vzipr LHS, <2,3,4,5>
2954068172U, // <u,4,3,6>: Cost 3 vzipr LHS, <0,2,4,6>
- 2258752782U, // <u,4,3,7>: Cost 3 vrev <7,3,4,u>
- 1190983655U, // <u,4,3,u>: Cost 2 vrev <u,3,4,u>
+ 3903849472U, // <u,4,3,7>: Cost 4 vuzpr <1,u,3,4>, <1,3,5,7>
+ 2954068174U, // <u,4,3,u>: Cost 3 vzipr LHS, <0,2,4,u>
1505919078U, // <u,4,4,0>: Cost 2 vext1 <4,u,4,4>, LHS
2567717831U, // <u,4,4,1>: Cost 3 vext1 <2,u,4,4>, <1,2,u,4>
2567719010U, // <u,4,4,2>: Cost 3 vext1 <2,u,4,4>, <2,u,4,4>
- 2235525627U, // <u,4,4,3>: Cost 3 vrev <3,4,4,u>
+ 2570373542U, // <u,4,4,3>: Cost 3 vext1 <3,3,4,4>, <3,3,4,4>
161926454U, // <u,4,4,4>: Cost 1 vdup0 RHS
1551428918U, // <u,4,4,5>: Cost 2 vext2 <1,2,u,4>, RHS
1638329572U, // <u,4,4,6>: Cost 2 vext3 RHS, <4,4,6,6>
- 2259416415U, // <u,4,4,7>: Cost 3 vrev <7,4,4,u>
+ 2594927963U, // <u,4,4,7>: Cost 3 vext1 <7,4,4,4>, <7,4,4,4>
161926454U, // <u,4,4,u>: Cost 1 vdup0 RHS
1493983334U, // <u,4,5,0>: Cost 2 vext1 <2,u,4,5>, LHS
2689879301U, // <u,4,5,1>: Cost 3 vext3 LHS, <4,5,1,3>
@@ -6232,7 +6232,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2830110006U, // <u,4,5,7>: Cost 3 vuzpr <1,u,3,4>, RHS
537750856U, // <u,4,5,u>: Cost 1 vext3 LHS, RHS
1482047590U, // <u,4,6,0>: Cost 2 vext1 <0,u,4,6>, LHS
- 2555790132U, // <u,4,6,1>: Cost 3 vext1 <0,u,4,6>, <1,1,1,1>
+ 2555790070U, // <u,4,6,1>: Cost 3 vext1 <0,u,4,6>, <1,0,3,2>
2555790952U, // <u,4,6,2>: Cost 3 vext1 <0,u,4,6>, <2,2,2,2>
2555791510U, // <u,4,6,3>: Cost 3 vext1 <0,u,4,6>, <3,0,1,2>
1482050870U, // <u,4,6,4>: Cost 2 vext1 <0,u,4,6>, RHS
@@ -6243,15 +6243,15 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2567741542U, // <u,4,7,0>: Cost 3 vext1 <2,u,4,7>, LHS
2567742362U, // <u,4,7,1>: Cost 3 vext1 <2,u,4,7>, <1,2,3,4>
2567743589U, // <u,4,7,2>: Cost 3 vext1 <2,u,4,7>, <2,u,4,7>
- 2237516526U, // <u,4,7,3>: Cost 3 vrev <3,7,4,u>
+ 2573716286U, // <u,4,7,3>: Cost 3 vext1 <3,u,4,7>, <3,u,4,7>
2567744822U, // <u,4,7,4>: Cost 3 vext1 <2,u,4,7>, RHS
2712071624U, // <u,4,7,5>: Cost 3 vext3 RHS, <4,7,5,0>
- 1181692793U, // <u,4,7,6>: Cost 2 vrev <6,7,4,u>
+ 96808489U, // <u,4,7,6>: Cost 1 vrev RHS
2651715180U, // <u,4,7,7>: Cost 3 vext2 <5,6,u,4>, <7,7,7,7>
- 1591244483U, // <u,4,7,u>: Cost 2 vext2 <7,u,u,4>, <7,u,u,4>
+ 96955963U, // <u,4,7,u>: Cost 1 vrev RHS
1482063974U, // <u,4,u,0>: Cost 2 vext1 <0,u,4,u>, LHS
1551431470U, // <u,4,u,1>: Cost 2 vext2 <1,2,u,4>, LHS
- 1158465638U, // <u,4,u,2>: Cost 2 vrev <2,u,4,u>
+ 1494009958U, // <u,4,u,2>: Cost 2 vext1 <2,u,4,u>, <2,u,4,u>
2555807894U, // <u,4,u,3>: Cost 3 vext1 <0,u,4,u>, <3,0,1,2>
161926454U, // <u,4,u,4>: Cost 1 vdup0 RHS
1551431834U, // <u,4,u,5>: Cost 2 vext2 <1,2,u,4>, RHS
@@ -6265,7 +6265,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1546273106U, // <u,5,0,4>: Cost 2 vext2 <0,4,1,5>, <0,4,1,5>
2733010539U, // <u,5,0,5>: Cost 3 vext3 LHS, <5,0,5,1>
2597622682U, // <u,5,0,6>: Cost 3 vext1 <7,u,5,0>, <6,7,u,5>
- 3098512694U, // <u,5,0,7>: Cost 3 vtrnr <1,u,3,0>, RHS
+ 1176539396U, // <u,5,0,7>: Cost 2 vrev <5,u,7,0>
1558069917U, // <u,5,0,u>: Cost 2 vext2 <2,3,u,5>, LHS
1505968230U, // <u,5,1,0>: Cost 2 vext1 <4,u,5,1>, LHS
2624512887U, // <u,5,1,1>: Cost 3 vext2 <1,1,u,5>, <1,1,u,5>
@@ -6286,22 +6286,22 @@ static const unsigned PerfectShuffleTable[6561+1] = {
3092335926U, // <u,5,2,7>: Cost 3 vtrnr <0,u,0,2>, RHS
1561389191U, // <u,5,2,u>: Cost 2 vext2 <2,u,u,5>, <2,u,u,5>
2561810534U, // <u,5,3,0>: Cost 3 vext1 <1,u,5,3>, LHS
- 2222990337U, // <u,5,3,1>: Cost 3 vrev <1,3,5,u>
- 2631813430U, // <u,5,3,2>: Cost 3 vext2 <2,3,u,5>, <3,2,1,0>
+ 2561811857U, // <u,5,3,1>: Cost 3 vext1 <1,u,5,3>, <1,u,5,3>
+ 2631813474U, // <u,5,3,2>: Cost 3 vext2 <2,3,u,5>, <3,2,5,u>
2631813532U, // <u,5,3,3>: Cost 3 vext2 <2,3,u,5>, <3,3,3,3>
2619869698U, // <u,5,3,4>: Cost 3 vext2 <0,3,u,5>, <3,4,5,6>
3001847002U, // <u,5,3,5>: Cost 3 vzipr LHS, <4,4,5,5>
2954070530U, // <u,5,3,6>: Cost 3 vzipr LHS, <3,4,5,6>
2018749750U, // <u,5,3,7>: Cost 2 vtrnr LHS, RHS
2018749751U, // <u,5,3,u>: Cost 2 vtrnr LHS, RHS
- 1523908710U, // <u,5,4,0>: Cost 2 vext1 <7,u,5,4>, LHS
- 2223653970U, // <u,5,4,1>: Cost 3 vrev <1,4,5,u>
- 2229626667U, // <u,5,4,2>: Cost 3 vrev <2,4,5,u>
- 1161857540U, // <u,5,4,3>: Cost 2 vrev <3,4,5,u>
- 1523911990U, // <u,5,4,4>: Cost 2 vext1 <7,u,5,4>, RHS
+ 2573762662U, // <u,5,4,0>: Cost 3 vext1 <3,u,5,4>, LHS
+ 2620017634U, // <u,5,4,1>: Cost 3 vext2 <0,4,1,5>, <4,1,5,0>
+ 2573764338U, // <u,5,4,2>: Cost 3 vext1 <3,u,5,4>, <2,3,u,5>
+ 2573765444U, // <u,5,4,3>: Cost 3 vext1 <3,u,5,4>, <3,u,5,4>
+ 1570680053U, // <u,5,4,4>: Cost 2 vext2 <4,4,u,5>, <4,4,u,5>
1558072630U, // <u,5,4,5>: Cost 2 vext2 <2,3,u,5>, RHS
2645749143U, // <u,5,4,6>: Cost 3 vext2 <4,6,u,5>, <4,6,u,5>
- 1185748328U, // <u,5,4,7>: Cost 2 vrev <7,4,5,u>
+ 1638330310U, // <u,5,4,7>: Cost 2 vext3 RHS, <5,4,7,6>
1558072873U, // <u,5,4,u>: Cost 2 vext2 <2,3,u,5>, RHS
1506000998U, // <u,5,5,0>: Cost 2 vext1 <4,u,5,5>, LHS
2561827984U, // <u,5,5,1>: Cost 3 vext1 <1,u,5,5>, <1,5,3,7>
@@ -6318,7 +6318,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1500040006U, // <u,5,6,3>: Cost 2 vext1 <3,u,5,6>, <3,u,5,6>
1500040502U, // <u,5,6,4>: Cost 2 vext1 <3,u,5,6>, RHS
2714062935U, // <u,5,6,5>: Cost 3 vext3 RHS, <5,6,5,7>
- 2573783798U, // <u,5,6,6>: Cost 3 vext1 <3,u,5,6>, <6,5,u,3>
+ 2712072288U, // <u,5,6,6>: Cost 3 vext3 RHS, <5,6,6,7>
27705344U, // <u,5,6,7>: Cost 0 copy RHS
27705344U, // <u,5,6,u>: Cost 0 copy RHS
1488101478U, // <u,5,7,0>: Cost 2 vext1 <1,u,5,7>, LHS
@@ -6333,7 +6333,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1488109670U, // <u,5,u,0>: Cost 2 vext1 <1,u,5,u>, LHS
1488110998U, // <u,5,u,1>: Cost 2 vext1 <1,u,5,u>, <1,u,5,u>
2561853032U, // <u,5,u,2>: Cost 3 vext1 <1,u,5,u>, <2,2,2,2>
- 1164512072U, // <u,5,u,3>: Cost 2 vrev <3,u,5,u>
+ 1500056392U, // <u,5,u,3>: Cost 2 vext1 <3,u,5,u>, <3,u,5,u>
1488112950U, // <u,5,u,4>: Cost 2 vext1 <1,u,5,u>, RHS
229035318U, // <u,5,u,5>: Cost 1 vdup1 RHS
2954111490U, // <u,5,u,6>: Cost 3 vzipr LHS, <3,4,5,6>
@@ -6342,13 +6342,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2619211776U, // <u,6,0,0>: Cost 3 vext2 <0,2,u,6>, <0,0,0,0>
1545470054U, // <u,6,0,1>: Cost 2 vext2 <0,2,u,6>, LHS
1545470192U, // <u,6,0,2>: Cost 2 vext2 <0,2,u,6>, <0,2,u,6>
- 2638233856U, // <u,6,0,3>: Cost 3 vext2 <3,4,5,6>, <0,3,1,4>
+ 2255958969U, // <u,6,0,3>: Cost 3 vrev <6,u,3,0>
1546797458U, // <u,6,0,4>: Cost 2 vext2 <0,4,u,6>, <0,4,u,6>
2720624971U, // <u,6,0,5>: Cost 3 vext3 <6,0,5,u>, <6,0,5,u>
- 2591724500U, // <u,6,0,6>: Cost 3 vext1 <6,u,6,0>, <6,u,6,0>
+ 2256180180U, // <u,6,0,6>: Cost 3 vrev <6,u,6,0>
2960682294U, // <u,6,0,7>: Cost 3 vzipr <1,2,u,0>, RHS
1545470621U, // <u,6,0,u>: Cost 2 vext2 <0,2,u,6>, LHS
- 2585755750U, // <u,6,1,0>: Cost 3 vext1 <5,u,6,1>, LHS
+ 1182004127U, // <u,6,1,0>: Cost 2 vrev <6,u,0,1>
2619212596U, // <u,6,1,1>: Cost 3 vext2 <0,2,u,6>, <1,1,1,1>
2619212694U, // <u,6,1,2>: Cost 3 vext2 <0,2,u,6>, <1,2,3,0>
2619212760U, // <u,6,1,3>: Cost 3 vext2 <0,2,u,6>, <1,3,1,3>
@@ -6356,9 +6356,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2619212944U, // <u,6,1,5>: Cost 3 vext2 <0,2,u,6>, <1,5,3,7>
2714063264U, // <u,6,1,6>: Cost 3 vext3 RHS, <6,1,6,3>
2967326006U, // <u,6,1,7>: Cost 3 vzipr <2,3,u,1>, RHS
- 2619213165U, // <u,6,1,u>: Cost 3 vext2 <0,2,u,6>, <1,u,1,3>
+ 1182594023U, // <u,6,1,u>: Cost 2 vrev <6,u,u,1>
1506050150U, // <u,6,2,0>: Cost 2 vext1 <4,u,6,2>, LHS
- 2579792692U, // <u,6,2,1>: Cost 3 vext1 <4,u,6,2>, <1,1,1,1>
+ 2579792630U, // <u,6,2,1>: Cost 3 vext1 <4,u,6,2>, <1,0,3,2>
2619213416U, // <u,6,2,2>: Cost 3 vext2 <0,2,u,6>, <2,2,2,2>
2619213478U, // <u,6,2,3>: Cost 3 vext2 <0,2,u,6>, <2,3,0,1>
1506053430U, // <u,6,2,4>: Cost 2 vext1 <4,u,6,2>, RHS
@@ -6367,8 +6367,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638330874U, // <u,6,2,7>: Cost 2 vext3 RHS, <6,2,7,3>
1638478339U, // <u,6,2,u>: Cost 2 vext3 RHS, <6,2,u,3>
2619213974U, // <u,6,3,0>: Cost 3 vext2 <0,2,u,6>, <3,0,1,2>
- 2803058838U, // <u,6,3,1>: Cost 3 vuzpl RHS, <3,0,1,2>
- 2619214134U, // <u,6,3,2>: Cost 3 vext2 <0,2,u,6>, <3,2,1,0>
+ 2255836074U, // <u,6,3,1>: Cost 3 vrev <6,u,1,3>
+ 2255909811U, // <u,6,3,2>: Cost 3 vrev <6,u,2,3>
2619214236U, // <u,6,3,3>: Cost 3 vext2 <0,2,u,6>, <3,3,3,3>
1564715549U, // <u,6,3,4>: Cost 2 vext2 <3,4,u,6>, <3,4,u,6>
2639121006U, // <u,6,3,5>: Cost 3 vext2 <3,5,u,6>, <3,5,u,6>
@@ -6376,9 +6376,9 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1880329526U, // <u,6,3,7>: Cost 2 vzipr LHS, RHS
1880329527U, // <u,6,3,u>: Cost 2 vzipr LHS, RHS
2567864422U, // <u,6,4,0>: Cost 3 vext1 <2,u,6,4>, LHS
- 2722984555U, // <u,6,4,1>: Cost 3 vext3 <6,4,1,u>, <6,4,1,u>
- 2689880684U, // <u,6,4,2>: Cost 3 vext3 LHS, <6,4,2,0>
- 2577820162U, // <u,6,4,3>: Cost 3 vext1 <4,5,6,4>, <3,4,5,6>
+ 2733011558U, // <u,6,4,1>: Cost 3 vext3 LHS, <6,4,1,3>
+ 2567866484U, // <u,6,4,2>: Cost 3 vext1 <2,u,6,4>, <2,u,6,4>
+ 2638458005U, // <u,6,4,3>: Cost 3 vext2 <3,4,u,6>, <4,3,6,u>
1570540772U, // <u,6,4,4>: Cost 2 vext2 <4,4,6,6>, <4,4,6,6>
1545473334U, // <u,6,4,5>: Cost 2 vext2 <0,2,u,6>, RHS
1572015512U, // <u,6,4,6>: Cost 2 vext2 <4,6,u,6>, <4,6,u,6>
@@ -6387,14 +6387,14 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2567872614U, // <u,6,5,0>: Cost 3 vext1 <2,u,6,5>, LHS
2645757648U, // <u,6,5,1>: Cost 3 vext2 <4,6,u,6>, <5,1,7,3>
2567874490U, // <u,6,5,2>: Cost 3 vext1 <2,u,6,5>, <2,6,3,7>
- 2236336734U, // <u,6,5,3>: Cost 3 vrev <3,5,6,u>
- 94825783U, // <u,6,5,4>: Cost 1 vrev RHS
+ 2576501250U, // <u,6,5,3>: Cost 3 vext1 <4,3,6,5>, <3,4,5,6>
+ 1576660943U, // <u,6,5,4>: Cost 2 vext2 <5,4,u,6>, <5,4,u,6>
2645757956U, // <u,6,5,5>: Cost 3 vext2 <4,6,u,6>, <5,5,5,5>
2645758050U, // <u,6,5,6>: Cost 3 vext2 <4,6,u,6>, <5,6,7,0>
2824080694U, // <u,6,5,7>: Cost 3 vuzpr <0,u,2,6>, RHS
- 118716571U, // <u,6,5,u>: Cost 1 vrev RHS
+ 1182626795U, // <u,6,5,u>: Cost 2 vrev <6,u,u,5>
1506082918U, // <u,6,6,0>: Cost 2 vext1 <4,u,6,6>, LHS
- 2579825460U, // <u,6,6,1>: Cost 3 vext1 <4,u,6,6>, <1,1,1,1>
+ 2579825398U, // <u,6,6,1>: Cost 3 vext1 <4,u,6,6>, <1,0,3,2>
2645758458U, // <u,6,6,2>: Cost 3 vext2 <4,6,u,6>, <6,2,7,3>
2579826838U, // <u,6,6,3>: Cost 3 vext1 <4,u,6,6>, <3,0,1,2>
1506086198U, // <u,6,6,4>: Cost 2 vext1 <4,u,6,6>, RHS
@@ -6403,7 +6403,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638331202U, // <u,6,6,7>: Cost 2 vext3 RHS, <6,6,7,7>
296144182U, // <u,6,6,u>: Cost 1 vdup2 RHS
432349286U, // <u,6,7,0>: Cost 1 vext1 RHS, LHS
- 1506091828U, // <u,6,7,1>: Cost 2 vext1 RHS, <1,1,1,1>
+ 1506091766U, // <u,6,7,1>: Cost 2 vext1 RHS, <1,0,3,2>
1506092648U, // <u,6,7,2>: Cost 2 vext1 RHS, <2,2,2,2>
1506093206U, // <u,6,7,3>: Cost 2 vext1 RHS, <3,0,1,2>
432352809U, // <u,6,7,4>: Cost 1 vext1 RHS, RHS
@@ -6415,7 +6415,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1545475886U, // <u,6,u,1>: Cost 2 vext2 <0,2,u,6>, LHS
1506100840U, // <u,6,u,2>: Cost 2 vext1 RHS, <2,2,2,2>
1506101398U, // <u,6,u,3>: Cost 2 vext1 RHS, <3,0,1,2>
- 96816682U, // <u,6,u,4>: Cost 1 vrev RHS
+ 432361002U, // <u,6,u,4>: Cost 1 vext1 RHS, RHS
1545476250U, // <u,6,u,5>: Cost 2 vext2 <0,2,u,6>, RHS
296144182U, // <u,6,u,6>: Cost 1 vdup2 RHS
1880370486U, // <u,6,u,7>: Cost 2 vzipr LHS, RHS
@@ -6429,7 +6429,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2621874741U, // <u,7,0,6>: Cost 3 vext2 <0,6,u,7>, <0,6,u,7>
2585826298U, // <u,7,0,7>: Cost 3 vext1 <5,u,7,0>, <7,0,1,2>
497615517U, // <u,7,0,u>: Cost 1 vext2 RHS, LHS
- 2573885542U, // <u,7,1,0>: Cost 3 vext1 <3,u,7,1>, LHS
+ 1571357430U, // <u,7,1,0>: Cost 2 vext2 RHS, <1,0,3,2>
1571357492U, // <u,7,1,1>: Cost 2 vext2 RHS, <1,1,1,1>
1571357590U, // <u,7,1,2>: Cost 2 vext2 RHS, <1,2,3,0>
1552114715U, // <u,7,1,3>: Cost 2 vext2 <1,3,u,7>, <1,3,u,7>
@@ -6439,7 +6439,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2727408775U, // <u,7,1,7>: Cost 3 vext3 <7,1,7,u>, <7,1,7,u>
1555432880U, // <u,7,1,u>: Cost 2 vext2 <1,u,u,7>, <1,u,u,7>
2629838337U, // <u,7,2,0>: Cost 3 vext2 <2,0,u,7>, <2,0,u,7>
- 2645100035U, // <u,7,2,1>: Cost 3 vext2 RHS, <2,1,0,0>
+ 1188058754U, // <u,7,2,1>: Cost 2 vrev <7,u,1,2>
1571358312U, // <u,7,2,2>: Cost 2 vext2 RHS, <2,2,2,2>
1571358374U, // <u,7,2,3>: Cost 2 vext2 RHS, <2,3,0,1>
2632492869U, // <u,7,2,4>: Cost 3 vext2 <2,4,u,7>, <2,4,u,7>
@@ -6449,13 +6449,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1561405577U, // <u,7,2,u>: Cost 2 vext2 <2,u,u,7>, <2,u,u,7>
1571358870U, // <u,7,3,0>: Cost 2 vext2 RHS, <3,0,1,2>
2627184913U, // <u,7,3,1>: Cost 3 vext2 <1,5,u,7>, <3,1,5,u>
- 1571359030U, // <u,7,3,2>: Cost 2 vext2 RHS, <3,2,1,0>
+ 2633820523U, // <u,7,3,2>: Cost 3 vext2 <2,6,u,7>, <3,2,6,u>
1571359132U, // <u,7,3,3>: Cost 2 vext2 RHS, <3,3,3,3>
1571359234U, // <u,7,3,4>: Cost 2 vext2 RHS, <3,4,5,6>
1512108295U, // <u,7,3,5>: Cost 2 vext1 <5,u,7,3>, <5,u,7,3>
1518080992U, // <u,7,3,6>: Cost 2 vext1 <6,u,7,3>, <6,u,7,3>
2640456465U, // <u,7,3,7>: Cost 3 vext2 <3,7,u,7>, <3,7,u,7>
- 1571359516U, // <u,7,3,u>: Cost 2 vext2 RHS, <3,u,1,0>
+ 1571359518U, // <u,7,3,u>: Cost 2 vext2 RHS, <3,u,1,2>
1571359634U, // <u,7,4,0>: Cost 2 vext2 RHS, <4,0,5,1>
2573911067U, // <u,7,4,1>: Cost 3 vext1 <3,u,7,4>, <1,3,u,7>
2645101622U, // <u,7,4,2>: Cost 3 vext2 RHS, <4,2,5,3>
@@ -6468,18 +6468,18 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2645102152U, // <u,7,5,0>: Cost 3 vext2 RHS, <5,0,1,2>
1571360464U, // <u,7,5,1>: Cost 2 vext2 RHS, <5,1,7,3>
2645102334U, // <u,7,5,2>: Cost 3 vext2 RHS, <5,2,3,4>
- 2236410471U, // <u,7,5,3>: Cost 3 vrev <3,5,7,u>
- 2645102494U, // <u,7,5,4>: Cost 3 vext2 RHS, <5,4,3,2>
+ 2645102447U, // <u,7,5,3>: Cost 3 vext2 RHS, <5,3,7,0>
+ 1571360710U, // <u,7,5,4>: Cost 2 vext2 RHS, <5,4,7,6>
1571360772U, // <u,7,5,5>: Cost 2 vext2 RHS, <5,5,5,5>
1571360866U, // <u,7,5,6>: Cost 2 vext2 RHS, <5,6,7,0>
1571360936U, // <u,7,5,7>: Cost 2 vext2 RHS, <5,7,5,7>
1571361017U, // <u,7,5,u>: Cost 2 vext2 RHS, <5,u,5,7>
- 2645102881U, // <u,7,6,0>: Cost 3 vext2 RHS, <6,0,1,2>
+ 1530044518U, // <u,7,6,0>: Cost 2 vext1 <u,u,7,6>, LHS
2645103016U, // <u,7,6,1>: Cost 3 vext2 RHS, <6,1,7,2>
1571361274U, // <u,7,6,2>: Cost 2 vext2 RHS, <6,2,7,3>
2645103154U, // <u,7,6,3>: Cost 3 vext2 RHS, <6,3,4,5>
- 2645103212U, // <u,7,6,4>: Cost 3 vext2 RHS, <6,4,2,0>
- 1638331910U, // <u,7,6,5>: Cost 2 vext3 RHS, <7,6,5,4>
+ 1530047798U, // <u,7,6,4>: Cost 2 vext1 <u,u,7,6>, RHS
+ 1188386474U, // <u,7,6,5>: Cost 2 vrev <7,u,5,6>
1571361592U, // <u,7,6,6>: Cost 2 vext2 RHS, <6,6,6,6>
1571361614U, // <u,7,6,7>: Cost 2 vext2 RHS, <6,7,0,1>
1571361695U, // <u,7,6,u>: Cost 2 vext2 RHS, <6,u,0,1>
@@ -6489,12 +6489,12 @@ static const unsigned PerfectShuffleTable[6561+1] = {
2573937497U, // <u,7,7,3>: Cost 3 vext1 <3,u,7,7>, <3,u,7,7>
1571362150U, // <u,7,7,4>: Cost 2 vext2 RHS, <7,4,5,6>
1512141067U, // <u,7,7,5>: Cost 2 vext1 <5,u,7,7>, <5,u,7,7>
- 1571362310U, // <u,7,7,6>: Cost 2 vext2 RHS, <7,6,5,4>
+ 1518113764U, // <u,7,7,6>: Cost 2 vext1 <6,u,7,7>, <6,u,7,7>
363253046U, // <u,7,7,7>: Cost 1 vdup3 RHS
363253046U, // <u,7,7,u>: Cost 1 vdup3 RHS
1571362515U, // <u,7,u,0>: Cost 2 vext2 RHS, <u,0,1,2>
497620782U, // <u,7,u,1>: Cost 1 vext2 RHS, LHS
- 1571362675U, // <u,7,u,2>: Cost 2 vext2 RHS, <u,2,1,0>
+ 1571362693U, // <u,7,u,2>: Cost 2 vext2 RHS, <u,2,3,0>
1571362748U, // <u,7,u,3>: Cost 2 vext2 RHS, <u,3,0,1>
1571362879U, // <u,7,u,4>: Cost 2 vext2 RHS, <u,4,5,6>
497621146U, // <u,7,u,5>: Cost 1 vext2 RHS, RHS
@@ -6504,13 +6504,13 @@ static const unsigned PerfectShuffleTable[6561+1] = {
135053414U, // <u,u,0,0>: Cost 1 vdup0 LHS
471081121U, // <u,u,0,1>: Cost 1 vext2 LHS, LHS
1544822948U, // <u,u,0,2>: Cost 2 vext2 LHS, <0,2,0,2>
- 1159424219U, // <u,u,0,3>: Cost 2 vrev <3,0,u,u>
+ 1616140005U, // <u,u,0,3>: Cost 2 vext3 LHS, <u,0,3,2>
1544823122U, // <u,u,0,4>: Cost 2 vext2 LHS, <0,4,1,5>
1512157453U, // <u,u,0,5>: Cost 2 vext1 <5,u,u,0>, <5,u,u,0>
1662220032U, // <u,u,0,6>: Cost 2 vext3 RHS, <u,0,6,2>
- 1183315007U, // <u,u,0,7>: Cost 2 vrev <7,0,u,u>
+ 1194457487U, // <u,u,0,7>: Cost 2 vrev <u,u,7,0>
471081629U, // <u,u,0,u>: Cost 1 vext2 LHS, LHS
- 68427937U, // <u,u,1,0>: Cost 1 vrev LHS
+ 1544823542U, // <u,u,1,0>: Cost 2 vext2 LHS, <1,0,3,2>
202162278U, // <u,u,1,1>: Cost 1 vdup1 LHS
537753390U, // <u,u,1,2>: Cost 1 vext3 LHS, LHS
1544823768U, // <u,u,1,3>: Cost 2 vext2 LHS, <1,3,1,3>
@@ -6520,7 +6520,7 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1640322907U, // <u,u,1,7>: Cost 2 vext3 RHS, <u,1,7,3>
537753444U, // <u,u,1,u>: Cost 1 vext3 LHS, LHS
1482309734U, // <u,u,2,0>: Cost 2 vext1 <0,u,u,2>, LHS
- 1611495283U, // <u,u,2,1>: Cost 2 vext3 LHS, <u,2,1,0>
+ 1194031451U, // <u,u,2,1>: Cost 2 vrev <u,u,1,2>
269271142U, // <u,u,2,2>: Cost 1 vdup2 LHS
835584U, // <u,u,2,3>: Cost 0 copy LHS
1482313014U, // <u,u,2,4>: Cost 2 vext1 <0,u,u,2>, RHS
@@ -6529,8 +6529,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1638479788U, // <u,u,2,7>: Cost 2 vext3 RHS, <u,2,7,3>
835584U, // <u,u,2,u>: Cost 0 copy LHS
408576723U, // <u,u,3,0>: Cost 1 vext1 LHS, LHS
- 1482318644U, // <u,u,3,1>: Cost 2 vext1 LHS, <1,1,1,1>
- 1544825142U, // <u,u,3,2>: Cost 2 vext2 LHS, <3,2,1,0>
+ 1482318582U, // <u,u,3,1>: Cost 2 vext1 LHS, <1,0,3,2>
+ 120371557U, // <u,u,3,2>: Cost 1 vrev LHS
336380006U, // <u,u,3,3>: Cost 1 vdup3 LHS
408579382U, // <u,u,3,4>: Cost 1 vext1 LHS, RHS
1616140271U, // <u,u,3,5>: Cost 2 vext3 LHS, <u,3,5,7>
@@ -6540,27 +6540,27 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1488298086U, // <u,u,4,0>: Cost 2 vext1 <1,u,u,4>, LHS
1488299437U, // <u,u,4,1>: Cost 2 vext1 <1,u,u,4>, <1,u,u,4>
1659271204U, // <u,u,4,2>: Cost 2 vext3 LHS, <u,4,2,6>
- 1162078751U, // <u,u,4,3>: Cost 2 vrev <3,4,u,u>
+ 1194195311U, // <u,u,4,3>: Cost 2 vrev <u,u,3,4>
161926454U, // <u,u,4,4>: Cost 1 vdup0 RHS
471084342U, // <u,u,4,5>: Cost 1 vext2 LHS, RHS
1571368308U, // <u,u,4,6>: Cost 2 vext2 RHS, <4,6,4,6>
- 1185969539U, // <u,u,4,7>: Cost 2 vrev <7,4,u,u>
+ 1640323153U, // <u,u,4,7>: Cost 2 vext3 RHS, <u,4,7,6>
471084585U, // <u,u,4,u>: Cost 1 vext2 LHS, RHS
1494278246U, // <u,u,5,0>: Cost 2 vext1 <2,u,u,5>, LHS
1571368656U, // <u,u,5,1>: Cost 2 vext2 RHS, <5,1,7,3>
1494280327U, // <u,u,5,2>: Cost 2 vext1 <2,u,u,5>, <2,u,u,5>
1616140415U, // <u,u,5,3>: Cost 2 vext3 LHS, <u,5,3,7>
- 94973257U, // <u,u,5,4>: Cost 1 vrev RHS
+ 1494281526U, // <u,u,5,4>: Cost 2 vext1 <2,u,u,5>, RHS
229035318U, // <u,u,5,5>: Cost 1 vdup1 RHS
537753754U, // <u,u,5,6>: Cost 1 vext3 LHS, RHS
1750355254U, // <u,u,5,7>: Cost 2 vuzpr LHS, RHS
537753772U, // <u,u,5,u>: Cost 1 vext3 LHS, RHS
1482342502U, // <u,u,6,0>: Cost 2 vext1 <0,u,u,6>, LHS
- 2556085044U, // <u,u,6,1>: Cost 3 vext1 <0,u,u,6>, <1,1,1,1>
+ 2556084982U, // <u,u,6,1>: Cost 3 vext1 <0,u,u,6>, <1,0,3,2>
1571369466U, // <u,u,6,2>: Cost 2 vext2 RHS, <6,2,7,3>
1611938000U, // <u,u,6,3>: Cost 2 vext3 LHS, <u,6,3,7>
1482345782U, // <u,u,6,4>: Cost 2 vext1 <0,u,u,6>, RHS
- 1638332639U, // <u,u,6,5>: Cost 2 vext3 RHS, <u,6,5,4>
+ 1194359171U, // <u,u,6,5>: Cost 2 vrev <u,u,5,6>
296144182U, // <u,u,6,6>: Cost 1 vdup2 RHS
27705344U, // <u,u,6,7>: Cost 0 copy RHS
27705344U, // <u,u,6,u>: Cost 0 copy RHS
@@ -6570,10 +6570,10 @@ static const unsigned PerfectShuffleTable[6561+1] = {
1906901148U, // <u,u,7,3>: Cost 2 vzipr RHS, LHS
432500283U, // <u,u,7,4>: Cost 1 vext1 RHS, RHS
1506242256U, // <u,u,7,5>: Cost 2 vext1 RHS, <5,1,7,3>
- 1571370502U, // <u,u,7,6>: Cost 2 vext2 RHS, <7,6,5,4>
+ 120699277U, // <u,u,7,6>: Cost 1 vrev RHS
363253046U, // <u,u,7,7>: Cost 1 vdup3 RHS
432502574U, // <u,u,7,u>: Cost 1 vext1 RHS, LHS
- 73073368U, // <u,u,u,0>: Cost 1 vrev LHS
+ 408617688U, // <u,u,u,0>: Cost 1 vext1 LHS, LHS
471086894U, // <u,u,u,1>: Cost 1 vext2 LHS, LHS
537753957U, // <u,u,u,2>: Cost 1 vext3 LHS, LHS
835584U, // <u,u,u,3>: Cost 0 copy LHS
@@ -6584,4 +6584,3 @@ static const unsigned PerfectShuffleTable[6561+1] = {
835584U, // <u,u,u,u>: Cost 0 copy LHS
0
};
-
diff --git a/test/CodeGen/ARM/vrev.ll b/test/CodeGen/ARM/vrev.ll
index 89e2227..0f0ea2b 100644
--- a/test/CodeGen/ARM/vrev.ll
+++ b/test/CodeGen/ARM/vrev.ll
@@ -148,12 +148,11 @@ define void @test_with_vcombine(<4 x float>* %v) nounwind {
ret void
}
-; Test the shuffle of a 4xi16 which exposed a problem with the perfect shuffle table
-; entry for vrev.
+; vrev <4 x i16> should use VREV32 and not VREV64
define void @test_vrev64(<4 x i16>* nocapture %source, <2 x i16>* nocapture %dst) nounwind ssp {
; CHECK: test_vrev64:
-; CHECK: vrev64.16
; CHECK: vext.16
+; CHECK: vrev32.16
entry:
%0 = bitcast <4 x i16>* %source to <8 x i16>*
%tmp2 = load <8 x i16>* %0, align 4
diff --git a/utils/PerfectShuffle/PerfectShuffle.cpp b/utils/PerfectShuffle/PerfectShuffle.cpp
index dd48180..98f8f4c 100644
--- a/utils/PerfectShuffle/PerfectShuffle.cpp
+++ b/utils/PerfectShuffle/PerfectShuffle.cpp
@@ -520,7 +520,7 @@ enum {
};
struct vrev : public Operator {
- vrev() : Operator(0x3210, "vrev", OP_VREV) {}
+ vrev() : Operator(0x1032, "vrev", OP_VREV) {}
} the_vrev;
template<unsigned Elt>