@@ -933,18 +933,18 @@ define <2 x i64> @vec128_i64_signed_reg_reg(<2 x i64> %a1, <2 x i64> %a2) nounwi
933933; SSE41-NEXT: pxor %xmm2, %xmm0
934934; SSE41-NEXT: movdqa %xmm0, %xmm3
935935; SSE41-NEXT: pcmpgtd %xmm5, %xmm3
936- ; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]
937- ; SSE41-NEXT: movdqa %xmm0, %xmm4
938- ; SSE41-NEXT: pcmpeqd %xmm5, %xmm4
939- ; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4 [1,1,3,3]
940- ; SSE41-NEXT: pand %xmm7 , %xmm6
936+ ; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
937+ ; SSE41-NEXT: movdqa %xmm0, %xmm6
938+ ; SSE41-NEXT: pcmpeqd %xmm5, %xmm6
939+ ; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6 [1,1,3,3]
940+ ; SSE41-NEXT: pand %xmm4 , %xmm7
941941; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[1,1,3,3]
942- ; SSE41-NEXT: por %xmm6 , %xmm4
942+ ; SSE41-NEXT: por %xmm7 , %xmm4
943943; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [1,1]
944944; SSE41-NEXT: por %xmm4, %xmm3
945945; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
946946; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
947- ; SSE41-NEXT: pand %xmm7 , %xmm0
947+ ; SSE41-NEXT: pand %xmm6 , %xmm0
948948; SSE41-NEXT: por %xmm5, %xmm0
949949; SSE41-NEXT: movdqa %xmm1, %xmm5
950950; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
@@ -1161,18 +1161,18 @@ define <2 x i64> @vec128_i64_unsigned_reg_reg(<2 x i64> %a1, <2 x i64> %a2) noun
11611161; SSE41-NEXT: pxor %xmm2, %xmm0
11621162; SSE41-NEXT: movdqa %xmm0, %xmm3
11631163; SSE41-NEXT: pcmpgtd %xmm5, %xmm3
1164- ; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]
1165- ; SSE41-NEXT: movdqa %xmm0, %xmm4
1166- ; SSE41-NEXT: pcmpeqd %xmm5, %xmm4
1167- ; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4 [1,1,3,3]
1168- ; SSE41-NEXT: pand %xmm7 , %xmm6
1164+ ; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
1165+ ; SSE41-NEXT: movdqa %xmm0, %xmm6
1166+ ; SSE41-NEXT: pcmpeqd %xmm5, %xmm6
1167+ ; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6 [1,1,3,3]
1168+ ; SSE41-NEXT: pand %xmm4 , %xmm7
11691169; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[1,1,3,3]
1170- ; SSE41-NEXT: por %xmm6 , %xmm4
1170+ ; SSE41-NEXT: por %xmm7 , %xmm4
11711171; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [1,1]
11721172; SSE41-NEXT: por %xmm4, %xmm3
11731173; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
11741174; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
1175- ; SSE41-NEXT: pand %xmm7 , %xmm0
1175+ ; SSE41-NEXT: pand %xmm6 , %xmm0
11761176; SSE41-NEXT: por %xmm5, %xmm0
11771177; SSE41-NEXT: movdqa %xmm1, %xmm5
11781178; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
@@ -1400,10 +1400,10 @@ define <2 x i64> @vec128_i64_signed_mem_reg(<2 x i64>* %a1_addr, <2 x i64> %a2)
14001400; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
14011401; SSE41-NEXT: movdqa %xmm5, %xmm6
14021402; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
1403- ; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]
1404- ; SSE41-NEXT: pand %xmm6 , %xmm4
1403+ ; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[1,1,3,3]
1404+ ; SSE41-NEXT: pand %xmm4 , %xmm7
14051405; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
1406- ; SSE41-NEXT: por %xmm4 , %xmm2
1406+ ; SSE41-NEXT: por %xmm7 , %xmm2
14071407; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1,1]
14081408; SSE41-NEXT: por %xmm2, %xmm4
14091409; SSE41-NEXT: pcmpgtd %xmm5, %xmm0
@@ -1626,21 +1626,22 @@ define <2 x i64> @vec128_i64_signed_reg_mem(<2 x i64> %a1, <2 x i64>* %a2_addr)
16261626; SSE41-NEXT: movdqa %xmm0, %xmm1
16271627; SSE41-NEXT: movdqa (%rdi), %xmm3
16281628; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
1629- ; SSE41-NEXT: pxor %xmm5, %xmm0
1629+ ; SSE41-NEXT: movdqa %xmm0, %xmm6
1630+ ; SSE41-NEXT: pxor %xmm5, %xmm6
16301631; SSE41-NEXT: pxor %xmm3, %xmm5
1631- ; SSE41-NEXT: movdqa %xmm0 , %xmm2
1632+ ; SSE41-NEXT: movdqa %xmm6 , %xmm2
16321633; SSE41-NEXT: pcmpgtd %xmm5, %xmm2
16331634; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
1634- ; SSE41-NEXT: movdqa %xmm0 , %xmm6
1635- ; SSE41-NEXT: pcmpeqd %xmm5, %xmm6
1636- ; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6 [1,1,3,3]
1637- ; SSE41-NEXT: pand %xmm6 , %xmm4
1635+ ; SSE41-NEXT: movdqa %xmm6 , %xmm0
1636+ ; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
1637+ ; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0 [1,1,3,3]
1638+ ; SSE41-NEXT: pand %xmm4 , %xmm7
16381639; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
1639- ; SSE41-NEXT: por %xmm4 , %xmm2
1640+ ; SSE41-NEXT: por %xmm7 , %xmm2
16401641; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1,1]
16411642; SSE41-NEXT: por %xmm2, %xmm4
1642- ; SSE41-NEXT: pcmpgtd %xmm0 , %xmm5
1643- ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
1643+ ; SSE41-NEXT: pcmpgtd %xmm6 , %xmm5
1644+ ; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
16441645; SSE41-NEXT: pand %xmm6, %xmm0
16451646; SSE41-NEXT: por %xmm5, %xmm0
16461647; SSE41-NEXT: movdqa %xmm3, %xmm5
@@ -1867,10 +1868,10 @@ define <2 x i64> @vec128_i64_signed_mem_mem(<2 x i64>* %a1_addr, <2 x i64>* %a2_
18671868; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
18681869; SSE41-NEXT: movdqa %xmm0, %xmm6
18691870; SSE41-NEXT: pcmpeqd %xmm5, %xmm6
1870- ; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]
1871- ; SSE41-NEXT: pand %xmm6 , %xmm4
1871+ ; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[1,1,3,3]
1872+ ; SSE41-NEXT: pand %xmm4 , %xmm7
18721873; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
1873- ; SSE41-NEXT: por %xmm4 , %xmm1
1874+ ; SSE41-NEXT: por %xmm7 , %xmm1
18741875; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1,1]
18751876; SSE41-NEXT: por %xmm1, %xmm4
18761877; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
0 commit comments