pqc/crypto_kem/ntruhps4096821/avx2/poly_rq_mul.s
2021-03-24 21:02:46 +00:00

10894 lines
305 KiB
ArmAsm

.data
.p2align 5
mask_low9words:
.word 0xffff
.word 0xffff
.word 0xffff
.word 0xffff
.word 0xffff
.word 0xffff
.word 0xffff
.word 0xffff
.word 0xffff
.word 0x0
.word 0x0
.word 0x0
.word 0x0
.word 0x0
.word 0x0
.word 0x0
const3:
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
.word 3
const9:
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
.word 9
const0:
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
const729:
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
.word 729
const3_inv:
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
.word 43691
const5_inv:
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
.word 52429
rol_rol_16:
.byte 2
.byte 3
.byte 4
.byte 5
.byte 6
.byte 7
.byte 8
.byte 9
.byte 10
.byte 11
.byte 12
.byte 13
.byte 14
.byte 15
.byte 0
.byte 1
.byte 2
.byte 3
.byte 4
.byte 5
.byte 6
.byte 7
.byte 8
.byte 9
.byte 10
.byte 11
.byte 12
.byte 13
.byte 14
.byte 15
.byte 0
.byte 1
mask32_to_16:
.word 0xffff
.word 0x0
.word 0xffff
.word 0x0
.word 0xffff
.word 0x0
.word 0xffff
.word 0x0
.word 0xffff
.word 0x0
.word 0xffff
.word 0x0
.word 0xffff
.word 0x0
.word 0xffff
.word 0x0
mask_9_7:
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
mask_7_9:
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 65535
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
.word 0
mask_mod4096:
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.word 4095
.text
.global PQCLEAN_NTRUHPS4096821_AVX2_poly_Rq_mul
.global _PQCLEAN_NTRUHPS4096821_AVX2_poly_Rq_mul
PQCLEAN_NTRUHPS4096821_AVX2_poly_Rq_mul:
_PQCLEAN_NTRUHPS4096821_AVX2_poly_Rq_mul:
push %r12
mov %rsp, %r8
andq $-32, %rsp
subq $8192, %rsp
mov %rsp, %rax
subq $8192, %rsp
mov %rsp, %r11
subq $16384, %rsp
mov %rsp, %r12
subq $512, %rsp
vpxor %ymm3, %ymm3, %ymm3
vmovdqa %ymm3, 0(%rdi)
vmovdqa %ymm3, 32(%rdi)
vmovdqa %ymm3, 64(%rdi)
vmovdqa %ymm3, 96(%rdi)
vmovdqa %ymm3, 128(%rdi)
vmovdqa %ymm3, 160(%rdi)
vmovdqa %ymm3, 192(%rdi)
vmovdqa %ymm3, 224(%rdi)
vmovdqa %ymm3, 256(%rdi)
vmovdqa %ymm3, 288(%rdi)
vmovdqa %ymm3, 320(%rdi)
vmovdqa %ymm3, 352(%rdi)
vmovdqa %ymm3, 384(%rdi)
vmovdqa %ymm3, 416(%rdi)
vmovdqa %ymm3, 448(%rdi)
vmovdqa %ymm3, 480(%rdi)
vmovdqa %ymm3, 512(%rdi)
vmovdqa %ymm3, 544(%rdi)
vmovdqa %ymm3, 576(%rdi)
vmovdqa %ymm3, 608(%rdi)
vmovdqa %ymm3, 640(%rdi)
vmovdqa %ymm3, 672(%rdi)
vmovdqa %ymm3, 704(%rdi)
vmovdqa %ymm3, 736(%rdi)
vmovdqa %ymm3, 768(%rdi)
vmovdqa %ymm3, 800(%rdi)
vmovdqa %ymm3, 832(%rdi)
vmovdqa %ymm3, 864(%rdi)
vmovdqa %ymm3, 896(%rdi)
vmovdqa %ymm3, 928(%rdi)
vmovdqa %ymm3, 960(%rdi)
vmovdqa %ymm3, 992(%rdi)
vmovdqa %ymm3, 1024(%rdi)
vmovdqa %ymm3, 1056(%rdi)
vmovdqa %ymm3, 1088(%rdi)
vmovdqa %ymm3, 1120(%rdi)
vmovdqa %ymm3, 1152(%rdi)
vmovdqa %ymm3, 1184(%rdi)
vmovdqa %ymm3, 1216(%rdi)
vmovdqa %ymm3, 1248(%rdi)
vmovdqa %ymm3, 1280(%rdi)
vmovdqa %ymm3, 1312(%rdi)
vmovdqa %ymm3, 1344(%rdi)
vmovdqa %ymm3, 1376(%rdi)
vmovdqa %ymm3, 1408(%rdi)
vmovdqa %ymm3, 1440(%rdi)
vmovdqa %ymm3, 1472(%rdi)
vmovdqa %ymm3, 1504(%rdi)
vmovdqa %ymm3, 1536(%rdi)
vmovdqa %ymm3, 1568(%rdi)
vmovdqa %ymm3, 1600(%rdi)
vmovdqa %ymm3, 1632(%rdi)
vmovdqa const3(%rip), %ymm3
vmovdqu 0(%rsi), %ymm0
vmovdqu 104(%rsi), %ymm1
vmovdqu 208(%rsi), %ymm2
vmovdqu 312(%rsi), %ymm12
vmovdqu 1248(%rsi), %ymm4
vmovdqu 1352(%rsi), %ymm5
vmovdqu 1456(%rsi), %ymm6
vmovdqu 1560(%rsi), %ymm7
vmovdqu 416(%rsi), %ymm8
vmovdqu 520(%rsi), %ymm9
vmovdqu 624(%rsi), %ymm10
vmovdqu 728(%rsi), %ymm11
vmovdqa %ymm0, 0(%rax)
vmovdqa %ymm1, 128(%rax)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 256(%rax)
vmovdqa %ymm2, 384(%rax)
vmovdqa %ymm12, 512(%rax)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 640(%rax)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 768(%rax)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 896(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1024(%rax)
vmovdqa %ymm4, 6912(%rax)
vmovdqa %ymm5, 7040(%rax)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7168(%rax)
vmovdqa %ymm6, 7296(%rax)
vmovdqa %ymm7, 7424(%rax)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7552(%rax)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7680(%rax)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7808(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%rax)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 832(%rsi), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 936(%rsi), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1040(%rsi), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1144(%rsi), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1152(%rax)
vmovdqa %ymm9, 1280(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1408(%rax)
vmovdqa %ymm10, 1536(%rax)
vmovdqa %ymm11, 1664(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1792(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 1920(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2048(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2176(%rax)
vmovdqa %ymm12, 2304(%rax)
vmovdqa %ymm13, 2432(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2560(%rax)
vmovdqa %ymm14, 2688(%rax)
vmovdqa %ymm15, 2816(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 2944(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3072(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3200(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3328(%rax)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3456(%rax)
vmovdqa %ymm9, 3584(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3712(%rax)
vmovdqa %ymm10, 3840(%rax)
vmovdqa %ymm11, 3968(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4096(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4224(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4352(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4480(%rax)
vmovdqa %ymm12, 4608(%rax)
vmovdqa %ymm13, 4736(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4864(%rax)
vmovdqa %ymm14, 4992(%rax)
vmovdqa %ymm15, 5120(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5248(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5376(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5504(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5632(%rax)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5760(%rax)
vmovdqa %ymm13, 5888(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6016(%rax)
vmovdqa %ymm14, 6144(%rax)
vmovdqa %ymm15, 6272(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6400(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6528(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6656(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6784(%rax)
vmovdqu 32(%rsi), %ymm0
vmovdqu 136(%rsi), %ymm1
vmovdqu 240(%rsi), %ymm2
vmovdqu 344(%rsi), %ymm12
vmovdqu 1280(%rsi), %ymm4
vmovdqu 1384(%rsi), %ymm5
vmovdqu 1488(%rsi), %ymm6
vmovdqu 1592(%rsi), %ymm7
vmovdqu 448(%rsi), %ymm8
vmovdqu 552(%rsi), %ymm9
vmovdqu 656(%rsi), %ymm10
vmovdqu 760(%rsi), %ymm11
vmovdqa %ymm0, 32(%rax)
vmovdqa %ymm1, 160(%rax)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 288(%rax)
vmovdqa %ymm2, 416(%rax)
vmovdqa %ymm12, 544(%rax)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 672(%rax)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 800(%rax)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 928(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1056(%rax)
vmovdqa %ymm4, 6944(%rax)
vmovdqa %ymm5, 7072(%rax)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7200(%rax)
vmovdqa %ymm6, 7328(%rax)
vmovdqa %ymm7, 7456(%rax)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7584(%rax)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7712(%rax)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7840(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%rax)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 864(%rsi), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 968(%rsi), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1072(%rsi), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1176(%rsi), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1184(%rax)
vmovdqa %ymm9, 1312(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1440(%rax)
vmovdqa %ymm10, 1568(%rax)
vmovdqa %ymm11, 1696(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1824(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 1952(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2080(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2208(%rax)
vmovdqa %ymm12, 2336(%rax)
vmovdqa %ymm13, 2464(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2592(%rax)
vmovdqa %ymm14, 2720(%rax)
vmovdqa %ymm15, 2848(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 2976(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3104(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3232(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3360(%rax)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3488(%rax)
vmovdqa %ymm9, 3616(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3744(%rax)
vmovdqa %ymm10, 3872(%rax)
vmovdqa %ymm11, 4000(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4128(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4256(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4384(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4512(%rax)
vmovdqa %ymm12, 4640(%rax)
vmovdqa %ymm13, 4768(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4896(%rax)
vmovdqa %ymm14, 5024(%rax)
vmovdqa %ymm15, 5152(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5280(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5408(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5536(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5664(%rax)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5792(%rax)
vmovdqa %ymm13, 5920(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6048(%rax)
vmovdqa %ymm14, 6176(%rax)
vmovdqa %ymm15, 6304(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6432(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6560(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6688(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6816(%rax)
vmovdqu 64(%rsi), %ymm0
vmovdqu 168(%rsi), %ymm1
vmovdqu 272(%rsi), %ymm2
vmovdqu 376(%rsi), %ymm12
vmovdqu 1312(%rsi), %ymm4
vmovdqu 1416(%rsi), %ymm5
vmovdqu 1520(%rsi), %ymm6
vmovdqu 1624(%rsi), %ymm7
vpand mask_9_7(%rip), %ymm7, %ymm7
vmovdqu 480(%rsi), %ymm8
vmovdqu 584(%rsi), %ymm9
vmovdqu 688(%rsi), %ymm10
vmovdqu 792(%rsi), %ymm11
vmovdqa %ymm0, 64(%rax)
vmovdqa %ymm1, 192(%rax)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 320(%rax)
vmovdqa %ymm2, 448(%rax)
vmovdqa %ymm12, 576(%rax)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 704(%rax)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 832(%rax)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 960(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1088(%rax)
vmovdqa %ymm4, 6976(%rax)
vmovdqa %ymm5, 7104(%rax)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7232(%rax)
vmovdqa %ymm6, 7360(%rax)
vmovdqa %ymm7, 7488(%rax)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7616(%rax)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7744(%rax)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7872(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%rax)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 896(%rsi), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 1000(%rsi), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1104(%rsi), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1208(%rsi), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1216(%rax)
vmovdqa %ymm9, 1344(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1472(%rax)
vmovdqa %ymm10, 1600(%rax)
vmovdqa %ymm11, 1728(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1856(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 1984(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2112(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2240(%rax)
vmovdqa %ymm12, 2368(%rax)
vmovdqa %ymm13, 2496(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2624(%rax)
vmovdqa %ymm14, 2752(%rax)
vmovdqa %ymm15, 2880(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 3008(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3136(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3264(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3392(%rax)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3520(%rax)
vmovdqa %ymm9, 3648(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3776(%rax)
vmovdqa %ymm10, 3904(%rax)
vmovdqa %ymm11, 4032(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4160(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4288(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4416(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4544(%rax)
vmovdqa %ymm12, 4672(%rax)
vmovdqa %ymm13, 4800(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4928(%rax)
vmovdqa %ymm14, 5056(%rax)
vmovdqa %ymm15, 5184(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5312(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5440(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5568(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5696(%rax)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5824(%rax)
vmovdqa %ymm13, 5952(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6080(%rax)
vmovdqa %ymm14, 6208(%rax)
vmovdqa %ymm15, 6336(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6464(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6592(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6720(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6848(%rax)
vmovdqu 96(%rsi), %ymm0
vmovdqu 200(%rsi), %ymm1
vmovdqu 304(%rsi), %ymm2
vmovdqu 408(%rsi), %ymm12
vmovdqu 1344(%rsi), %ymm4
vmovdqu 1448(%rsi), %ymm5
vmovdqu 1552(%rsi), %ymm6
vmovdqu 1656(%rsi), %ymm7
vpxor %ymm7, %ymm7, %ymm7
vmovdqu 512(%rsi), %ymm8
vmovdqu 616(%rsi), %ymm9
vmovdqu 720(%rsi), %ymm10
vmovdqu 824(%rsi), %ymm11
vmovdqa %ymm0, 96(%rax)
vmovdqa %ymm1, 224(%rax)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 352(%rax)
vmovdqa %ymm2, 480(%rax)
vmovdqa %ymm12, 608(%rax)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 736(%rax)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 864(%rax)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 992(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1120(%rax)
vmovdqa %ymm4, 7008(%rax)
vmovdqa %ymm5, 7136(%rax)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7264(%rax)
vmovdqa %ymm6, 7392(%rax)
vmovdqa %ymm7, 7520(%rax)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7648(%rax)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7776(%rax)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7904(%rax)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8032(%rax)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 928(%rsi), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 1032(%rsi), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1136(%rsi), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1240(%rsi), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1248(%rax)
vmovdqa %ymm9, 1376(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1504(%rax)
vmovdqa %ymm10, 1632(%rax)
vmovdqa %ymm11, 1760(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1888(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 2016(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2144(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2272(%rax)
vmovdqa %ymm12, 2400(%rax)
vmovdqa %ymm13, 2528(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2656(%rax)
vmovdqa %ymm14, 2784(%rax)
vmovdqa %ymm15, 2912(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 3040(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3168(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3296(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3424(%rax)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3552(%rax)
vmovdqa %ymm9, 3680(%rax)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3808(%rax)
vmovdqa %ymm10, 3936(%rax)
vmovdqa %ymm11, 4064(%rax)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4192(%rax)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4320(%rax)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4448(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4576(%rax)
vmovdqa %ymm12, 4704(%rax)
vmovdqa %ymm13, 4832(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4960(%rax)
vmovdqa %ymm14, 5088(%rax)
vmovdqa %ymm15, 5216(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5344(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5472(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5600(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5728(%rax)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5856(%rax)
vmovdqa %ymm13, 5984(%rax)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6112(%rax)
vmovdqa %ymm14, 6240(%rax)
vmovdqa %ymm15, 6368(%rax)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6496(%rax)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6624(%rax)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6752(%rax)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6880(%rax)
vmovdqu 0(%rdx), %ymm0
vmovdqu 104(%rdx), %ymm1
vmovdqu 208(%rdx), %ymm2
vmovdqu 312(%rdx), %ymm12
vmovdqu 1248(%rdx), %ymm4
vmovdqu 1352(%rdx), %ymm5
vmovdqu 1456(%rdx), %ymm6
vmovdqu 1560(%rdx), %ymm7
vmovdqu 416(%rdx), %ymm8
vmovdqu 520(%rdx), %ymm9
vmovdqu 624(%rdx), %ymm10
vmovdqu 728(%rdx), %ymm11
vmovdqa %ymm0, 0(%r11)
vmovdqa %ymm1, 128(%r11)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 256(%r11)
vmovdqa %ymm2, 384(%r11)
vmovdqa %ymm12, 512(%r11)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 640(%r11)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 768(%r11)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 896(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1024(%r11)
vmovdqa %ymm4, 6912(%r11)
vmovdqa %ymm5, 7040(%r11)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7168(%r11)
vmovdqa %ymm6, 7296(%r11)
vmovdqa %ymm7, 7424(%r11)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7552(%r11)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7680(%r11)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7808(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%r11)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 832(%rdx), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 936(%rdx), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1040(%rdx), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1144(%rdx), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1152(%r11)
vmovdqa %ymm9, 1280(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1408(%r11)
vmovdqa %ymm10, 1536(%r11)
vmovdqa %ymm11, 1664(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1792(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 1920(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2048(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2176(%r11)
vmovdqa %ymm12, 2304(%r11)
vmovdqa %ymm13, 2432(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2560(%r11)
vmovdqa %ymm14, 2688(%r11)
vmovdqa %ymm15, 2816(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 2944(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3072(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3200(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3328(%r11)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3456(%r11)
vmovdqa %ymm9, 3584(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3712(%r11)
vmovdqa %ymm10, 3840(%r11)
vmovdqa %ymm11, 3968(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4096(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4224(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4352(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4480(%r11)
vmovdqa %ymm12, 4608(%r11)
vmovdqa %ymm13, 4736(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4864(%r11)
vmovdqa %ymm14, 4992(%r11)
vmovdqa %ymm15, 5120(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5248(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5376(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5504(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5632(%r11)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5760(%r11)
vmovdqa %ymm13, 5888(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6016(%r11)
vmovdqa %ymm14, 6144(%r11)
vmovdqa %ymm15, 6272(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6400(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6528(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6656(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6784(%r11)
vmovdqu 32(%rdx), %ymm0
vmovdqu 136(%rdx), %ymm1
vmovdqu 240(%rdx), %ymm2
vmovdqu 344(%rdx), %ymm12
vmovdqu 1280(%rdx), %ymm4
vmovdqu 1384(%rdx), %ymm5
vmovdqu 1488(%rdx), %ymm6
vmovdqu 1592(%rdx), %ymm7
vmovdqu 448(%rdx), %ymm8
vmovdqu 552(%rdx), %ymm9
vmovdqu 656(%rdx), %ymm10
vmovdqu 760(%rdx), %ymm11
vmovdqa %ymm0, 32(%r11)
vmovdqa %ymm1, 160(%r11)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 288(%r11)
vmovdqa %ymm2, 416(%r11)
vmovdqa %ymm12, 544(%r11)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 672(%r11)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 800(%r11)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 928(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1056(%r11)
vmovdqa %ymm4, 6944(%r11)
vmovdqa %ymm5, 7072(%r11)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7200(%r11)
vmovdqa %ymm6, 7328(%r11)
vmovdqa %ymm7, 7456(%r11)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7584(%r11)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7712(%r11)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7840(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%r11)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 864(%rdx), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 968(%rdx), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1072(%rdx), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1176(%rdx), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1184(%r11)
vmovdqa %ymm9, 1312(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1440(%r11)
vmovdqa %ymm10, 1568(%r11)
vmovdqa %ymm11, 1696(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1824(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 1952(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2080(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2208(%r11)
vmovdqa %ymm12, 2336(%r11)
vmovdqa %ymm13, 2464(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2592(%r11)
vmovdqa %ymm14, 2720(%r11)
vmovdqa %ymm15, 2848(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 2976(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3104(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3232(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3360(%r11)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3488(%r11)
vmovdqa %ymm9, 3616(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3744(%r11)
vmovdqa %ymm10, 3872(%r11)
vmovdqa %ymm11, 4000(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4128(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4256(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4384(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4512(%r11)
vmovdqa %ymm12, 4640(%r11)
vmovdqa %ymm13, 4768(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4896(%r11)
vmovdqa %ymm14, 5024(%r11)
vmovdqa %ymm15, 5152(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5280(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5408(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5536(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5664(%r11)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5792(%r11)
vmovdqa %ymm13, 5920(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6048(%r11)
vmovdqa %ymm14, 6176(%r11)
vmovdqa %ymm15, 6304(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6432(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6560(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6688(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6816(%r11)
vmovdqu 64(%rdx), %ymm0
vmovdqu 168(%rdx), %ymm1
vmovdqu 272(%rdx), %ymm2
vmovdqu 376(%rdx), %ymm12
vmovdqu 1312(%rdx), %ymm4
vmovdqu 1416(%rdx), %ymm5
vmovdqu 1520(%rdx), %ymm6
vmovdqu 1624(%rdx), %ymm7
vpand mask_9_7(%rip), %ymm7, %ymm7
vmovdqu 480(%rdx), %ymm8
vmovdqu 584(%rdx), %ymm9
vmovdqu 688(%rdx), %ymm10
vmovdqu 792(%rdx), %ymm11
vmovdqa %ymm0, 64(%r11)
vmovdqa %ymm1, 192(%r11)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 320(%r11)
vmovdqa %ymm2, 448(%r11)
vmovdqa %ymm12, 576(%r11)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 704(%r11)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 832(%r11)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 960(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1088(%r11)
vmovdqa %ymm4, 6976(%r11)
vmovdqa %ymm5, 7104(%r11)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7232(%r11)
vmovdqa %ymm6, 7360(%r11)
vmovdqa %ymm7, 7488(%r11)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7616(%r11)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7744(%r11)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7872(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%r11)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 896(%rdx), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 1000(%rdx), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1104(%rdx), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1208(%rdx), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1216(%r11)
vmovdqa %ymm9, 1344(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1472(%r11)
vmovdqa %ymm10, 1600(%r11)
vmovdqa %ymm11, 1728(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1856(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 1984(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2112(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2240(%r11)
vmovdqa %ymm12, 2368(%r11)
vmovdqa %ymm13, 2496(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2624(%r11)
vmovdqa %ymm14, 2752(%r11)
vmovdqa %ymm15, 2880(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 3008(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3136(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3264(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3392(%r11)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3520(%r11)
vmovdqa %ymm9, 3648(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3776(%r11)
vmovdqa %ymm10, 3904(%r11)
vmovdqa %ymm11, 4032(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4160(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4288(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4416(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4544(%r11)
vmovdqa %ymm12, 4672(%r11)
vmovdqa %ymm13, 4800(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4928(%r11)
vmovdqa %ymm14, 5056(%r11)
vmovdqa %ymm15, 5184(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5312(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5440(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5568(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5696(%r11)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5824(%r11)
vmovdqa %ymm13, 5952(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6080(%r11)
vmovdqa %ymm14, 6208(%r11)
vmovdqa %ymm15, 6336(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6464(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6592(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6720(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6848(%r11)
vmovdqu 96(%rdx), %ymm0
vmovdqu 200(%rdx), %ymm1
vmovdqu 304(%rdx), %ymm2
vmovdqu 408(%rdx), %ymm12
vmovdqu 1344(%rdx), %ymm4
vmovdqu 1448(%rdx), %ymm5
vmovdqu 1552(%rdx), %ymm6
vmovdqu 1656(%rdx), %ymm7
vpxor %ymm7, %ymm7, %ymm7
vmovdqu 512(%rdx), %ymm8
vmovdqu 616(%rdx), %ymm9
vmovdqu 720(%rdx), %ymm10
vmovdqu 824(%rdx), %ymm11
vmovdqa %ymm0, 96(%r11)
vmovdqa %ymm1, 224(%r11)
vpaddw %ymm0, %ymm1, %ymm14
vmovdqa %ymm14, 352(%r11)
vmovdqa %ymm2, 480(%r11)
vmovdqa %ymm12, 608(%r11)
vpaddw %ymm2, %ymm12, %ymm14
vmovdqa %ymm14, 736(%r11)
vpaddw %ymm0, %ymm2, %ymm14
vmovdqa %ymm14, 864(%r11)
vpaddw %ymm1, %ymm12, %ymm15
vmovdqa %ymm15, 992(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 1120(%r11)
vmovdqa %ymm4, 7008(%r11)
vmovdqa %ymm5, 7136(%r11)
vpaddw %ymm4, %ymm5, %ymm14
vmovdqa %ymm14, 7264(%r11)
vmovdqa %ymm6, 7392(%r11)
vmovdqa %ymm7, 7520(%r11)
vpaddw %ymm6, %ymm7, %ymm14
vmovdqa %ymm14, 7648(%r11)
vpaddw %ymm4, %ymm6, %ymm14
vmovdqa %ymm14, 7776(%r11)
vpaddw %ymm5, %ymm7, %ymm15
vmovdqa %ymm15, 7904(%r11)
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8032(%r11)
vmovdqa %ymm0, 0(%rsp)
vmovdqa %ymm1, 32(%rsp)
vmovdqa %ymm2, 64(%rsp)
vmovdqa %ymm12, 96(%rsp)
vmovdqa %ymm8, 128(%rsp)
vmovdqa %ymm9, 160(%rsp)
vmovdqa %ymm10, 192(%rsp)
vmovdqa %ymm11, 224(%rsp)
vmovdqu 928(%rdx), %ymm0
vpaddw 0(%rsp), %ymm0, %ymm1
vpaddw 128(%rsp), %ymm4, %ymm2
vpaddw %ymm2, %ymm1, %ymm8
vpsubw %ymm2, %ymm1, %ymm12
vmovdqa %ymm0, 256(%rsp)
vmovdqu 1032(%rdx), %ymm0
vpaddw 32(%rsp), %ymm0, %ymm1
vpaddw 160(%rsp), %ymm5, %ymm2
vpaddw %ymm2, %ymm1, %ymm9
vpsubw %ymm2, %ymm1, %ymm13
vmovdqa %ymm0, 288(%rsp)
vmovdqu 1136(%rdx), %ymm0
vpaddw 64(%rsp), %ymm0, %ymm1
vpaddw 192(%rsp), %ymm6, %ymm2
vpaddw %ymm2, %ymm1, %ymm10
vpsubw %ymm2, %ymm1, %ymm14
vmovdqa %ymm0, 320(%rsp)
vmovdqu 1240(%rdx), %ymm0
vpaddw 96(%rsp), %ymm0, %ymm1
vpaddw 224(%rsp), %ymm7, %ymm2
vpaddw %ymm2, %ymm1, %ymm11
vpsubw %ymm2, %ymm1, %ymm15
vmovdqa %ymm0, 352(%rsp)
vmovdqa %ymm8, 1248(%r11)
vmovdqa %ymm9, 1376(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 1504(%r11)
vmovdqa %ymm10, 1632(%r11)
vmovdqa %ymm11, 1760(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 1888(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 2016(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 2144(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 2272(%r11)
vmovdqa %ymm12, 2400(%r11)
vmovdqa %ymm13, 2528(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 2656(%r11)
vmovdqa %ymm14, 2784(%r11)
vmovdqa %ymm15, 2912(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 3040(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 3168(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 3296(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 3424(%r11)
vmovdqa 256(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm4, %ymm1
vpaddw 128(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm8
vpsubw %ymm1, %ymm0, %ymm12
vmovdqa 288(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm5, %ymm1
vpaddw 160(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm9
vpsubw %ymm1, %ymm0, %ymm13
vmovdqa 320(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm6, %ymm1
vpaddw 192(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm10
vpsubw %ymm1, %ymm0, %ymm14
vmovdqa 352(%rsp), %ymm0
vpsllw $2, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm0
vpsllw $2, %ymm7, %ymm1
vpaddw 224(%rsp), %ymm1, %ymm1
vpsllw $1, %ymm1, %ymm1
vpaddw %ymm1, %ymm0, %ymm11
vpsubw %ymm1, %ymm0, %ymm15
vmovdqa %ymm8, 3552(%r11)
vmovdqa %ymm9, 3680(%r11)
vpaddw %ymm8, %ymm9, %ymm0
vmovdqa %ymm0, 3808(%r11)
vmovdqa %ymm10, 3936(%r11)
vmovdqa %ymm11, 4064(%r11)
vpaddw %ymm10, %ymm11, %ymm0
vmovdqa %ymm0, 4192(%r11)
vpaddw %ymm8, %ymm10, %ymm0
vmovdqa %ymm0, 4320(%r11)
vpaddw %ymm9, %ymm11, %ymm1
vmovdqa %ymm1, 4448(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 4576(%r11)
vmovdqa %ymm12, 4704(%r11)
vmovdqa %ymm13, 4832(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 4960(%r11)
vmovdqa %ymm14, 5088(%r11)
vmovdqa %ymm15, 5216(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 5344(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 5472(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 5600(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 5728(%r11)
vpmullw %ymm3, %ymm4, %ymm0
vpaddw 256(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 128(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 0(%rsp), %ymm0, %ymm12
vpmullw %ymm3, %ymm5, %ymm0
vpaddw 288(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 160(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 32(%rsp), %ymm0, %ymm13
vpmullw %ymm3, %ymm6, %ymm0
vpaddw 320(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 192(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 64(%rsp), %ymm0, %ymm14
vpmullw %ymm3, %ymm7, %ymm0
vpaddw 352(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 224(%rsp), %ymm0, %ymm0
vpmullw %ymm3, %ymm0, %ymm0
vpaddw 96(%rsp), %ymm0, %ymm15
vmovdqa %ymm12, 5856(%r11)
vmovdqa %ymm13, 5984(%r11)
vpaddw %ymm12, %ymm13, %ymm0
vmovdqa %ymm0, 6112(%r11)
vmovdqa %ymm14, 6240(%r11)
vmovdqa %ymm15, 6368(%r11)
vpaddw %ymm14, %ymm15, %ymm0
vmovdqa %ymm0, 6496(%r11)
vpaddw %ymm12, %ymm14, %ymm0
vmovdqa %ymm0, 6624(%r11)
vpaddw %ymm13, %ymm15, %ymm1
vmovdqa %ymm1, 6752(%r11)
vpaddw %ymm0, %ymm1, %ymm0
vmovdqa %ymm0, 6880(%r11)
subq $11584, %rsp
mov $4, %ecx
karatsuba_loop_1:
mov %rsp, %r9
mov %rsp, %r10
subq $32, %rsp
vmovdqa 0(%rax), %ymm0
vmovdqa 256(%rax), %ymm1
vmovdqa 512(%rax), %ymm2
vmovdqa 768(%rax), %ymm3
vpunpcklwd 128(%rax), %ymm0, %ymm4
vpunpckhwd 128(%rax), %ymm0, %ymm5
vpunpcklwd 384(%rax), %ymm1, %ymm6
vpunpckhwd 384(%rax), %ymm1, %ymm7
vpunpcklwd 640(%rax), %ymm2, %ymm8
vpunpckhwd 640(%rax), %ymm2, %ymm9
vpunpcklwd 896(%rax), %ymm3, %ymm10
vpunpckhwd 896(%rax), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1024(%rax), %ymm0
vmovdqa 1280(%rax), %ymm1
vmovdqa 1536(%rax), %ymm2
vmovdqa 1792(%rax), %ymm3
vpunpcklwd 1152(%rax), %ymm0, %ymm12
vpunpckhwd 1152(%rax), %ymm0, %ymm13
vpunpcklwd 1408(%rax), %ymm1, %ymm14
vpunpckhwd 1408(%rax), %ymm1, %ymm15
vpunpcklwd 1664(%rax), %ymm2, %ymm0
vpunpckhwd 1664(%rax), %ymm2, %ymm1
vpunpcklwd 1920(%rax), %ymm3, %ymm2
vpunpckhwd 1920(%rax), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 0(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 32(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 64(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 96(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 128(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 160(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 192(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 256(%r9)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 288(%r9)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 320(%r9)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 352(%r9)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 384(%r9)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 416(%r9)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 448(%r9)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 224(%r9)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 480(%r9)
vmovdqa 32(%rax), %ymm0
vmovdqa 288(%rax), %ymm1
vmovdqa 544(%rax), %ymm2
vmovdqa 800(%rax), %ymm3
vpunpcklwd 160(%rax), %ymm0, %ymm4
vpunpckhwd 160(%rax), %ymm0, %ymm5
vpunpcklwd 416(%rax), %ymm1, %ymm6
vpunpckhwd 416(%rax), %ymm1, %ymm7
vpunpcklwd 672(%rax), %ymm2, %ymm8
vpunpckhwd 672(%rax), %ymm2, %ymm9
vpunpcklwd 928(%rax), %ymm3, %ymm10
vpunpckhwd 928(%rax), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1056(%rax), %ymm0
vmovdqa 1312(%rax), %ymm1
vmovdqa 1568(%rax), %ymm2
vmovdqa 1824(%rax), %ymm3
vpunpcklwd 1184(%rax), %ymm0, %ymm12
vpunpckhwd 1184(%rax), %ymm0, %ymm13
vpunpcklwd 1440(%rax), %ymm1, %ymm14
vpunpckhwd 1440(%rax), %ymm1, %ymm15
vpunpcklwd 1696(%rax), %ymm2, %ymm0
vpunpckhwd 1696(%rax), %ymm2, %ymm1
vpunpcklwd 1952(%rax), %ymm3, %ymm2
vpunpckhwd 1952(%rax), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 512(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 544(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 576(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 608(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 640(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 672(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 704(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 768(%r9)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 800(%r9)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 832(%r9)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 864(%r9)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 896(%r9)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 928(%r9)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 960(%r9)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 736(%r9)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 992(%r9)
vmovdqa 64(%rax), %ymm0
vmovdqa 320(%rax), %ymm1
vmovdqa 576(%rax), %ymm2
vmovdqa 832(%rax), %ymm3
vpunpcklwd 192(%rax), %ymm0, %ymm4
vpunpckhwd 192(%rax), %ymm0, %ymm5
vpunpcklwd 448(%rax), %ymm1, %ymm6
vpunpckhwd 448(%rax), %ymm1, %ymm7
vpunpcklwd 704(%rax), %ymm2, %ymm8
vpunpckhwd 704(%rax), %ymm2, %ymm9
vpunpcklwd 960(%rax), %ymm3, %ymm10
vpunpckhwd 960(%rax), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1088(%rax), %ymm0
vmovdqa 1344(%rax), %ymm1
vmovdqa 1600(%rax), %ymm2
vmovdqa 1856(%rax), %ymm3
vpunpcklwd 1216(%rax), %ymm0, %ymm12
vpunpckhwd 1216(%rax), %ymm0, %ymm13
vpunpcklwd 1472(%rax), %ymm1, %ymm14
vpunpckhwd 1472(%rax), %ymm1, %ymm15
vpunpcklwd 1728(%rax), %ymm2, %ymm0
vpunpckhwd 1728(%rax), %ymm2, %ymm1
vpunpcklwd 1984(%rax), %ymm3, %ymm2
vpunpckhwd 1984(%rax), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 1024(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 1056(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 1088(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 1120(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1152(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1184(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1216(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 1280(%r9)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 1312(%r9)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 1344(%r9)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 1376(%r9)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 1408(%r9)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 1440(%r9)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 1472(%r9)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1248(%r9)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 1504(%r9)
vmovdqa 96(%rax), %ymm0
vmovdqa 352(%rax), %ymm1
vmovdqa 608(%rax), %ymm2
vmovdqa 864(%rax), %ymm3
vpunpcklwd 224(%rax), %ymm0, %ymm4
vpunpckhwd 224(%rax), %ymm0, %ymm5
vpunpcklwd 480(%rax), %ymm1, %ymm6
vpunpckhwd 480(%rax), %ymm1, %ymm7
vpunpcklwd 736(%rax), %ymm2, %ymm8
vpunpckhwd 736(%rax), %ymm2, %ymm9
vpunpcklwd 992(%rax), %ymm3, %ymm10
vpunpckhwd 992(%rax), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1120(%rax), %ymm0
vmovdqa 1376(%rax), %ymm1
vmovdqa 1632(%rax), %ymm2
vmovdqa 1888(%rax), %ymm3
vpunpcklwd 1248(%rax), %ymm0, %ymm12
vpunpckhwd 1248(%rax), %ymm0, %ymm13
vpunpcklwd 1504(%rax), %ymm1, %ymm14
vpunpckhwd 1504(%rax), %ymm1, %ymm15
vpunpcklwd 1760(%rax), %ymm2, %ymm0
vpunpckhwd 1760(%rax), %ymm2, %ymm1
vpunpcklwd 2016(%rax), %ymm3, %ymm2
vpunpckhwd 2016(%rax), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 1536(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 1568(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 1600(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 1632(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1664(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1696(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1728(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1760(%r9)
addq $32, %rsp
subq $32, %rsp
vmovdqa 0(%r11), %ymm0
vmovdqa 256(%r11), %ymm1
vmovdqa 512(%r11), %ymm2
vmovdqa 768(%r11), %ymm3
vpunpcklwd 128(%r11), %ymm0, %ymm4
vpunpckhwd 128(%r11), %ymm0, %ymm5
vpunpcklwd 384(%r11), %ymm1, %ymm6
vpunpckhwd 384(%r11), %ymm1, %ymm7
vpunpcklwd 640(%r11), %ymm2, %ymm8
vpunpckhwd 640(%r11), %ymm2, %ymm9
vpunpcklwd 896(%r11), %ymm3, %ymm10
vpunpckhwd 896(%r11), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1024(%r11), %ymm0
vmovdqa 1280(%r11), %ymm1
vmovdqa 1536(%r11), %ymm2
vmovdqa 1792(%r11), %ymm3
vpunpcklwd 1152(%r11), %ymm0, %ymm12
vpunpckhwd 1152(%r11), %ymm0, %ymm13
vpunpcklwd 1408(%r11), %ymm1, %ymm14
vpunpckhwd 1408(%r11), %ymm1, %ymm15
vpunpcklwd 1664(%r11), %ymm2, %ymm0
vpunpckhwd 1664(%r11), %ymm2, %ymm1
vpunpcklwd 1920(%r11), %ymm3, %ymm2
vpunpckhwd 1920(%r11), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 1664(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 1696(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 1728(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 1760(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1792(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1824(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1856(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 1920(%r9)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 1952(%r9)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 1984(%r9)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2016(%r9)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 2048(%r9)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 2080(%r9)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 2112(%r9)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1888(%r9)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 2144(%r9)
vmovdqa 32(%r11), %ymm0
vmovdqa 288(%r11), %ymm1
vmovdqa 544(%r11), %ymm2
vmovdqa 800(%r11), %ymm3
vpunpcklwd 160(%r11), %ymm0, %ymm4
vpunpckhwd 160(%r11), %ymm0, %ymm5
vpunpcklwd 416(%r11), %ymm1, %ymm6
vpunpckhwd 416(%r11), %ymm1, %ymm7
vpunpcklwd 672(%r11), %ymm2, %ymm8
vpunpckhwd 672(%r11), %ymm2, %ymm9
vpunpcklwd 928(%r11), %ymm3, %ymm10
vpunpckhwd 928(%r11), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1056(%r11), %ymm0
vmovdqa 1312(%r11), %ymm1
vmovdqa 1568(%r11), %ymm2
vmovdqa 1824(%r11), %ymm3
vpunpcklwd 1184(%r11), %ymm0, %ymm12
vpunpckhwd 1184(%r11), %ymm0, %ymm13
vpunpcklwd 1440(%r11), %ymm1, %ymm14
vpunpckhwd 1440(%r11), %ymm1, %ymm15
vpunpcklwd 1696(%r11), %ymm2, %ymm0
vpunpckhwd 1696(%r11), %ymm2, %ymm1
vpunpcklwd 1952(%r11), %ymm3, %ymm2
vpunpckhwd 1952(%r11), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 2176(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 2208(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 2240(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 2272(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 2304(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 2336(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 2368(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2432(%r9)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2464(%r9)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2496(%r9)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2528(%r9)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 2560(%r9)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 2592(%r9)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 2624(%r9)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 2400(%r9)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 2656(%r9)
vmovdqa 64(%r11), %ymm0
vmovdqa 320(%r11), %ymm1
vmovdqa 576(%r11), %ymm2
vmovdqa 832(%r11), %ymm3
vpunpcklwd 192(%r11), %ymm0, %ymm4
vpunpckhwd 192(%r11), %ymm0, %ymm5
vpunpcklwd 448(%r11), %ymm1, %ymm6
vpunpckhwd 448(%r11), %ymm1, %ymm7
vpunpcklwd 704(%r11), %ymm2, %ymm8
vpunpckhwd 704(%r11), %ymm2, %ymm9
vpunpcklwd 960(%r11), %ymm3, %ymm10
vpunpckhwd 960(%r11), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1088(%r11), %ymm0
vmovdqa 1344(%r11), %ymm1
vmovdqa 1600(%r11), %ymm2
vmovdqa 1856(%r11), %ymm3
vpunpcklwd 1216(%r11), %ymm0, %ymm12
vpunpckhwd 1216(%r11), %ymm0, %ymm13
vpunpcklwd 1472(%r11), %ymm1, %ymm14
vpunpckhwd 1472(%r11), %ymm1, %ymm15
vpunpcklwd 1728(%r11), %ymm2, %ymm0
vpunpckhwd 1728(%r11), %ymm2, %ymm1
vpunpcklwd 1984(%r11), %ymm3, %ymm2
vpunpckhwd 1984(%r11), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 2688(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 2720(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 2752(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 2784(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 2816(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 2848(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 2880(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2944(%r9)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2976(%r9)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 3008(%r9)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 3040(%r9)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3072(%r9)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3104(%r9)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3136(%r9)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 2912(%r9)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 3168(%r9)
vmovdqa 96(%r11), %ymm0
vmovdqa 352(%r11), %ymm1
vmovdqa 608(%r11), %ymm2
vmovdqa 864(%r11), %ymm3
vpunpcklwd 224(%r11), %ymm0, %ymm4
vpunpckhwd 224(%r11), %ymm0, %ymm5
vpunpcklwd 480(%r11), %ymm1, %ymm6
vpunpckhwd 480(%r11), %ymm1, %ymm7
vpunpcklwd 736(%r11), %ymm2, %ymm8
vpunpckhwd 736(%r11), %ymm2, %ymm9
vpunpcklwd 992(%r11), %ymm3, %ymm10
vpunpckhwd 992(%r11), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 1120(%r11), %ymm0
vmovdqa 1376(%r11), %ymm1
vmovdqa 1632(%r11), %ymm2
vmovdqa 1888(%r11), %ymm3
vpunpcklwd 1248(%r11), %ymm0, %ymm12
vpunpckhwd 1248(%r11), %ymm0, %ymm13
vpunpcklwd 1504(%r11), %ymm1, %ymm14
vpunpckhwd 1504(%r11), %ymm1, %ymm15
vpunpcklwd 1760(%r11), %ymm2, %ymm0
vpunpckhwd 1760(%r11), %ymm2, %ymm1
vpunpcklwd 2016(%r11), %ymm3, %ymm2
vpunpckhwd 2016(%r11), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 3200(%r9)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 3232(%r9)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 3264(%r9)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 3296(%r9)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 3328(%r9)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 3360(%r9)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 3392(%r9)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 3424(%r9)
addq $32, %rsp
innerloop_1:
vmovdqa 0(%r9), %ymm0
vmovdqa 1664(%r9), %ymm7
vmovdqa 32(%r9), %ymm1
vmovdqa 1696(%r9), %ymm8
vmovdqa 64(%r9), %ymm2
vmovdqa 1728(%r9), %ymm9
vmovdqa 96(%r9), %ymm3
vmovdqa 1760(%r9), %ymm10
vmovdqa 128(%r9), %ymm4
vmovdqa 1792(%r9), %ymm11
vmovdqa 160(%r9), %ymm5
vmovdqa 1824(%r9), %ymm12
vmovdqa 192(%r9), %ymm6
vmovdqa 1856(%r9), %ymm13
vpmullw %ymm0, %ymm7, %ymm14
vmovdqa %ymm14, 3328(%r10)
vpmullw %ymm0, %ymm8, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3360(%r10)
vpmullw %ymm0, %ymm9, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3392(%r10)
vpmullw %ymm0, %ymm10, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3424(%r10)
vpmullw %ymm0, %ymm11, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3456(%r10)
vpmullw %ymm0, %ymm12, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3488(%r10)
vpmullw %ymm0, %ymm13, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3520(%r10)
vpmullw %ymm1, %ymm13, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3552(%r10)
vpmullw %ymm2, %ymm13, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3584(%r10)
vpmullw %ymm3, %ymm13, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3616(%r10)
vpmullw %ymm4, %ymm13, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3648(%r10)
vpmullw %ymm5, %ymm13, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3680(%r10)
vpmullw %ymm6, %ymm13, %ymm14
vmovdqa %ymm14, 3712(%r10)
vmovdqa 1888(%r9), %ymm7
vmovdqa 1920(%r9), %ymm8
vmovdqa 1952(%r9), %ymm9
vmovdqa 1984(%r9), %ymm10
vmovdqa 2016(%r9), %ymm11
vmovdqa 2048(%r9), %ymm12
vmovdqa 3552(%r10), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3552(%r10)
vmovdqa 3584(%r10), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3584(%r10)
vmovdqa 3616(%r10), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3616(%r10)
vmovdqa 3648(%r10), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3648(%r10)
vmovdqa 3680(%r10), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3680(%r10)
vmovdqa 3712(%r10), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3712(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3744(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3776(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3808(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3840(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3872(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3904(%r10)
vmovdqa 224(%r9), %ymm0
vmovdqa 256(%r9), %ymm1
vmovdqa 288(%r9), %ymm2
vmovdqa 320(%r9), %ymm3
vmovdqa 352(%r9), %ymm4
vmovdqa 384(%r9), %ymm5
vmovdqa 3776(%r10), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3776(%r10)
vmovdqa 3808(%r10), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3808(%r10)
vmovdqa 3840(%r10), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3840(%r10)
vmovdqa 3872(%r10), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3872(%r10)
vmovdqa 3904(%r10), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3904(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3936(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3968(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4000(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4032(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4064(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4096(%r10)
vmovdqa 1664(%r9), %ymm7
vmovdqa 1696(%r9), %ymm8
vmovdqa 1728(%r9), %ymm9
vmovdqa 1760(%r9), %ymm10
vmovdqa 1792(%r9), %ymm11
vmovdqa 1824(%r9), %ymm12
vmovdqa 3552(%r10), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3552(%r10)
vmovdqa 3584(%r10), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3584(%r10)
vmovdqa 3616(%r10), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3616(%r10)
vmovdqa 3648(%r10), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3648(%r10)
vmovdqa 3680(%r10), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3680(%r10)
vmovdqa 3712(%r10), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3712(%r10)
vmovdqa 3744(%r10), %ymm14
vpmullw %ymm0, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3744(%r10)
vmovdqa 3776(%r10), %ymm14
vpmullw %ymm1, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3776(%r10)
vmovdqa 3808(%r10), %ymm14
vpmullw %ymm2, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3808(%r10)
vmovdqa 3840(%r10), %ymm14
vpmullw %ymm3, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3840(%r10)
vmovdqa 3872(%r10), %ymm14
vpmullw %ymm4, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3872(%r10)
vmovdqa 3904(%r10), %ymm14
vpmullw %ymm5, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 3904(%r10)
vmovdqa 416(%r9), %ymm0
vmovdqa 2080(%r9), %ymm7
vmovdqa 448(%r9), %ymm1
vmovdqa 2112(%r9), %ymm8
vmovdqa 480(%r9), %ymm2
vmovdqa 2144(%r9), %ymm9
vmovdqa 512(%r9), %ymm3
vmovdqa 2176(%r9), %ymm10
vmovdqa 544(%r9), %ymm4
vmovdqa 2208(%r9), %ymm11
vmovdqa 576(%r9), %ymm5
vmovdqa 2240(%r9), %ymm12
vmovdqa 608(%r9), %ymm6
vmovdqa 2272(%r9), %ymm13
vpmullw %ymm0, %ymm7, %ymm14
vmovdqa %ymm14, 4160(%r10)
vpmullw %ymm0, %ymm8, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4192(%r10)
vpmullw %ymm0, %ymm9, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4224(%r10)
vpmullw %ymm0, %ymm10, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4256(%r10)
vpmullw %ymm0, %ymm11, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4288(%r10)
vpmullw %ymm0, %ymm12, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4320(%r10)
vpmullw %ymm0, %ymm13, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4352(%r10)
vpmullw %ymm1, %ymm13, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4384(%r10)
vpmullw %ymm2, %ymm13, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4416(%r10)
vpmullw %ymm3, %ymm13, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4448(%r10)
vpmullw %ymm4, %ymm13, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4480(%r10)
vpmullw %ymm5, %ymm13, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4512(%r10)
vpmullw %ymm6, %ymm13, %ymm14
vmovdqa %ymm14, 4544(%r10)
vmovdqa 2304(%r9), %ymm7
vmovdqa 2336(%r9), %ymm8
vmovdqa 2368(%r9), %ymm9
vmovdqa 2400(%r9), %ymm10
vmovdqa 2432(%r9), %ymm11
vmovdqa 2464(%r9), %ymm12
vmovdqa 4384(%r10), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4384(%r10)
vmovdqa 4416(%r10), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4416(%r10)
vmovdqa 4448(%r10), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4448(%r10)
vmovdqa 4480(%r10), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4480(%r10)
vmovdqa 4512(%r10), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4512(%r10)
vmovdqa 4544(%r10), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4544(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4576(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4608(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4640(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4672(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4704(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4736(%r10)
vmovdqa 640(%r9), %ymm0
vmovdqa 672(%r9), %ymm1
vmovdqa 704(%r9), %ymm2
vmovdqa 736(%r9), %ymm3
vmovdqa 768(%r9), %ymm4
vmovdqa 800(%r9), %ymm5
vmovdqa 4608(%r10), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4608(%r10)
vmovdqa 4640(%r10), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4640(%r10)
vmovdqa 4672(%r10), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4672(%r10)
vmovdqa 4704(%r10), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4704(%r10)
vmovdqa 4736(%r10), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4736(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4768(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4800(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4832(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4864(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4896(%r10)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4928(%r10)
vmovdqa 2080(%r9), %ymm7
vmovdqa 2112(%r9), %ymm8
vmovdqa 2144(%r9), %ymm9
vmovdqa 2176(%r9), %ymm10
vmovdqa 2208(%r9), %ymm11
vmovdqa 2240(%r9), %ymm12
vmovdqa 4384(%r10), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4384(%r10)
vmovdqa 4416(%r10), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4416(%r10)
vmovdqa 4448(%r10), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4448(%r10)
vmovdqa 4480(%r10), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4480(%r10)
vmovdqa 4512(%r10), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4512(%r10)
vmovdqa 4544(%r10), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4544(%r10)
vmovdqa 4576(%r10), %ymm14
vpmullw %ymm0, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4576(%r10)
vmovdqa 4608(%r10), %ymm14
vpmullw %ymm1, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4608(%r10)
vmovdqa 4640(%r10), %ymm14
vpmullw %ymm2, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4640(%r10)
vmovdqa 4672(%r10), %ymm14
vpmullw %ymm3, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4672(%r10)
vmovdqa 4704(%r10), %ymm14
vpmullw %ymm4, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4704(%r10)
vmovdqa 4736(%r10), %ymm14
vpmullw %ymm5, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 4736(%r10)
vmovdqa 0(%r9), %ymm0
vmovdqa 1664(%r9), %ymm7
vpaddw 416(%r9), %ymm0, %ymm0
vpaddw 2080(%r9), %ymm7, %ymm7
vmovdqa 32(%r9), %ymm1
vmovdqa 1696(%r9), %ymm8
vpaddw 448(%r9), %ymm1, %ymm1
vpaddw 2112(%r9), %ymm8, %ymm8
vmovdqa 64(%r9), %ymm2
vmovdqa 1728(%r9), %ymm9
vpaddw 480(%r9), %ymm2, %ymm2
vpaddw 2144(%r9), %ymm9, %ymm9
vmovdqa 96(%r9), %ymm3
vmovdqa 1760(%r9), %ymm10
vpaddw 512(%r9), %ymm3, %ymm3
vpaddw 2176(%r9), %ymm10, %ymm10
vmovdqa 128(%r9), %ymm4
vmovdqa 1792(%r9), %ymm11
vpaddw 544(%r9), %ymm4, %ymm4
vpaddw 2208(%r9), %ymm11, %ymm11
vmovdqa 160(%r9), %ymm5
vmovdqa 1824(%r9), %ymm12
vpaddw 576(%r9), %ymm5, %ymm5
vpaddw 2240(%r9), %ymm12, %ymm12
vmovdqa 192(%r9), %ymm6
vmovdqa 1856(%r9), %ymm13
vpaddw 608(%r9), %ymm6, %ymm6
vpaddw 2272(%r9), %ymm13, %ymm13
vpmullw %ymm0, %ymm7, %ymm14
vmovdqa %ymm14, 7424(%rsp)
vpmullw %ymm0, %ymm8, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7456(%rsp)
vpmullw %ymm0, %ymm9, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7488(%rsp)
vpmullw %ymm0, %ymm10, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7520(%rsp)
vpmullw %ymm0, %ymm11, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7552(%rsp)
vpmullw %ymm0, %ymm12, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7584(%rsp)
vpmullw %ymm0, %ymm13, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7616(%rsp)
vpmullw %ymm1, %ymm13, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7648(%rsp)
vpmullw %ymm2, %ymm13, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7680(%rsp)
vpmullw %ymm3, %ymm13, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7712(%rsp)
vpmullw %ymm4, %ymm13, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7744(%rsp)
vpmullw %ymm5, %ymm13, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7776(%rsp)
vpmullw %ymm6, %ymm13, %ymm14
vmovdqa %ymm14, 7808(%rsp)
vmovdqa 1888(%r9), %ymm7
vpaddw 2304(%r9), %ymm7, %ymm7
vmovdqa 1920(%r9), %ymm8
vpaddw 2336(%r9), %ymm8, %ymm8
vmovdqa 1952(%r9), %ymm9
vpaddw 2368(%r9), %ymm9, %ymm9
vmovdqa 1984(%r9), %ymm10
vpaddw 2400(%r9), %ymm10, %ymm10
vmovdqa 2016(%r9), %ymm11
vpaddw 2432(%r9), %ymm11, %ymm11
vmovdqa 2048(%r9), %ymm12
vpaddw 2464(%r9), %ymm12, %ymm12
vmovdqa 7648(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7648(%rsp)
vmovdqa 7680(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7680(%rsp)
vmovdqa 7712(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7712(%rsp)
vmovdqa 7744(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7744(%rsp)
vmovdqa 7776(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7776(%rsp)
vmovdqa 7808(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7808(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7840(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7872(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7904(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%rsp)
vmovdqa 224(%r9), %ymm0
vpaddw 640(%r9), %ymm0, %ymm0
vmovdqa 256(%r9), %ymm1
vpaddw 672(%r9), %ymm1, %ymm1
vmovdqa 288(%r9), %ymm2
vpaddw 704(%r9), %ymm2, %ymm2
vmovdqa 320(%r9), %ymm3
vpaddw 736(%r9), %ymm3, %ymm3
vmovdqa 352(%r9), %ymm4
vpaddw 768(%r9), %ymm4, %ymm4
vmovdqa 384(%r9), %ymm5
vpaddw 800(%r9), %ymm5, %ymm5
vmovdqa 7872(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7872(%rsp)
vmovdqa 7904(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7904(%rsp)
vmovdqa 7936(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%rsp)
vmovdqa 7968(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%rsp)
vmovdqa 8000(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8032(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8064(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8096(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8128(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8160(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8192(%rsp)
vmovdqa 1664(%r9), %ymm7
vpaddw 2080(%r9), %ymm7, %ymm7
vmovdqa 1696(%r9), %ymm8
vpaddw 2112(%r9), %ymm8, %ymm8
vmovdqa 1728(%r9), %ymm9
vpaddw 2144(%r9), %ymm9, %ymm9
vmovdqa 1760(%r9), %ymm10
vpaddw 2176(%r9), %ymm10, %ymm10
vmovdqa 1792(%r9), %ymm11
vpaddw 2208(%r9), %ymm11, %ymm11
vmovdqa 1824(%r9), %ymm12
vpaddw 2240(%r9), %ymm12, %ymm12
vmovdqa 7648(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7648(%rsp)
vmovdqa 7680(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7680(%rsp)
vmovdqa 7712(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7712(%rsp)
vmovdqa 7744(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7744(%rsp)
vmovdqa 7776(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7776(%rsp)
vmovdqa 7808(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7808(%rsp)
vmovdqa 7840(%rsp), %ymm14
vpmullw %ymm0, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7840(%rsp)
vmovdqa 7872(%rsp), %ymm14
vpmullw %ymm1, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7872(%rsp)
vmovdqa 7904(%rsp), %ymm14
vpmullw %ymm2, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7904(%rsp)
vmovdqa 7936(%rsp), %ymm14
vpmullw %ymm3, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%rsp)
vmovdqa 7968(%rsp), %ymm14
vpmullw %ymm4, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%rsp)
vmovdqa 8000(%rsp), %ymm14
vpmullw %ymm5, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%rsp)
vmovdqa 7808(%rsp), %ymm0
vpsubw 3712(%r10), %ymm0, %ymm0
vpsubw 4544(%r10), %ymm0, %ymm0
vmovdqa %ymm0, 4128(%r10)
vmovdqa 3744(%r10), %ymm0
vpsubw 4160(%r10), %ymm0, %ymm0
vmovdqa 7840(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4576(%r10), %ymm1, %ymm1
vpsubw 3328(%r10), %ymm0, %ymm0
vpaddw 7424(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3744(%r10)
vmovdqa %ymm1, 4160(%r10)
vmovdqa 3776(%r10), %ymm0
vpsubw 4192(%r10), %ymm0, %ymm0
vmovdqa 7872(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4608(%r10), %ymm1, %ymm1
vpsubw 3360(%r10), %ymm0, %ymm0
vpaddw 7456(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3776(%r10)
vmovdqa %ymm1, 4192(%r10)
vmovdqa 3808(%r10), %ymm0
vpsubw 4224(%r10), %ymm0, %ymm0
vmovdqa 7904(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4640(%r10), %ymm1, %ymm1
vpsubw 3392(%r10), %ymm0, %ymm0
vpaddw 7488(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3808(%r10)
vmovdqa %ymm1, 4224(%r10)
vmovdqa 3840(%r10), %ymm0
vpsubw 4256(%r10), %ymm0, %ymm0
vmovdqa 7936(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4672(%r10), %ymm1, %ymm1
vpsubw 3424(%r10), %ymm0, %ymm0
vpaddw 7520(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3840(%r10)
vmovdqa %ymm1, 4256(%r10)
vmovdqa 3872(%r10), %ymm0
vpsubw 4288(%r10), %ymm0, %ymm0
vmovdqa 7968(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4704(%r10), %ymm1, %ymm1
vpsubw 3456(%r10), %ymm0, %ymm0
vpaddw 7552(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3872(%r10)
vmovdqa %ymm1, 4288(%r10)
vmovdqa 3904(%r10), %ymm0
vpsubw 4320(%r10), %ymm0, %ymm0
vmovdqa 8000(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4736(%r10), %ymm1, %ymm1
vpsubw 3488(%r10), %ymm0, %ymm0
vpaddw 7584(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3904(%r10)
vmovdqa %ymm1, 4320(%r10)
vmovdqa 3936(%r10), %ymm0
vpsubw 4352(%r10), %ymm0, %ymm0
vmovdqa 8032(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4768(%r10), %ymm1, %ymm1
vpsubw 3520(%r10), %ymm0, %ymm0
vpaddw 7616(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3936(%r10)
vmovdqa %ymm1, 4352(%r10)
vmovdqa 3968(%r10), %ymm0
vpsubw 4384(%r10), %ymm0, %ymm0
vmovdqa 8064(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4800(%r10), %ymm1, %ymm1
vpsubw 3552(%r10), %ymm0, %ymm0
vpaddw 7648(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 3968(%r10)
vmovdqa %ymm1, 4384(%r10)
vmovdqa 4000(%r10), %ymm0
vpsubw 4416(%r10), %ymm0, %ymm0
vmovdqa 8096(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4832(%r10), %ymm1, %ymm1
vpsubw 3584(%r10), %ymm0, %ymm0
vpaddw 7680(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4000(%r10)
vmovdqa %ymm1, 4416(%r10)
vmovdqa 4032(%r10), %ymm0
vpsubw 4448(%r10), %ymm0, %ymm0
vmovdqa 8128(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4864(%r10), %ymm1, %ymm1
vpsubw 3616(%r10), %ymm0, %ymm0
vpaddw 7712(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4032(%r10)
vmovdqa %ymm1, 4448(%r10)
vmovdqa 4064(%r10), %ymm0
vpsubw 4480(%r10), %ymm0, %ymm0
vmovdqa 8160(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4896(%r10), %ymm1, %ymm1
vpsubw 3648(%r10), %ymm0, %ymm0
vpaddw 7744(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4064(%r10)
vmovdqa %ymm1, 4480(%r10)
vmovdqa 4096(%r10), %ymm0
vpsubw 4512(%r10), %ymm0, %ymm0
vmovdqa 8192(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4928(%r10), %ymm1, %ymm1
vpsubw 3680(%r10), %ymm0, %ymm0
vpaddw 7776(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4096(%r10)
vmovdqa %ymm1, 4512(%r10)
neg %ecx
jns done_1
add $832, %r9
add $1664, %r10
jmp innerloop_1
done_1:
sub $832, %r9
sub $1664, %r10
vmovdqa 0(%r9), %ymm0
vpaddw 832(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8256(%rsp)
vmovdqa 1664(%r9), %ymm0
vpaddw 2496(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9088(%rsp)
vmovdqa 32(%r9), %ymm0
vpaddw 864(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8288(%rsp)
vmovdqa 1696(%r9), %ymm0
vpaddw 2528(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9120(%rsp)
vmovdqa 64(%r9), %ymm0
vpaddw 896(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8320(%rsp)
vmovdqa 1728(%r9), %ymm0
vpaddw 2560(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9152(%rsp)
vmovdqa 96(%r9), %ymm0
vpaddw 928(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8352(%rsp)
vmovdqa 1760(%r9), %ymm0
vpaddw 2592(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9184(%rsp)
vmovdqa 128(%r9), %ymm0
vpaddw 960(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8384(%rsp)
vmovdqa 1792(%r9), %ymm0
vpaddw 2624(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9216(%rsp)
vmovdqa 160(%r9), %ymm0
vpaddw 992(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8416(%rsp)
vmovdqa 1824(%r9), %ymm0
vpaddw 2656(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9248(%rsp)
vmovdqa 192(%r9), %ymm0
vpaddw 1024(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8448(%rsp)
vmovdqa 1856(%r9), %ymm0
vpaddw 2688(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9280(%rsp)
vmovdqa 224(%r9), %ymm0
vpaddw 1056(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8480(%rsp)
vmovdqa 1888(%r9), %ymm0
vpaddw 2720(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9312(%rsp)
vmovdqa 256(%r9), %ymm0
vpaddw 1088(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8512(%rsp)
vmovdqa 1920(%r9), %ymm0
vpaddw 2752(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9344(%rsp)
vmovdqa 288(%r9), %ymm0
vpaddw 1120(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8544(%rsp)
vmovdqa 1952(%r9), %ymm0
vpaddw 2784(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9376(%rsp)
vmovdqa 320(%r9), %ymm0
vpaddw 1152(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8576(%rsp)
vmovdqa 1984(%r9), %ymm0
vpaddw 2816(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9408(%rsp)
vmovdqa 352(%r9), %ymm0
vpaddw 1184(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8608(%rsp)
vmovdqa 2016(%r9), %ymm0
vpaddw 2848(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9440(%rsp)
vmovdqa 384(%r9), %ymm0
vpaddw 1216(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8640(%rsp)
vmovdqa 2048(%r9), %ymm0
vpaddw 2880(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9472(%rsp)
vmovdqa 416(%r9), %ymm0
vpaddw 1248(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8672(%rsp)
vmovdqa 2080(%r9), %ymm0
vpaddw 2912(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9504(%rsp)
vmovdqa 448(%r9), %ymm0
vpaddw 1280(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8704(%rsp)
vmovdqa 2112(%r9), %ymm0
vpaddw 2944(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9536(%rsp)
vmovdqa 480(%r9), %ymm0
vpaddw 1312(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8736(%rsp)
vmovdqa 2144(%r9), %ymm0
vpaddw 2976(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9568(%rsp)
vmovdqa 512(%r9), %ymm0
vpaddw 1344(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8768(%rsp)
vmovdqa 2176(%r9), %ymm0
vpaddw 3008(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9600(%rsp)
vmovdqa 544(%r9), %ymm0
vpaddw 1376(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8800(%rsp)
vmovdqa 2208(%r9), %ymm0
vpaddw 3040(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9632(%rsp)
vmovdqa 576(%r9), %ymm0
vpaddw 1408(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8832(%rsp)
vmovdqa 2240(%r9), %ymm0
vpaddw 3072(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9664(%rsp)
vmovdqa 608(%r9), %ymm0
vpaddw 1440(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8864(%rsp)
vmovdqa 2272(%r9), %ymm0
vpaddw 3104(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9696(%rsp)
vmovdqa 640(%r9), %ymm0
vpaddw 1472(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8896(%rsp)
vmovdqa 2304(%r9), %ymm0
vpaddw 3136(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9728(%rsp)
vmovdqa 672(%r9), %ymm0
vpaddw 1504(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8928(%rsp)
vmovdqa 2336(%r9), %ymm0
vpaddw 3168(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9760(%rsp)
vmovdqa 704(%r9), %ymm0
vpaddw 1536(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8960(%rsp)
vmovdqa 2368(%r9), %ymm0
vpaddw 3200(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9792(%rsp)
vmovdqa 736(%r9), %ymm0
vpaddw 1568(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 8992(%rsp)
vmovdqa 2400(%r9), %ymm0
vpaddw 3232(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9824(%rsp)
vmovdqa 768(%r9), %ymm0
vpaddw 1600(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9024(%rsp)
vmovdqa 2432(%r9), %ymm0
vpaddw 3264(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9856(%rsp)
vmovdqa 800(%r9), %ymm0
vpaddw 1632(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9056(%rsp)
vmovdqa 2464(%r9), %ymm0
vpaddw 3296(%r9), %ymm0, %ymm0
vmovdqa %ymm0, 9888(%rsp)
vmovdqa 8256(%rsp), %ymm0
vmovdqa 9088(%rsp), %ymm7
vmovdqa 8288(%rsp), %ymm1
vmovdqa 9120(%rsp), %ymm8
vmovdqa 8320(%rsp), %ymm2
vmovdqa 9152(%rsp), %ymm9
vmovdqa 8352(%rsp), %ymm3
vmovdqa 9184(%rsp), %ymm10
vmovdqa 8384(%rsp), %ymm4
vmovdqa 9216(%rsp), %ymm11
vmovdqa 8416(%rsp), %ymm5
vmovdqa 9248(%rsp), %ymm12
vmovdqa 8448(%rsp), %ymm6
vmovdqa 9280(%rsp), %ymm13
vpmullw %ymm0, %ymm7, %ymm14
vmovdqa %ymm14, 9920(%rsp)
vpmullw %ymm0, %ymm8, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 9952(%rsp)
vpmullw %ymm0, %ymm9, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 9984(%rsp)
vpmullw %ymm0, %ymm10, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10016(%rsp)
vpmullw %ymm0, %ymm11, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10048(%rsp)
vpmullw %ymm0, %ymm12, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10080(%rsp)
vpmullw %ymm0, %ymm13, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10112(%rsp)
vpmullw %ymm1, %ymm13, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10144(%rsp)
vpmullw %ymm2, %ymm13, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10176(%rsp)
vpmullw %ymm3, %ymm13, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10208(%rsp)
vpmullw %ymm4, %ymm13, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10240(%rsp)
vpmullw %ymm5, %ymm13, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10272(%rsp)
vpmullw %ymm6, %ymm13, %ymm14
vmovdqa %ymm14, 10304(%rsp)
vmovdqa 9312(%rsp), %ymm7
vmovdqa 9344(%rsp), %ymm8
vmovdqa 9376(%rsp), %ymm9
vmovdqa 9408(%rsp), %ymm10
vmovdqa 9440(%rsp), %ymm11
vmovdqa 9472(%rsp), %ymm12
vmovdqa 10144(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10144(%rsp)
vmovdqa 10176(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10176(%rsp)
vmovdqa 10208(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10208(%rsp)
vmovdqa 10240(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10240(%rsp)
vmovdqa 10272(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10272(%rsp)
vmovdqa 10304(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10304(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10336(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10368(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10400(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10432(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10464(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10496(%rsp)
vmovdqa 8480(%rsp), %ymm0
vmovdqa 8512(%rsp), %ymm1
vmovdqa 8544(%rsp), %ymm2
vmovdqa 8576(%rsp), %ymm3
vmovdqa 8608(%rsp), %ymm4
vmovdqa 8640(%rsp), %ymm5
vmovdqa 10368(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10368(%rsp)
vmovdqa 10400(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10400(%rsp)
vmovdqa 10432(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10432(%rsp)
vmovdqa 10464(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10464(%rsp)
vmovdqa 10496(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10496(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10528(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10560(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10592(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10624(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10656(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10688(%rsp)
vmovdqa 9088(%rsp), %ymm7
vmovdqa 9120(%rsp), %ymm8
vmovdqa 9152(%rsp), %ymm9
vmovdqa 9184(%rsp), %ymm10
vmovdqa 9216(%rsp), %ymm11
vmovdqa 9248(%rsp), %ymm12
vmovdqa 10144(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10144(%rsp)
vmovdqa 10176(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10176(%rsp)
vmovdqa 10208(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10208(%rsp)
vmovdqa 10240(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10240(%rsp)
vmovdqa 10272(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10272(%rsp)
vmovdqa 10304(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10304(%rsp)
vmovdqa 10336(%rsp), %ymm14
vpmullw %ymm0, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10336(%rsp)
vmovdqa 10368(%rsp), %ymm14
vpmullw %ymm1, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10368(%rsp)
vmovdqa 10400(%rsp), %ymm14
vpmullw %ymm2, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10400(%rsp)
vmovdqa 10432(%rsp), %ymm14
vpmullw %ymm3, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10432(%rsp)
vmovdqa 10464(%rsp), %ymm14
vpmullw %ymm4, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10464(%rsp)
vmovdqa 10496(%rsp), %ymm14
vpmullw %ymm5, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10496(%rsp)
vmovdqa 8672(%rsp), %ymm0
vmovdqa 9504(%rsp), %ymm7
vmovdqa 8704(%rsp), %ymm1
vmovdqa 9536(%rsp), %ymm8
vmovdqa 8736(%rsp), %ymm2
vmovdqa 9568(%rsp), %ymm9
vmovdqa 8768(%rsp), %ymm3
vmovdqa 9600(%rsp), %ymm10
vmovdqa 8800(%rsp), %ymm4
vmovdqa 9632(%rsp), %ymm11
vmovdqa 8832(%rsp), %ymm5
vmovdqa 9664(%rsp), %ymm12
vmovdqa 8864(%rsp), %ymm6
vmovdqa 9696(%rsp), %ymm13
vpmullw %ymm0, %ymm7, %ymm14
vmovdqa %ymm14, 10752(%rsp)
vpmullw %ymm0, %ymm8, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10784(%rsp)
vpmullw %ymm0, %ymm9, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10816(%rsp)
vpmullw %ymm0, %ymm10, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10848(%rsp)
vpmullw %ymm0, %ymm11, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10880(%rsp)
vpmullw %ymm0, %ymm12, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10912(%rsp)
vpmullw %ymm0, %ymm13, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10944(%rsp)
vpmullw %ymm1, %ymm13, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10976(%rsp)
vpmullw %ymm2, %ymm13, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11008(%rsp)
vpmullw %ymm3, %ymm13, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11040(%rsp)
vpmullw %ymm4, %ymm13, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11072(%rsp)
vpmullw %ymm5, %ymm13, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11104(%rsp)
vpmullw %ymm6, %ymm13, %ymm14
vmovdqa %ymm14, 11136(%rsp)
vmovdqa 9728(%rsp), %ymm7
vmovdqa 9760(%rsp), %ymm8
vmovdqa 9792(%rsp), %ymm9
vmovdqa 9824(%rsp), %ymm10
vmovdqa 9856(%rsp), %ymm11
vmovdqa 9888(%rsp), %ymm12
vmovdqa 10976(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10976(%rsp)
vmovdqa 11008(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11008(%rsp)
vmovdqa 11040(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11040(%rsp)
vmovdqa 11072(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11072(%rsp)
vmovdqa 11104(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11104(%rsp)
vmovdqa 11136(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11136(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11168(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11200(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11232(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11264(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11296(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11328(%rsp)
vmovdqa 8896(%rsp), %ymm0
vmovdqa 8928(%rsp), %ymm1
vmovdqa 8960(%rsp), %ymm2
vmovdqa 8992(%rsp), %ymm3
vmovdqa 9024(%rsp), %ymm4
vmovdqa 9056(%rsp), %ymm5
vmovdqa 11200(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11200(%rsp)
vmovdqa 11232(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11232(%rsp)
vmovdqa 11264(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11264(%rsp)
vmovdqa 11296(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11296(%rsp)
vmovdqa 11328(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11328(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11360(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11392(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11424(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11456(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11488(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11520(%rsp)
vmovdqa 9504(%rsp), %ymm7
vmovdqa 9536(%rsp), %ymm8
vmovdqa 9568(%rsp), %ymm9
vmovdqa 9600(%rsp), %ymm10
vmovdqa 9632(%rsp), %ymm11
vmovdqa 9664(%rsp), %ymm12
vmovdqa 10976(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 10976(%rsp)
vmovdqa 11008(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11008(%rsp)
vmovdqa 11040(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11040(%rsp)
vmovdqa 11072(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11072(%rsp)
vmovdqa 11104(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11104(%rsp)
vmovdqa 11136(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11136(%rsp)
vmovdqa 11168(%rsp), %ymm14
vpmullw %ymm0, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11168(%rsp)
vmovdqa 11200(%rsp), %ymm14
vpmullw %ymm1, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11200(%rsp)
vmovdqa 11232(%rsp), %ymm14
vpmullw %ymm2, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11232(%rsp)
vmovdqa 11264(%rsp), %ymm14
vpmullw %ymm3, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11264(%rsp)
vmovdqa 11296(%rsp), %ymm14
vpmullw %ymm4, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11296(%rsp)
vmovdqa 11328(%rsp), %ymm14
vpmullw %ymm5, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 11328(%rsp)
vmovdqa 8256(%rsp), %ymm0
vmovdqa 9088(%rsp), %ymm7
vpaddw 8672(%rsp), %ymm0, %ymm0
vpaddw 9504(%rsp), %ymm7, %ymm7
vmovdqa 8288(%rsp), %ymm1
vmovdqa 9120(%rsp), %ymm8
vpaddw 8704(%rsp), %ymm1, %ymm1
vpaddw 9536(%rsp), %ymm8, %ymm8
vmovdqa 8320(%rsp), %ymm2
vmovdqa 9152(%rsp), %ymm9
vpaddw 8736(%rsp), %ymm2, %ymm2
vpaddw 9568(%rsp), %ymm9, %ymm9
vmovdqa 8352(%rsp), %ymm3
vmovdqa 9184(%rsp), %ymm10
vpaddw 8768(%rsp), %ymm3, %ymm3
vpaddw 9600(%rsp), %ymm10, %ymm10
vmovdqa 8384(%rsp), %ymm4
vmovdqa 9216(%rsp), %ymm11
vpaddw 8800(%rsp), %ymm4, %ymm4
vpaddw 9632(%rsp), %ymm11, %ymm11
vmovdqa 8416(%rsp), %ymm5
vmovdqa 9248(%rsp), %ymm12
vpaddw 8832(%rsp), %ymm5, %ymm5
vpaddw 9664(%rsp), %ymm12, %ymm12
vmovdqa 8448(%rsp), %ymm6
vmovdqa 9280(%rsp), %ymm13
vpaddw 8864(%rsp), %ymm6, %ymm6
vpaddw 9696(%rsp), %ymm13, %ymm13
vpmullw %ymm0, %ymm7, %ymm14
vmovdqa %ymm14, 7424(%rsp)
vpmullw %ymm0, %ymm8, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7456(%rsp)
vpmullw %ymm0, %ymm9, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7488(%rsp)
vpmullw %ymm0, %ymm10, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7520(%rsp)
vpmullw %ymm0, %ymm11, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7552(%rsp)
vpmullw %ymm0, %ymm12, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7584(%rsp)
vpmullw %ymm0, %ymm13, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7616(%rsp)
vpmullw %ymm1, %ymm13, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7648(%rsp)
vpmullw %ymm2, %ymm13, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7680(%rsp)
vpmullw %ymm3, %ymm13, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7712(%rsp)
vpmullw %ymm4, %ymm13, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7744(%rsp)
vpmullw %ymm5, %ymm13, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7776(%rsp)
vpmullw %ymm6, %ymm13, %ymm14
vmovdqa %ymm14, 7808(%rsp)
vmovdqa 9312(%rsp), %ymm7
vpaddw 9728(%rsp), %ymm7, %ymm7
vmovdqa 9344(%rsp), %ymm8
vpaddw 9760(%rsp), %ymm8, %ymm8
vmovdqa 9376(%rsp), %ymm9
vpaddw 9792(%rsp), %ymm9, %ymm9
vmovdqa 9408(%rsp), %ymm10
vpaddw 9824(%rsp), %ymm10, %ymm10
vmovdqa 9440(%rsp), %ymm11
vpaddw 9856(%rsp), %ymm11, %ymm11
vmovdqa 9472(%rsp), %ymm12
vpaddw 9888(%rsp), %ymm12, %ymm12
vmovdqa 7648(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7648(%rsp)
vmovdqa 7680(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7680(%rsp)
vmovdqa 7712(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7712(%rsp)
vmovdqa 7744(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7744(%rsp)
vmovdqa 7776(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7776(%rsp)
vmovdqa 7808(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7808(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7840(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7872(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7904(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm6, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm6, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%rsp)
vmovdqa 8480(%rsp), %ymm0
vpaddw 8896(%rsp), %ymm0, %ymm0
vmovdqa 8512(%rsp), %ymm1
vpaddw 8928(%rsp), %ymm1, %ymm1
vmovdqa 8544(%rsp), %ymm2
vpaddw 8960(%rsp), %ymm2, %ymm2
vmovdqa 8576(%rsp), %ymm3
vpaddw 8992(%rsp), %ymm3, %ymm3
vmovdqa 8608(%rsp), %ymm4
vpaddw 9024(%rsp), %ymm4, %ymm4
vmovdqa 8640(%rsp), %ymm5
vpaddw 9056(%rsp), %ymm5, %ymm5
vmovdqa 7872(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7872(%rsp)
vmovdqa 7904(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7904(%rsp)
vmovdqa 7936(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%rsp)
vmovdqa 7968(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%rsp)
vmovdqa 8000(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8032(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8064(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8096(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8128(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8160(%rsp)
vpxor %ymm14, %ymm14, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8192(%rsp)
vmovdqa 9088(%rsp), %ymm7
vpaddw 9504(%rsp), %ymm7, %ymm7
vmovdqa 9120(%rsp), %ymm8
vpaddw 9536(%rsp), %ymm8, %ymm8
vmovdqa 9152(%rsp), %ymm9
vpaddw 9568(%rsp), %ymm9, %ymm9
vmovdqa 9184(%rsp), %ymm10
vpaddw 9600(%rsp), %ymm10, %ymm10
vmovdqa 9216(%rsp), %ymm11
vpaddw 9632(%rsp), %ymm11, %ymm11
vmovdqa 9248(%rsp), %ymm12
vpaddw 9664(%rsp), %ymm12, %ymm12
vmovdqa 7648(%rsp), %ymm14
vpmullw %ymm0, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7648(%rsp)
vmovdqa 7680(%rsp), %ymm14
vpmullw %ymm0, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7680(%rsp)
vmovdqa 7712(%rsp), %ymm14
vpmullw %ymm0, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7712(%rsp)
vmovdqa 7744(%rsp), %ymm14
vpmullw %ymm0, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7744(%rsp)
vmovdqa 7776(%rsp), %ymm14
vpmullw %ymm0, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7776(%rsp)
vmovdqa 7808(%rsp), %ymm14
vpmullw %ymm0, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm7, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7808(%rsp)
vmovdqa 7840(%rsp), %ymm14
vpmullw %ymm0, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm1, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm8, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7840(%rsp)
vmovdqa 7872(%rsp), %ymm14
vpmullw %ymm1, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm2, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm9, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7872(%rsp)
vmovdqa 7904(%rsp), %ymm14
vpmullw %ymm2, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm3, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm10, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7904(%rsp)
vmovdqa 7936(%rsp), %ymm14
vpmullw %ymm3, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm4, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm11, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7936(%rsp)
vmovdqa 7968(%rsp), %ymm14
vpmullw %ymm4, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vpmullw %ymm5, %ymm12, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 7968(%rsp)
vmovdqa 8000(%rsp), %ymm14
vpmullw %ymm5, %ymm13, %ymm15
vpaddw %ymm14, %ymm15, %ymm14
vmovdqa %ymm14, 8000(%rsp)
vmovdqa 10336(%rsp), %ymm0
vpsubw 10752(%rsp), %ymm0, %ymm0
vmovdqa 7840(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11168(%rsp), %ymm1, %ymm4
vpsubw 9920(%rsp), %ymm0, %ymm0
vpaddw 7424(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10336(%rsp)
vmovdqa 10368(%rsp), %ymm0
vpsubw 10784(%rsp), %ymm0, %ymm0
vmovdqa 7872(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11200(%rsp), %ymm1, %ymm5
vpsubw 9952(%rsp), %ymm0, %ymm0
vpaddw 7456(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10368(%rsp)
vmovdqa 10400(%rsp), %ymm0
vpsubw 10816(%rsp), %ymm0, %ymm0
vmovdqa 7904(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11232(%rsp), %ymm1, %ymm6
vpsubw 9984(%rsp), %ymm0, %ymm0
vpaddw 7488(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10400(%rsp)
vmovdqa 10432(%rsp), %ymm0
vpsubw 10848(%rsp), %ymm0, %ymm0
vmovdqa 7936(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11264(%rsp), %ymm1, %ymm7
vpsubw 10016(%rsp), %ymm0, %ymm0
vpaddw 7520(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10432(%rsp)
vmovdqa 10464(%rsp), %ymm0
vpsubw 10880(%rsp), %ymm0, %ymm0
vmovdqa 7968(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11296(%rsp), %ymm1, %ymm8
vpsubw 10048(%rsp), %ymm0, %ymm0
vpaddw 7552(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10464(%rsp)
vmovdqa 10496(%rsp), %ymm0
vpsubw 10912(%rsp), %ymm0, %ymm0
vmovdqa 8000(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11328(%rsp), %ymm1, %ymm9
vpsubw 10080(%rsp), %ymm0, %ymm0
vpaddw 7584(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10496(%rsp)
vmovdqa 10528(%rsp), %ymm0
vpsubw 10944(%rsp), %ymm0, %ymm0
vmovdqa 8032(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11360(%rsp), %ymm1, %ymm10
vpsubw 10112(%rsp), %ymm0, %ymm0
vpaddw 7616(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10528(%rsp)
vmovdqa 10560(%rsp), %ymm0
vpsubw 10976(%rsp), %ymm0, %ymm0
vmovdqa 8064(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11392(%rsp), %ymm1, %ymm11
vpsubw 10144(%rsp), %ymm0, %ymm0
vpaddw 7648(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10560(%rsp)
vmovdqa 10592(%rsp), %ymm0
vpsubw 11008(%rsp), %ymm0, %ymm0
vmovdqa 8096(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11424(%rsp), %ymm1, %ymm12
vpsubw 10176(%rsp), %ymm0, %ymm0
vpaddw 7680(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10592(%rsp)
vmovdqa 10624(%rsp), %ymm0
vpsubw 11040(%rsp), %ymm0, %ymm0
vmovdqa 8128(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11456(%rsp), %ymm1, %ymm13
vpsubw 10208(%rsp), %ymm0, %ymm0
vpaddw 7712(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10624(%rsp)
vmovdqa 10656(%rsp), %ymm0
vpsubw 11072(%rsp), %ymm0, %ymm0
vmovdqa 8160(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11488(%rsp), %ymm1, %ymm14
vpsubw 10240(%rsp), %ymm0, %ymm0
vpaddw 7744(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10656(%rsp)
vmovdqa 10688(%rsp), %ymm0
vpsubw 11104(%rsp), %ymm0, %ymm0
vmovdqa 8192(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11520(%rsp), %ymm1, %ymm15
vpsubw 10272(%rsp), %ymm0, %ymm0
vpaddw 7776(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 10688(%rsp)
vmovdqa 7808(%rsp), %ymm0
vpsubw 10304(%rsp), %ymm0, %ymm0
vpsubw 11136(%rsp), %ymm0, %ymm0
vpsubw 4128(%r10), %ymm0, %ymm0
vpsubw 5792(%r10), %ymm0, %ymm0
vmovdqa %ymm0, 4960(%r10)
vmovdqa 4160(%r10), %ymm0
vpsubw 4992(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm4, %ymm4
vpsubw 5824(%r10), %ymm4, %ymm4
vpsubw 3328(%r10), %ymm0, %ymm0
vpaddw 9920(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4160(%r10)
vmovdqa %ymm4, 4992(%r10)
vmovdqa 4192(%r10), %ymm0
vpsubw 5024(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm5, %ymm5
vpsubw 5856(%r10), %ymm5, %ymm5
vpsubw 3360(%r10), %ymm0, %ymm0
vpaddw 9952(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4192(%r10)
vmovdqa %ymm5, 5024(%r10)
vmovdqa 4224(%r10), %ymm0
vpsubw 5056(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm6, %ymm6
vpsubw 5888(%r10), %ymm6, %ymm6
vpsubw 3392(%r10), %ymm0, %ymm0
vpaddw 9984(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4224(%r10)
vmovdqa %ymm6, 5056(%r10)
vmovdqa 4256(%r10), %ymm0
vpsubw 5088(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm7, %ymm7
vpsubw 5920(%r10), %ymm7, %ymm7
vpsubw 3424(%r10), %ymm0, %ymm0
vpaddw 10016(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4256(%r10)
vmovdqa %ymm7, 5088(%r10)
vmovdqa 4288(%r10), %ymm0
vpsubw 5120(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm8, %ymm8
vpsubw 5952(%r10), %ymm8, %ymm8
vpsubw 3456(%r10), %ymm0, %ymm0
vpaddw 10048(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4288(%r10)
vmovdqa %ymm8, 5120(%r10)
vmovdqa 4320(%r10), %ymm0
vpsubw 5152(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm9, %ymm9
vpsubw 5984(%r10), %ymm9, %ymm9
vpsubw 3488(%r10), %ymm0, %ymm0
vpaddw 10080(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4320(%r10)
vmovdqa %ymm9, 5152(%r10)
vmovdqa 4352(%r10), %ymm0
vpsubw 5184(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm10, %ymm10
vpsubw 6016(%r10), %ymm10, %ymm10
vpsubw 3520(%r10), %ymm0, %ymm0
vpaddw 10112(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4352(%r10)
vmovdqa %ymm10, 5184(%r10)
vmovdqa 4384(%r10), %ymm0
vpsubw 5216(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm11, %ymm11
vpsubw 6048(%r10), %ymm11, %ymm11
vpsubw 3552(%r10), %ymm0, %ymm0
vpaddw 10144(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4384(%r10)
vmovdqa %ymm11, 5216(%r10)
vmovdqa 4416(%r10), %ymm0
vpsubw 5248(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm12, %ymm12
vpsubw 6080(%r10), %ymm12, %ymm12
vpsubw 3584(%r10), %ymm0, %ymm0
vpaddw 10176(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4416(%r10)
vmovdqa %ymm12, 5248(%r10)
vmovdqa 4448(%r10), %ymm0
vpsubw 5280(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm13, %ymm13
vpsubw 6112(%r10), %ymm13, %ymm13
vpsubw 3616(%r10), %ymm0, %ymm0
vpaddw 10208(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4448(%r10)
vmovdqa %ymm13, 5280(%r10)
vmovdqa 4480(%r10), %ymm0
vpsubw 5312(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm14, %ymm14
vpsubw 6144(%r10), %ymm14, %ymm14
vpsubw 3648(%r10), %ymm0, %ymm0
vpaddw 10240(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4480(%r10)
vmovdqa %ymm14, 5312(%r10)
vmovdqa 4512(%r10), %ymm0
vpsubw 5344(%r10), %ymm0, %ymm0
vpsubw %ymm0, %ymm15, %ymm15
vpsubw 6176(%r10), %ymm15, %ymm15
vpsubw 3680(%r10), %ymm0, %ymm0
vpaddw 10272(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4512(%r10)
vmovdqa %ymm15, 5344(%r10)
vmovdqa 4544(%r10), %ymm0
vpsubw 5376(%r10), %ymm0, %ymm0
vmovdqa 11136(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6208(%r10), %ymm1, %ymm1
vpsubw 3712(%r10), %ymm0, %ymm0
vpaddw 10304(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4544(%r10)
vmovdqa %ymm1, 5376(%r10)
vmovdqa 4576(%r10), %ymm0
vpsubw 5408(%r10), %ymm0, %ymm0
vmovdqa 11168(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6240(%r10), %ymm1, %ymm1
vpsubw 3744(%r10), %ymm0, %ymm0
vpaddw 10336(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4576(%r10)
vmovdqa %ymm1, 5408(%r10)
vmovdqa 4608(%r10), %ymm0
vpsubw 5440(%r10), %ymm0, %ymm0
vmovdqa 11200(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6272(%r10), %ymm1, %ymm1
vpsubw 3776(%r10), %ymm0, %ymm0
vpaddw 10368(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4608(%r10)
vmovdqa %ymm1, 5440(%r10)
vmovdqa 4640(%r10), %ymm0
vpsubw 5472(%r10), %ymm0, %ymm0
vmovdqa 11232(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6304(%r10), %ymm1, %ymm1
vpsubw 3808(%r10), %ymm0, %ymm0
vpaddw 10400(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4640(%r10)
vmovdqa %ymm1, 5472(%r10)
vmovdqa 4672(%r10), %ymm0
vpsubw 5504(%r10), %ymm0, %ymm0
vmovdqa 11264(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6336(%r10), %ymm1, %ymm1
vpsubw 3840(%r10), %ymm0, %ymm0
vpaddw 10432(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4672(%r10)
vmovdqa %ymm1, 5504(%r10)
vmovdqa 4704(%r10), %ymm0
vpsubw 5536(%r10), %ymm0, %ymm0
vmovdqa 11296(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6368(%r10), %ymm1, %ymm1
vpsubw 3872(%r10), %ymm0, %ymm0
vpaddw 10464(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4704(%r10)
vmovdqa %ymm1, 5536(%r10)
vmovdqa 4736(%r10), %ymm0
vpsubw 5568(%r10), %ymm0, %ymm0
vmovdqa 11328(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6400(%r10), %ymm1, %ymm1
vpsubw 3904(%r10), %ymm0, %ymm0
vpaddw 10496(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4736(%r10)
vmovdqa %ymm1, 5568(%r10)
vmovdqa 4768(%r10), %ymm0
vpsubw 5600(%r10), %ymm0, %ymm0
vmovdqa 11360(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6432(%r10), %ymm1, %ymm1
vpsubw 3936(%r10), %ymm0, %ymm0
vpaddw 10528(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4768(%r10)
vmovdqa %ymm1, 5600(%r10)
vmovdqa 4800(%r10), %ymm0
vpsubw 5632(%r10), %ymm0, %ymm0
vmovdqa 11392(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6464(%r10), %ymm1, %ymm1
vpsubw 3968(%r10), %ymm0, %ymm0
vpaddw 10560(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4800(%r10)
vmovdqa %ymm1, 5632(%r10)
vmovdqa 4832(%r10), %ymm0
vpsubw 5664(%r10), %ymm0, %ymm0
vmovdqa 11424(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6496(%r10), %ymm1, %ymm1
vpsubw 4000(%r10), %ymm0, %ymm0
vpaddw 10592(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4832(%r10)
vmovdqa %ymm1, 5664(%r10)
vmovdqa 4864(%r10), %ymm0
vpsubw 5696(%r10), %ymm0, %ymm0
vmovdqa 11456(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6528(%r10), %ymm1, %ymm1
vpsubw 4032(%r10), %ymm0, %ymm0
vpaddw 10624(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4864(%r10)
vmovdqa %ymm1, 5696(%r10)
vmovdqa 4896(%r10), %ymm0
vpsubw 5728(%r10), %ymm0, %ymm0
vmovdqa 11488(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6560(%r10), %ymm1, %ymm1
vpsubw 4064(%r10), %ymm0, %ymm0
vpaddw 10656(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4896(%r10)
vmovdqa %ymm1, 5728(%r10)
vmovdqa 4928(%r10), %ymm0
vpsubw 5760(%r10), %ymm0, %ymm0
vmovdqa 11520(%rsp), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 6592(%r10), %ymm1, %ymm1
vpsubw 4096(%r10), %ymm0, %ymm0
vpaddw 10688(%rsp), %ymm0, %ymm0
vmovdqa %ymm0, 4928(%r10)
vmovdqa %ymm1, 5760(%r10)
vpxor %ymm1, %ymm1, %ymm1
vmovdqa %ymm1, 6624(%r10)
subq $32, %rsp
vmovdqa 3328(%r10), %ymm0
vmovdqa 3392(%r10), %ymm1
vmovdqa 3456(%r10), %ymm2
vmovdqa 3520(%r10), %ymm3
vpunpcklwd 3360(%r10), %ymm0, %ymm4
vpunpckhwd 3360(%r10), %ymm0, %ymm5
vpunpcklwd 3424(%r10), %ymm1, %ymm6
vpunpckhwd 3424(%r10), %ymm1, %ymm7
vpunpcklwd 3488(%r10), %ymm2, %ymm8
vpunpckhwd 3488(%r10), %ymm2, %ymm9
vpunpcklwd 3552(%r10), %ymm3, %ymm10
vpunpckhwd 3552(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 3584(%r10), %ymm0
vmovdqa 3648(%r10), %ymm1
vmovdqa 3712(%r10), %ymm2
vmovdqa 3776(%r10), %ymm3
vpunpcklwd 3616(%r10), %ymm0, %ymm12
vpunpckhwd 3616(%r10), %ymm0, %ymm13
vpunpcklwd 3680(%r10), %ymm1, %ymm14
vpunpckhwd 3680(%r10), %ymm1, %ymm15
vpunpcklwd 3744(%r10), %ymm2, %ymm0
vpunpckhwd 3744(%r10), %ymm2, %ymm1
vpunpcklwd 3808(%r10), %ymm3, %ymm2
vpunpckhwd 3808(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 0(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 256(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 512(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 768(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1024(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1280(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1536(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2048(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2304(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2560(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2816(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3072(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3328(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3584(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1792(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 3840(%r12)
vmovdqa 3840(%r10), %ymm0
vmovdqa 3904(%r10), %ymm1
vmovdqa 3968(%r10), %ymm2
vmovdqa 4032(%r10), %ymm3
vpunpcklwd 3872(%r10), %ymm0, %ymm4
vpunpckhwd 3872(%r10), %ymm0, %ymm5
vpunpcklwd 3936(%r10), %ymm1, %ymm6
vpunpckhwd 3936(%r10), %ymm1, %ymm7
vpunpcklwd 4000(%r10), %ymm2, %ymm8
vpunpckhwd 4000(%r10), %ymm2, %ymm9
vpunpcklwd 4064(%r10), %ymm3, %ymm10
vpunpckhwd 4064(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 4096(%r10), %ymm0
vmovdqa 4160(%r10), %ymm1
vmovdqa 4224(%r10), %ymm2
vmovdqa 4288(%r10), %ymm3
vpunpcklwd 4128(%r10), %ymm0, %ymm12
vpunpckhwd 4128(%r10), %ymm0, %ymm13
vpunpcklwd 4192(%r10), %ymm1, %ymm14
vpunpckhwd 4192(%r10), %ymm1, %ymm15
vpunpcklwd 4256(%r10), %ymm2, %ymm0
vpunpckhwd 4256(%r10), %ymm2, %ymm1
vpunpcklwd 4320(%r10), %ymm3, %ymm2
vpunpckhwd 4320(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 32(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 288(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 544(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 800(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1056(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1312(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1568(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2080(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2336(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2592(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2848(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3104(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3360(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3616(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1824(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 3872(%r12)
vmovdqa 4352(%r10), %ymm0
vmovdqa 4416(%r10), %ymm1
vmovdqa 4480(%r10), %ymm2
vmovdqa 4544(%r10), %ymm3
vpunpcklwd 4384(%r10), %ymm0, %ymm4
vpunpckhwd 4384(%r10), %ymm0, %ymm5
vpunpcklwd 4448(%r10), %ymm1, %ymm6
vpunpckhwd 4448(%r10), %ymm1, %ymm7
vpunpcklwd 4512(%r10), %ymm2, %ymm8
vpunpckhwd 4512(%r10), %ymm2, %ymm9
vpunpcklwd 4576(%r10), %ymm3, %ymm10
vpunpckhwd 4576(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 4608(%r10), %ymm0
vmovdqa 4672(%r10), %ymm1
vmovdqa 4736(%r10), %ymm2
vmovdqa 4800(%r10), %ymm3
vpunpcklwd 4640(%r10), %ymm0, %ymm12
vpunpckhwd 4640(%r10), %ymm0, %ymm13
vpunpcklwd 4704(%r10), %ymm1, %ymm14
vpunpckhwd 4704(%r10), %ymm1, %ymm15
vpunpcklwd 4768(%r10), %ymm2, %ymm0
vpunpckhwd 4768(%r10), %ymm2, %ymm1
vpunpcklwd 4832(%r10), %ymm3, %ymm2
vpunpckhwd 4832(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 64(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 320(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 576(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 832(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1088(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1344(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1600(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2112(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2368(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2624(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2880(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3136(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3392(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3648(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1856(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 3904(%r12)
vmovdqa 4864(%r10), %ymm0
vmovdqa 4928(%r10), %ymm1
vmovdqa 4992(%r10), %ymm2
vmovdqa 5056(%r10), %ymm3
vpunpcklwd 4896(%r10), %ymm0, %ymm4
vpunpckhwd 4896(%r10), %ymm0, %ymm5
vpunpcklwd 4960(%r10), %ymm1, %ymm6
vpunpckhwd 4960(%r10), %ymm1, %ymm7
vpunpcklwd 5024(%r10), %ymm2, %ymm8
vpunpckhwd 5024(%r10), %ymm2, %ymm9
vpunpcklwd 5088(%r10), %ymm3, %ymm10
vpunpckhwd 5088(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 5120(%r10), %ymm0
vmovdqa 5184(%r10), %ymm1
vmovdqa 5248(%r10), %ymm2
vmovdqa 5312(%r10), %ymm3
vpunpcklwd 5152(%r10), %ymm0, %ymm12
vpunpckhwd 5152(%r10), %ymm0, %ymm13
vpunpcklwd 5216(%r10), %ymm1, %ymm14
vpunpckhwd 5216(%r10), %ymm1, %ymm15
vpunpcklwd 5280(%r10), %ymm2, %ymm0
vpunpckhwd 5280(%r10), %ymm2, %ymm1
vpunpcklwd 5344(%r10), %ymm3, %ymm2
vpunpckhwd 5344(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 96(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 352(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 608(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 864(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1120(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1376(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1632(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2144(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2400(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2656(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2912(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3168(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3424(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3680(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1888(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 3936(%r12)
vmovdqa 4992(%r10), %ymm0
vmovdqa 5056(%r10), %ymm1
vmovdqa 5120(%r10), %ymm2
vmovdqa 5184(%r10), %ymm3
vpunpcklwd 5024(%r10), %ymm0, %ymm4
vpunpckhwd 5024(%r10), %ymm0, %ymm5
vpunpcklwd 5088(%r10), %ymm1, %ymm6
vpunpckhwd 5088(%r10), %ymm1, %ymm7
vpunpcklwd 5152(%r10), %ymm2, %ymm8
vpunpckhwd 5152(%r10), %ymm2, %ymm9
vpunpcklwd 5216(%r10), %ymm3, %ymm10
vpunpckhwd 5216(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 5248(%r10), %ymm0
vmovdqa 5312(%r10), %ymm1
vmovdqa 5376(%r10), %ymm2
vmovdqa 5440(%r10), %ymm3
vpunpcklwd 5280(%r10), %ymm0, %ymm12
vpunpckhwd 5280(%r10), %ymm0, %ymm13
vpunpcklwd 5344(%r10), %ymm1, %ymm14
vpunpckhwd 5344(%r10), %ymm1, %ymm15
vpunpcklwd 5408(%r10), %ymm2, %ymm0
vpunpckhwd 5408(%r10), %ymm2, %ymm1
vpunpcklwd 5472(%r10), %ymm3, %ymm2
vpunpckhwd 5472(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 128(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 384(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 640(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 896(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1152(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1408(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1664(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2176(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2432(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2688(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2944(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3200(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3456(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3712(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1920(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 3968(%r12)
vmovdqa 5504(%r10), %ymm0
vmovdqa 5568(%r10), %ymm1
vmovdqa 5632(%r10), %ymm2
vmovdqa 5696(%r10), %ymm3
vpunpcklwd 5536(%r10), %ymm0, %ymm4
vpunpckhwd 5536(%r10), %ymm0, %ymm5
vpunpcklwd 5600(%r10), %ymm1, %ymm6
vpunpckhwd 5600(%r10), %ymm1, %ymm7
vpunpcklwd 5664(%r10), %ymm2, %ymm8
vpunpckhwd 5664(%r10), %ymm2, %ymm9
vpunpcklwd 5728(%r10), %ymm3, %ymm10
vpunpckhwd 5728(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 5760(%r10), %ymm0
vmovdqa 5824(%r10), %ymm1
vmovdqa 5888(%r10), %ymm2
vmovdqa 5952(%r10), %ymm3
vpunpcklwd 5792(%r10), %ymm0, %ymm12
vpunpckhwd 5792(%r10), %ymm0, %ymm13
vpunpcklwd 5856(%r10), %ymm1, %ymm14
vpunpckhwd 5856(%r10), %ymm1, %ymm15
vpunpcklwd 5920(%r10), %ymm2, %ymm0
vpunpckhwd 5920(%r10), %ymm2, %ymm1
vpunpcklwd 5984(%r10), %ymm3, %ymm2
vpunpckhwd 5984(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 160(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 416(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 672(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 928(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1184(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1440(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1696(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2208(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2464(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2720(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 2976(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3232(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3488(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3744(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1952(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 4000(%r12)
vmovdqa 6016(%r10), %ymm0
vmovdqa 6080(%r10), %ymm1
vmovdqa 6144(%r10), %ymm2
vmovdqa 6208(%r10), %ymm3
vpunpcklwd 6048(%r10), %ymm0, %ymm4
vpunpckhwd 6048(%r10), %ymm0, %ymm5
vpunpcklwd 6112(%r10), %ymm1, %ymm6
vpunpckhwd 6112(%r10), %ymm1, %ymm7
vpunpcklwd 6176(%r10), %ymm2, %ymm8
vpunpckhwd 6176(%r10), %ymm2, %ymm9
vpunpcklwd 6240(%r10), %ymm3, %ymm10
vpunpckhwd 6240(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 6272(%r10), %ymm0
vmovdqa 6336(%r10), %ymm1
vmovdqa 6400(%r10), %ymm2
vmovdqa 6464(%r10), %ymm3
vpunpcklwd 6304(%r10), %ymm0, %ymm12
vpunpckhwd 6304(%r10), %ymm0, %ymm13
vpunpcklwd 6368(%r10), %ymm1, %ymm14
vpunpckhwd 6368(%r10), %ymm1, %ymm15
vpunpcklwd 6432(%r10), %ymm2, %ymm0
vpunpckhwd 6432(%r10), %ymm2, %ymm1
vpunpcklwd 6496(%r10), %ymm3, %ymm2
vpunpckhwd 6496(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 192(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 448(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 704(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 960(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1216(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1472(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1728(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2240(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2496(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2752(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 3008(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3264(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3520(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3776(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 1984(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 4032(%r12)
vmovdqa 6528(%r10), %ymm0
vmovdqa 6592(%r10), %ymm1
vmovdqa 6656(%r10), %ymm2
vmovdqa 6720(%r10), %ymm3
vpunpcklwd 6560(%r10), %ymm0, %ymm4
vpunpckhwd 6560(%r10), %ymm0, %ymm5
vpunpcklwd 6624(%r10), %ymm1, %ymm6
vpunpckhwd 6624(%r10), %ymm1, %ymm7
vpunpcklwd 6688(%r10), %ymm2, %ymm8
vpunpckhwd 6688(%r10), %ymm2, %ymm9
vpunpcklwd 6752(%r10), %ymm3, %ymm10
vpunpckhwd 6752(%r10), %ymm3, %ymm11
vpunpckldq %ymm6, %ymm4, %ymm0
vpunpckhdq %ymm6, %ymm4, %ymm1
vpunpckldq %ymm7, %ymm5, %ymm2
vpunpckhdq %ymm7, %ymm5, %ymm3
vpunpckldq %ymm10, %ymm8, %ymm12
vpunpckhdq %ymm10, %ymm8, %ymm13
vpunpckldq %ymm11, %ymm9, %ymm14
vpunpckhdq %ymm11, %ymm9, %ymm15
vpunpcklqdq %ymm12, %ymm0, %ymm4
vpunpckhqdq %ymm12, %ymm0, %ymm5
vpunpcklqdq %ymm13, %ymm1, %ymm6
vpunpckhqdq %ymm13, %ymm1, %ymm7
vpunpcklqdq %ymm14, %ymm2, %ymm8
vpunpckhqdq %ymm14, %ymm2, %ymm9
vpunpcklqdq %ymm15, %ymm3, %ymm10
vpunpckhqdq %ymm15, %ymm3, %ymm11
vmovdqa 6784(%r10), %ymm0
vmovdqa 6848(%r10), %ymm1
vmovdqa 6912(%r10), %ymm2
vmovdqa 6976(%r10), %ymm3
vpunpcklwd 6816(%r10), %ymm0, %ymm12
vpunpckhwd 6816(%r10), %ymm0, %ymm13
vpunpcklwd 6880(%r10), %ymm1, %ymm14
vpunpckhwd 6880(%r10), %ymm1, %ymm15
vpunpcklwd 6944(%r10), %ymm2, %ymm0
vpunpckhwd 6944(%r10), %ymm2, %ymm1
vpunpcklwd 7008(%r10), %ymm3, %ymm2
vpunpckhwd 7008(%r10), %ymm3, %ymm3
vmovdqa %ymm11, 0(%rsp)
vpunpckldq %ymm14, %ymm12, %ymm11
vpunpckhdq %ymm14, %ymm12, %ymm12
vpunpckldq %ymm15, %ymm13, %ymm14
vpunpckhdq %ymm15, %ymm13, %ymm15
vpunpckldq %ymm2, %ymm0, %ymm13
vpunpckhdq %ymm2, %ymm0, %ymm0
vpunpckldq %ymm3, %ymm1, %ymm2
vpunpckhdq %ymm3, %ymm1, %ymm1
vpunpcklqdq %ymm13, %ymm11, %ymm3
vpunpckhqdq %ymm13, %ymm11, %ymm13
vpunpcklqdq %ymm0, %ymm12, %ymm11
vpunpckhqdq %ymm0, %ymm12, %ymm0
vpunpcklqdq %ymm2, %ymm14, %ymm12
vpunpckhqdq %ymm2, %ymm14, %ymm2
vpunpcklqdq %ymm1, %ymm15, %ymm14
vpunpckhqdq %ymm1, %ymm15, %ymm1
vinserti128 $1, %xmm3, %ymm4, %ymm15
vmovdqa %ymm15, 224(%r12)
vinserti128 $1, %xmm13, %ymm5, %ymm15
vmovdqa %ymm15, 480(%r12)
vinserti128 $1, %xmm11, %ymm6, %ymm15
vmovdqa %ymm15, 736(%r12)
vinserti128 $1, %xmm0, %ymm7, %ymm15
vmovdqa %ymm15, 992(%r12)
vinserti128 $1, %xmm12, %ymm8, %ymm15
vmovdqa %ymm15, 1248(%r12)
vinserti128 $1, %xmm2, %ymm9, %ymm15
vmovdqa %ymm15, 1504(%r12)
vinserti128 $1, %xmm14, %ymm10, %ymm15
vmovdqa %ymm15, 1760(%r12)
vpermq $78, %ymm4, %ymm4
vpermq $78, %ymm5, %ymm5
vpermq $78, %ymm6, %ymm6
vpermq $78, %ymm7, %ymm7
vpermq $78, %ymm8, %ymm8
vpermq $78, %ymm9, %ymm9
vpermq $78, %ymm10, %ymm10
vinserti128 $0, %xmm4, %ymm3, %ymm15
vmovdqa %ymm15, 2272(%r12)
vinserti128 $0, %xmm5, %ymm13, %ymm15
vmovdqa %ymm15, 2528(%r12)
vinserti128 $0, %xmm6, %ymm11, %ymm15
vmovdqa %ymm15, 2784(%r12)
vinserti128 $0, %xmm7, %ymm0, %ymm15
vmovdqa %ymm15, 3040(%r12)
vinserti128 $0, %xmm8, %ymm12, %ymm15
vmovdqa %ymm15, 3296(%r12)
vinserti128 $0, %xmm9, %ymm2, %ymm15
vmovdqa %ymm15, 3552(%r12)
vinserti128 $0, %xmm10, %ymm14, %ymm15
vmovdqa %ymm15, 3808(%r12)
vmovdqa 0(%rsp), %ymm11
vinserti128 $1, %xmm1, %ymm11, %ymm14
vmovdqa %ymm14, 2016(%r12)
vpermq $78, %ymm11, %ymm11
vinserti128 $0, %xmm11, %ymm1, %ymm1
vmovdqa %ymm1, 4064(%r12)
addq $32, %rsp
add $2048, %rax
add $2048, %r11
add $4096, %r12
dec %ecx
jnz karatsuba_loop_1
sub $16384, %r12
add $11584, %rsp
subq $1280, %rsp
vmovdqa const729(%rip), %ymm15
vmovdqa const3_inv(%rip), %ymm14
vmovdqa const5_inv(%rip), %ymm13
vmovdqa const9(%rip), %ymm12
vmovdqa 128(%r12), %ymm0
vpsubw 256(%r12), %ymm0, %ymm0
vmovdqa 640(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 384(%r12), %ymm1, %ymm1
vpsubw 0(%r12), %ymm0, %ymm0
vpaddw 512(%r12), %ymm0, %ymm0
vmovdqa 896(%r12), %ymm2
vpsubw 1024(%r12), %ymm2, %ymm2
vmovdqa 1408(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 1152(%r12), %ymm3, %ymm3
vpsubw 768(%r12), %ymm2, %ymm2
vpaddw 1280(%r12), %ymm2, %ymm2
vmovdqa 1664(%r12), %ymm4
vpsubw 1792(%r12), %ymm4, %ymm4
vmovdqa 2176(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 1920(%r12), %ymm5, %ymm5
vpsubw 1536(%r12), %ymm4, %ymm4
vpaddw 2048(%r12), %ymm4, %ymm4
vpsubw 768(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 0(%r12), %ymm1, %ymm1
vpaddw 1536(%r12), %ymm1, %ymm1
vmovdqa 384(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 1920(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 1152(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 0(%r12), %ymm8
vmovdqa 1152(%r12), %ymm9
vmovdqa %ymm8, 0(%rsp)
vmovdqa %ymm0, 32(%rsp)
vmovdqa %ymm1, 64(%rsp)
vmovdqa %ymm7, 96(%rsp)
vmovdqa %ymm5, 128(%rsp)
vmovdqa %ymm2, 160(%rsp)
vmovdqa %ymm3, 192(%rsp)
vmovdqa %ymm9, 224(%rsp)
vmovdqa 2432(%r12), %ymm0
vpsubw 2560(%r12), %ymm0, %ymm0
vmovdqa 2944(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 2688(%r12), %ymm1, %ymm1
vpsubw 2304(%r12), %ymm0, %ymm0
vpaddw 2816(%r12), %ymm0, %ymm0
vmovdqa 3200(%r12), %ymm2
vpsubw 3328(%r12), %ymm2, %ymm2
vmovdqa 3712(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 3456(%r12), %ymm3, %ymm3
vpsubw 3072(%r12), %ymm2, %ymm2
vpaddw 3584(%r12), %ymm2, %ymm2
vmovdqa 3968(%r12), %ymm4
vpsubw 4096(%r12), %ymm4, %ymm4
vmovdqa 4480(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 4224(%r12), %ymm5, %ymm5
vpsubw 3840(%r12), %ymm4, %ymm4
vpaddw 4352(%r12), %ymm4, %ymm4
vpsubw 3072(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 2304(%r12), %ymm1, %ymm1
vpaddw 3840(%r12), %ymm1, %ymm1
vmovdqa 2688(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 4224(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 3456(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 2304(%r12), %ymm8
vmovdqa 3456(%r12), %ymm9
vmovdqa %ymm8, 256(%rsp)
vmovdqa %ymm0, 288(%rsp)
vmovdqa %ymm1, 320(%rsp)
vmovdqa %ymm7, 352(%rsp)
vmovdqa %ymm5, 384(%rsp)
vmovdqa %ymm2, 416(%rsp)
vmovdqa %ymm3, 448(%rsp)
vmovdqa %ymm9, 480(%rsp)
vmovdqa 4736(%r12), %ymm0
vpsubw 4864(%r12), %ymm0, %ymm0
vmovdqa 5248(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 4992(%r12), %ymm1, %ymm1
vpsubw 4608(%r12), %ymm0, %ymm0
vpaddw 5120(%r12), %ymm0, %ymm0
vmovdqa 5504(%r12), %ymm2
vpsubw 5632(%r12), %ymm2, %ymm2
vmovdqa 6016(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 5760(%r12), %ymm3, %ymm3
vpsubw 5376(%r12), %ymm2, %ymm2
vpaddw 5888(%r12), %ymm2, %ymm2
vmovdqa 6272(%r12), %ymm4
vpsubw 6400(%r12), %ymm4, %ymm4
vmovdqa 6784(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 6528(%r12), %ymm5, %ymm5
vpsubw 6144(%r12), %ymm4, %ymm4
vpaddw 6656(%r12), %ymm4, %ymm4
vpsubw 5376(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 4608(%r12), %ymm1, %ymm1
vpaddw 6144(%r12), %ymm1, %ymm1
vmovdqa 4992(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 6528(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 5760(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 4608(%r12), %ymm8
vmovdqa 5760(%r12), %ymm9
vmovdqa %ymm8, 512(%rsp)
vmovdqa %ymm0, 544(%rsp)
vmovdqa %ymm1, 576(%rsp)
vmovdqa %ymm7, 608(%rsp)
vmovdqa %ymm5, 640(%rsp)
vmovdqa %ymm2, 672(%rsp)
vmovdqa %ymm3, 704(%rsp)
vmovdqa %ymm9, 736(%rsp)
vmovdqa 7040(%r12), %ymm0
vpsubw 7168(%r12), %ymm0, %ymm0
vmovdqa 7552(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 7296(%r12), %ymm1, %ymm1
vpsubw 6912(%r12), %ymm0, %ymm0
vpaddw 7424(%r12), %ymm0, %ymm0
vmovdqa 7808(%r12), %ymm2
vpsubw 7936(%r12), %ymm2, %ymm2
vmovdqa 8320(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 8064(%r12), %ymm3, %ymm3
vpsubw 7680(%r12), %ymm2, %ymm2
vpaddw 8192(%r12), %ymm2, %ymm2
vmovdqa 8576(%r12), %ymm4
vpsubw 8704(%r12), %ymm4, %ymm4
vmovdqa 9088(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 8832(%r12), %ymm5, %ymm5
vpsubw 8448(%r12), %ymm4, %ymm4
vpaddw 8960(%r12), %ymm4, %ymm4
vpsubw 7680(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 6912(%r12), %ymm1, %ymm1
vpaddw 8448(%r12), %ymm1, %ymm1
vmovdqa 7296(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 8832(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 8064(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 6912(%r12), %ymm8
vmovdqa 8064(%r12), %ymm9
vmovdqa %ymm8, 768(%rsp)
vmovdqa %ymm0, 800(%rsp)
vmovdqa %ymm1, 832(%rsp)
vmovdqa %ymm7, 864(%rsp)
vmovdqa %ymm5, 896(%rsp)
vmovdqa %ymm2, 928(%rsp)
vmovdqa %ymm3, 960(%rsp)
vmovdqa %ymm9, 992(%rsp)
vmovdqa 9344(%r12), %ymm0
vpsubw 9472(%r12), %ymm0, %ymm0
vmovdqa 9856(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 9600(%r12), %ymm1, %ymm1
vpsubw 9216(%r12), %ymm0, %ymm0
vpaddw 9728(%r12), %ymm0, %ymm0
vmovdqa 10112(%r12), %ymm2
vpsubw 10240(%r12), %ymm2, %ymm2
vmovdqa 10624(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 10368(%r12), %ymm3, %ymm3
vpsubw 9984(%r12), %ymm2, %ymm2
vpaddw 10496(%r12), %ymm2, %ymm2
vmovdqa 10880(%r12), %ymm4
vpsubw 11008(%r12), %ymm4, %ymm4
vmovdqa 11392(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 11136(%r12), %ymm5, %ymm5
vpsubw 10752(%r12), %ymm4, %ymm4
vpaddw 11264(%r12), %ymm4, %ymm4
vpsubw 9984(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 9216(%r12), %ymm1, %ymm1
vpaddw 10752(%r12), %ymm1, %ymm1
vmovdqa 9600(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 11136(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 10368(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 9216(%r12), %ymm8
vmovdqa 10368(%r12), %ymm9
vmovdqa %ymm8, 1024(%rsp)
vmovdqa %ymm0, 1056(%rsp)
vmovdqa %ymm1, 1088(%rsp)
vmovdqa %ymm7, 1120(%rsp)
vmovdqa %ymm5, 1152(%rsp)
vmovdqa %ymm2, 1184(%rsp)
vmovdqa %ymm3, 1216(%rsp)
vmovdqa %ymm9, 1248(%rsp)
vmovdqa 11648(%r12), %ymm0
vpsubw 11776(%r12), %ymm0, %ymm0
vmovdqa 12160(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11904(%r12), %ymm1, %ymm1
vpsubw 11520(%r12), %ymm0, %ymm0
vpaddw 12032(%r12), %ymm0, %ymm0
vmovdqa 12416(%r12), %ymm2
vpsubw 12544(%r12), %ymm2, %ymm2
vmovdqa 12928(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 12672(%r12), %ymm3, %ymm3
vpsubw 12288(%r12), %ymm2, %ymm2
vpaddw 12800(%r12), %ymm2, %ymm2
vmovdqa 13184(%r12), %ymm4
vpsubw 13312(%r12), %ymm4, %ymm4
vmovdqa 13696(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 13440(%r12), %ymm5, %ymm5
vpsubw 13056(%r12), %ymm4, %ymm4
vpaddw 13568(%r12), %ymm4, %ymm4
vpsubw 12288(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 11520(%r12), %ymm1, %ymm1
vpaddw 13056(%r12), %ymm1, %ymm1
vmovdqa 11904(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 13440(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 12672(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 11520(%r12), %ymm8
vmovdqa 12672(%r12), %ymm9
vmovdqa %ymm8, 1280(%rsp)
vmovdqa %ymm0, 1312(%rsp)
vmovdqa %ymm1, 1344(%rsp)
vmovdqa %ymm7, 1376(%rsp)
vmovdqa %ymm5, 1408(%rsp)
vmovdqa %ymm2, 1440(%rsp)
vmovdqa %ymm3, 1472(%rsp)
vmovdqa %ymm9, 1504(%rsp)
vmovdqa 13952(%r12), %ymm0
vpsubw 14080(%r12), %ymm0, %ymm0
vmovdqa 14464(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 14208(%r12), %ymm1, %ymm1
vpsubw 13824(%r12), %ymm0, %ymm0
vpaddw 14336(%r12), %ymm0, %ymm0
vmovdqa 14720(%r12), %ymm2
vpsubw 14848(%r12), %ymm2, %ymm2
vmovdqa 15232(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 14976(%r12), %ymm3, %ymm3
vpsubw 14592(%r12), %ymm2, %ymm2
vpaddw 15104(%r12), %ymm2, %ymm2
vmovdqa 15488(%r12), %ymm4
vpsubw 15616(%r12), %ymm4, %ymm4
vmovdqa 16000(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 15744(%r12), %ymm5, %ymm5
vpsubw 15360(%r12), %ymm4, %ymm4
vpaddw 15872(%r12), %ymm4, %ymm4
vpsubw 14592(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 13824(%r12), %ymm1, %ymm1
vpaddw 15360(%r12), %ymm1, %ymm1
vmovdqa 14208(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 15744(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 14976(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 13824(%r12), %ymm8
vmovdqa 14976(%r12), %ymm9
vmovdqa %ymm8, 1536(%rsp)
vmovdqa %ymm0, 1568(%rsp)
vmovdqa %ymm1, 1600(%rsp)
vmovdqa %ymm7, 1632(%rsp)
vmovdqa %ymm5, 1664(%rsp)
vmovdqa %ymm2, 1696(%rsp)
vmovdqa %ymm3, 1728(%rsp)
vmovdqa %ymm9, 1760(%rsp)
vmovdqa 0(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vmovdqa 256(%rsp), %ymm8
vpunpcklwd const0(%rip), %ymm8, %ymm7
vpunpckhwd const0(%rip), %ymm8, %ymm8
vmovdqa 512(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm7, %ymm4
vpaddd %ymm6, %ymm8, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm5, %ymm7, %ymm5
vpsubd %ymm6, %ymm8, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1536(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vpsubd %ymm8, %ymm4, %ymm4
vpsubd %ymm7, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpackusdw %ymm3, %ymm4, %ymm3
vmovdqa 768(%rsp), %ymm4
vpaddw 1024(%rsp), %ymm4, %ymm7
vpsubw 1024(%rsp), %ymm4, %ymm4
vpsrlw $2, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsllw $1, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsllw $7, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vmovdqa 1280(%rsp), %ymm8
vpsubw %ymm11, %ymm8, %ymm8
vpmullw %ymm15, %ymm5, %ymm9
vpsubw %ymm9, %ymm8, %ymm9
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpmullw %ymm12, %ymm7, %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpmullw %ymm12, %ymm8, %ymm8
vpsubw %ymm8, %ymm9, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vpmullw %ymm13, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vmovdqu 0(%rdi), %ymm9
vpaddw %ymm9, %ymm11, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 0(%rdi)
vmovdqu 416(%rdi), %ymm9
vpaddw %ymm9, %ymm6, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 416(%rdi)
vmovdqu 832(%rdi), %ymm9
vpaddw %ymm9, %ymm3, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 832(%rdi)
vmovdqu 1248(%rdi), %ymm9
vpaddw %ymm9, %ymm4, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1248(%rdi)
vmovdqu 22(%rdi), %ymm9
vpaddw %ymm9, %ymm7, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 22(%rdi)
vmovdqu 438(%rdi), %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 438(%rdi)
vmovdqu 854(%rdi), %ymm9
vpaddw %ymm9, %ymm5, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 854(%rdi)
vmovdqa 32(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vmovdqa 288(%rsp), %ymm4
vpunpcklwd const0(%rip), %ymm4, %ymm3
vpunpckhwd const0(%rip), %ymm4, %ymm4
vmovdqa 544(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm3, %ymm9
vpaddd %ymm6, %ymm4, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm11, %ymm3, %ymm11
vpsubd %ymm6, %ymm4, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1568(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vpsubd %ymm4, %ymm9, %ymm9
vpsubd %ymm3, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpackusdw %ymm10, %ymm9, %ymm10
vmovdqa 800(%rsp), %ymm9
vpaddw 1056(%rsp), %ymm9, %ymm3
vpsubw 1056(%rsp), %ymm9, %ymm9
vpsrlw $2, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsllw $1, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsllw $7, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vmovdqa 1312(%rsp), %ymm4
vpsubw %ymm5, %ymm4, %ymm4
vpmullw %ymm15, %ymm11, %ymm7
vpsubw %ymm7, %ymm4, %ymm7
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpmullw %ymm12, %ymm3, %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpmullw %ymm12, %ymm4, %ymm4
vpsubw %ymm4, %ymm7, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vpmullw %ymm13, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vmovdqu 104(%rdi), %ymm7
vpaddw %ymm7, %ymm5, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 104(%rdi)
vmovdqu 520(%rdi), %ymm7
vpaddw %ymm7, %ymm6, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 520(%rdi)
vmovdqu 936(%rdi), %ymm7
vpaddw %ymm7, %ymm10, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 936(%rdi)
vmovdqu 1352(%rdi), %ymm7
vpaddw %ymm7, %ymm9, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1352(%rdi)
vmovdqu 126(%rdi), %ymm7
vpaddw %ymm7, %ymm3, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 126(%rdi)
vmovdqu 542(%rdi), %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 542(%rdi)
vmovdqu 958(%rdi), %ymm7
vpaddw %ymm7, %ymm11, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 958(%rdi)
vmovdqa 64(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vmovdqa 320(%rsp), %ymm9
vpunpcklwd const0(%rip), %ymm9, %ymm10
vpunpckhwd const0(%rip), %ymm9, %ymm9
vmovdqa 576(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm10, %ymm7
vpaddd %ymm6, %ymm9, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm5, %ymm10, %ymm5
vpsubd %ymm6, %ymm9, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1600(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vpsubd %ymm9, %ymm7, %ymm7
vpsubd %ymm10, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpackusdw %ymm8, %ymm7, %ymm8
vmovdqa 832(%rsp), %ymm7
vpaddw 1088(%rsp), %ymm7, %ymm10
vpsubw 1088(%rsp), %ymm7, %ymm7
vpsrlw $2, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsllw $1, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsllw $7, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vmovdqa 1344(%rsp), %ymm9
vpsubw %ymm11, %ymm9, %ymm9
vpmullw %ymm15, %ymm5, %ymm3
vpsubw %ymm3, %ymm9, %ymm3
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpmullw %ymm12, %ymm10, %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpmullw %ymm12, %ymm9, %ymm9
vpsubw %ymm9, %ymm3, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vpmullw %ymm13, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vmovdqu 208(%rdi), %ymm3
vpaddw %ymm3, %ymm11, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 208(%rdi)
vmovdqu 624(%rdi), %ymm3
vpaddw %ymm3, %ymm6, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 624(%rdi)
vmovdqu 1040(%rdi), %ymm3
vpaddw %ymm3, %ymm8, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1040(%rdi)
vmovdqu 1456(%rdi), %ymm3
vpaddw %ymm3, %ymm7, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1456(%rdi)
vmovdqu 230(%rdi), %ymm3
vpaddw %ymm3, %ymm10, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 230(%rdi)
vmovdqu 646(%rdi), %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 646(%rdi)
vmovdqu 1062(%rdi), %ymm3
vpaddw %ymm3, %ymm5, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1062(%rdi)
vmovdqa 96(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vmovdqa 352(%rsp), %ymm7
vpunpcklwd const0(%rip), %ymm7, %ymm8
vpunpckhwd const0(%rip), %ymm7, %ymm7
vmovdqa 608(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm8, %ymm3
vpaddd %ymm6, %ymm7, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm11, %ymm8, %ymm11
vpsubd %ymm6, %ymm7, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1632(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vpsubd %ymm7, %ymm3, %ymm3
vpsubd %ymm8, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpackusdw %ymm4, %ymm3, %ymm4
vmovdqa 864(%rsp), %ymm3
vpaddw 1120(%rsp), %ymm3, %ymm8
vpsubw 1120(%rsp), %ymm3, %ymm3
vpsrlw $2, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsllw $1, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsllw $7, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vmovdqa 1376(%rsp), %ymm7
vpsubw %ymm5, %ymm7, %ymm7
vpmullw %ymm15, %ymm11, %ymm10
vpsubw %ymm10, %ymm7, %ymm10
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpmullw %ymm12, %ymm8, %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpmullw %ymm12, %ymm7, %ymm7
vpsubw %ymm7, %ymm10, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vpmullw %ymm13, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vmovdqu 312(%rdi), %ymm10
vpaddw %ymm10, %ymm5, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 312(%rdi)
vmovdqu 728(%rdi), %ymm10
vpaddw %ymm10, %ymm6, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 728(%rdi)
vmovdqu 1144(%rdi), %ymm10
vpaddw %ymm10, %ymm4, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1144(%rdi)
vmovdqu 1560(%rdi), %ymm10
vpaddw %ymm10, %ymm3, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1560(%rdi)
vmovdqu 334(%rdi), %ymm10
vpaddw %ymm10, %ymm8, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 334(%rdi)
vmovdqu 750(%rdi), %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 750(%rdi)
vmovdqu 1166(%rdi), %ymm10
vpaddw %ymm10, %ymm11, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1166(%rdi)
vmovdqa 128(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vmovdqa 384(%rsp), %ymm3
vpunpcklwd const0(%rip), %ymm3, %ymm4
vpunpckhwd const0(%rip), %ymm3, %ymm3
vmovdqa 640(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm4, %ymm10
vpaddd %ymm6, %ymm3, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm5, %ymm4, %ymm5
vpsubd %ymm6, %ymm3, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1664(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vpsubd %ymm3, %ymm10, %ymm10
vpsubd %ymm4, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpackusdw %ymm9, %ymm10, %ymm9
vmovdqa 896(%rsp), %ymm10
vpaddw 1152(%rsp), %ymm10, %ymm4
vpsubw 1152(%rsp), %ymm10, %ymm10
vpsrlw $2, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsllw $1, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsllw $7, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vmovdqa 1408(%rsp), %ymm3
vpsubw %ymm11, %ymm3, %ymm3
vpmullw %ymm15, %ymm5, %ymm8
vpsubw %ymm8, %ymm3, %ymm8
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpmullw %ymm12, %ymm4, %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpmullw %ymm12, %ymm3, %ymm3
vpsubw %ymm3, %ymm8, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vpmullw %ymm13, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vmovdqu 416(%rdi), %ymm8
vpaddw %ymm8, %ymm11, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 416(%rdi)
vmovdqu 832(%rdi), %ymm8
vpaddw %ymm8, %ymm6, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 832(%rdi)
vmovdqu 1248(%rdi), %ymm8
vpaddw %ymm8, %ymm9, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1248(%rdi)
vmovdqu 22(%rdi), %ymm8
vpaddw %ymm8, %ymm10, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 22(%rdi)
vmovdqu 438(%rdi), %ymm8
vpaddw %ymm8, %ymm4, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 438(%rdi)
vmovdqu 854(%rdi), %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 854(%rdi)
vmovdqu 1270(%rdi), %ymm8
vpaddw %ymm8, %ymm5, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1270(%rdi)
vmovdqa 160(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vmovdqa 416(%rsp), %ymm10
vpunpcklwd const0(%rip), %ymm10, %ymm9
vpunpckhwd const0(%rip), %ymm10, %ymm10
vmovdqa 672(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm9, %ymm8
vpaddd %ymm6, %ymm10, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm11, %ymm9, %ymm11
vpsubd %ymm6, %ymm10, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1696(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vpsubd %ymm10, %ymm8, %ymm8
vpsubd %ymm9, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpackusdw %ymm7, %ymm8, %ymm7
vmovdqa 928(%rsp), %ymm8
vpaddw 1184(%rsp), %ymm8, %ymm9
vpsubw 1184(%rsp), %ymm8, %ymm8
vpsrlw $2, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsllw $1, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsllw $7, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vmovdqa 1440(%rsp), %ymm10
vpsubw %ymm5, %ymm10, %ymm10
vpmullw %ymm15, %ymm11, %ymm4
vpsubw %ymm4, %ymm10, %ymm4
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpmullw %ymm12, %ymm9, %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpmullw %ymm12, %ymm10, %ymm10
vpsubw %ymm10, %ymm4, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vpmullw %ymm13, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vmovdqu 520(%rdi), %ymm4
vpaddw %ymm4, %ymm5, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 520(%rdi)
vmovdqu 936(%rdi), %ymm4
vpaddw %ymm4, %ymm6, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 936(%rdi)
vmovdqu 1352(%rdi), %ymm4
vpaddw %ymm4, %ymm7, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1352(%rdi)
vmovdqu 126(%rdi), %ymm4
vpaddw %ymm4, %ymm8, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 126(%rdi)
vmovdqu 542(%rdi), %ymm4
vpaddw %ymm4, %ymm9, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 542(%rdi)
vmovdqu 958(%rdi), %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 958(%rdi)
vmovdqu 1374(%rdi), %ymm4
vpaddw %ymm4, %ymm11, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1374(%rdi)
vmovdqa 192(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vmovdqa 448(%rsp), %ymm8
vpunpcklwd const0(%rip), %ymm8, %ymm7
vpunpckhwd const0(%rip), %ymm8, %ymm8
vmovdqa 704(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm7, %ymm4
vpaddd %ymm6, %ymm8, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm5, %ymm7, %ymm5
vpsubd %ymm6, %ymm8, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1728(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vpsubd %ymm8, %ymm4, %ymm4
vpsubd %ymm7, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpackusdw %ymm3, %ymm4, %ymm3
vmovdqa 960(%rsp), %ymm4
vpaddw 1216(%rsp), %ymm4, %ymm7
vpsubw 1216(%rsp), %ymm4, %ymm4
vpsrlw $2, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsllw $1, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsllw $7, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vmovdqa 1472(%rsp), %ymm8
vpsubw %ymm11, %ymm8, %ymm8
vpmullw %ymm15, %ymm5, %ymm9
vpsubw %ymm9, %ymm8, %ymm9
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpmullw %ymm12, %ymm7, %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpmullw %ymm12, %ymm8, %ymm8
vpsubw %ymm8, %ymm9, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vpmullw %ymm13, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vmovdqu 624(%rdi), %ymm9
vpaddw %ymm9, %ymm11, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 624(%rdi)
vmovdqu 1040(%rdi), %ymm9
vpaddw %ymm9, %ymm6, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1040(%rdi)
vmovdqu 1456(%rdi), %ymm9
vpaddw %ymm9, %ymm3, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1456(%rdi)
vmovdqu 230(%rdi), %ymm9
vpaddw %ymm9, %ymm4, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 230(%rdi)
vmovdqu 646(%rdi), %ymm9
vpaddw %ymm9, %ymm7, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 646(%rdi)
vmovdqu 1062(%rdi), %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1062(%rdi)
vmovdqu 1478(%rdi), %ymm9
vpaddw %ymm9, %ymm5, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1478(%rdi)
vmovdqa 224(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vmovdqa 480(%rsp), %ymm4
vpunpcklwd const0(%rip), %ymm4, %ymm3
vpunpckhwd const0(%rip), %ymm4, %ymm4
vmovdqa 736(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm3, %ymm9
vpaddd %ymm6, %ymm4, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm11, %ymm3, %ymm11
vpsubd %ymm6, %ymm4, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1760(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vpsubd %ymm4, %ymm9, %ymm9
vpsubd %ymm3, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpackusdw %ymm10, %ymm9, %ymm10
vmovdqa 992(%rsp), %ymm9
vpaddw 1248(%rsp), %ymm9, %ymm3
vpsubw 1248(%rsp), %ymm9, %ymm9
vpsrlw $2, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsllw $1, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsllw $7, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vmovdqa 1504(%rsp), %ymm4
vpsubw %ymm5, %ymm4, %ymm4
vpmullw %ymm15, %ymm11, %ymm7
vpsubw %ymm7, %ymm4, %ymm7
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpmullw %ymm12, %ymm3, %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpmullw %ymm12, %ymm4, %ymm4
vpsubw %ymm4, %ymm7, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vpmullw %ymm13, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vmovdqu 728(%rdi), %ymm7
vpaddw %ymm7, %ymm5, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 728(%rdi)
vmovdqu 1144(%rdi), %ymm7
vpaddw %ymm7, %ymm6, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1144(%rdi)
vmovdqu 1560(%rdi), %ymm7
vpaddw %ymm7, %ymm10, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1560(%rdi)
vmovdqu 334(%rdi), %ymm7
vpaddw %ymm7, %ymm9, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 334(%rdi)
vmovdqu 750(%rdi), %ymm7
vpaddw %ymm7, %ymm3, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 750(%rdi)
vmovdqu 1166(%rdi), %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1166(%rdi)
vmovdqu 1582(%rdi), %ymm7
vpaddw %ymm7, %ymm11, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1582(%rdi)
vmovdqa 160(%r12), %ymm0
vpsubw 288(%r12), %ymm0, %ymm0
vmovdqa 672(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 416(%r12), %ymm1, %ymm1
vpsubw 32(%r12), %ymm0, %ymm0
vpaddw 544(%r12), %ymm0, %ymm0
vmovdqa 928(%r12), %ymm2
vpsubw 1056(%r12), %ymm2, %ymm2
vmovdqa 1440(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 1184(%r12), %ymm3, %ymm3
vpsubw 800(%r12), %ymm2, %ymm2
vpaddw 1312(%r12), %ymm2, %ymm2
vmovdqa 1696(%r12), %ymm4
vpsubw 1824(%r12), %ymm4, %ymm4
vmovdqa 2208(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 1952(%r12), %ymm5, %ymm5
vpsubw 1568(%r12), %ymm4, %ymm4
vpaddw 2080(%r12), %ymm4, %ymm4
vpsubw 800(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 32(%r12), %ymm1, %ymm1
vpaddw 1568(%r12), %ymm1, %ymm1
vmovdqa 416(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 1952(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 1184(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 32(%r12), %ymm8
vmovdqa 1184(%r12), %ymm9
vmovdqa %ymm8, 0(%rsp)
vmovdqa %ymm0, 32(%rsp)
vmovdqa %ymm1, 64(%rsp)
vmovdqa %ymm7, 96(%rsp)
vmovdqa %ymm5, 128(%rsp)
vmovdqa %ymm2, 160(%rsp)
vmovdqa %ymm3, 192(%rsp)
vmovdqa %ymm9, 224(%rsp)
vmovdqa 2464(%r12), %ymm0
vpsubw 2592(%r12), %ymm0, %ymm0
vmovdqa 2976(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 2720(%r12), %ymm1, %ymm1
vpsubw 2336(%r12), %ymm0, %ymm0
vpaddw 2848(%r12), %ymm0, %ymm0
vmovdqa 3232(%r12), %ymm2
vpsubw 3360(%r12), %ymm2, %ymm2
vmovdqa 3744(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 3488(%r12), %ymm3, %ymm3
vpsubw 3104(%r12), %ymm2, %ymm2
vpaddw 3616(%r12), %ymm2, %ymm2
vmovdqa 4000(%r12), %ymm4
vpsubw 4128(%r12), %ymm4, %ymm4
vmovdqa 4512(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 4256(%r12), %ymm5, %ymm5
vpsubw 3872(%r12), %ymm4, %ymm4
vpaddw 4384(%r12), %ymm4, %ymm4
vpsubw 3104(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 2336(%r12), %ymm1, %ymm1
vpaddw 3872(%r12), %ymm1, %ymm1
vmovdqa 2720(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 4256(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 3488(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 2336(%r12), %ymm8
vmovdqa 3488(%r12), %ymm9
vmovdqa %ymm8, 256(%rsp)
vmovdqa %ymm0, 288(%rsp)
vmovdqa %ymm1, 320(%rsp)
vmovdqa %ymm7, 352(%rsp)
vmovdqa %ymm5, 384(%rsp)
vmovdqa %ymm2, 416(%rsp)
vmovdqa %ymm3, 448(%rsp)
vmovdqa %ymm9, 480(%rsp)
vmovdqa 4768(%r12), %ymm0
vpsubw 4896(%r12), %ymm0, %ymm0
vmovdqa 5280(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 5024(%r12), %ymm1, %ymm1
vpsubw 4640(%r12), %ymm0, %ymm0
vpaddw 5152(%r12), %ymm0, %ymm0
vmovdqa 5536(%r12), %ymm2
vpsubw 5664(%r12), %ymm2, %ymm2
vmovdqa 6048(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 5792(%r12), %ymm3, %ymm3
vpsubw 5408(%r12), %ymm2, %ymm2
vpaddw 5920(%r12), %ymm2, %ymm2
vmovdqa 6304(%r12), %ymm4
vpsubw 6432(%r12), %ymm4, %ymm4
vmovdqa 6816(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 6560(%r12), %ymm5, %ymm5
vpsubw 6176(%r12), %ymm4, %ymm4
vpaddw 6688(%r12), %ymm4, %ymm4
vpsubw 5408(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 4640(%r12), %ymm1, %ymm1
vpaddw 6176(%r12), %ymm1, %ymm1
vmovdqa 5024(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 6560(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 5792(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 4640(%r12), %ymm8
vmovdqa 5792(%r12), %ymm9
vmovdqa %ymm8, 512(%rsp)
vmovdqa %ymm0, 544(%rsp)
vmovdqa %ymm1, 576(%rsp)
vmovdqa %ymm7, 608(%rsp)
vmovdqa %ymm5, 640(%rsp)
vmovdqa %ymm2, 672(%rsp)
vmovdqa %ymm3, 704(%rsp)
vmovdqa %ymm9, 736(%rsp)
vmovdqa 7072(%r12), %ymm0
vpsubw 7200(%r12), %ymm0, %ymm0
vmovdqa 7584(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 7328(%r12), %ymm1, %ymm1
vpsubw 6944(%r12), %ymm0, %ymm0
vpaddw 7456(%r12), %ymm0, %ymm0
vmovdqa 7840(%r12), %ymm2
vpsubw 7968(%r12), %ymm2, %ymm2
vmovdqa 8352(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 8096(%r12), %ymm3, %ymm3
vpsubw 7712(%r12), %ymm2, %ymm2
vpaddw 8224(%r12), %ymm2, %ymm2
vmovdqa 8608(%r12), %ymm4
vpsubw 8736(%r12), %ymm4, %ymm4
vmovdqa 9120(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 8864(%r12), %ymm5, %ymm5
vpsubw 8480(%r12), %ymm4, %ymm4
vpaddw 8992(%r12), %ymm4, %ymm4
vpsubw 7712(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 6944(%r12), %ymm1, %ymm1
vpaddw 8480(%r12), %ymm1, %ymm1
vmovdqa 7328(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 8864(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 8096(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 6944(%r12), %ymm8
vmovdqa 8096(%r12), %ymm9
vmovdqa %ymm8, 768(%rsp)
vmovdqa %ymm0, 800(%rsp)
vmovdqa %ymm1, 832(%rsp)
vmovdqa %ymm7, 864(%rsp)
vmovdqa %ymm5, 896(%rsp)
vmovdqa %ymm2, 928(%rsp)
vmovdqa %ymm3, 960(%rsp)
vmovdqa %ymm9, 992(%rsp)
vmovdqa 9376(%r12), %ymm0
vpsubw 9504(%r12), %ymm0, %ymm0
vmovdqa 9888(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 9632(%r12), %ymm1, %ymm1
vpsubw 9248(%r12), %ymm0, %ymm0
vpaddw 9760(%r12), %ymm0, %ymm0
vmovdqa 10144(%r12), %ymm2
vpsubw 10272(%r12), %ymm2, %ymm2
vmovdqa 10656(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 10400(%r12), %ymm3, %ymm3
vpsubw 10016(%r12), %ymm2, %ymm2
vpaddw 10528(%r12), %ymm2, %ymm2
vmovdqa 10912(%r12), %ymm4
vpsubw 11040(%r12), %ymm4, %ymm4
vmovdqa 11424(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 11168(%r12), %ymm5, %ymm5
vpsubw 10784(%r12), %ymm4, %ymm4
vpaddw 11296(%r12), %ymm4, %ymm4
vpsubw 10016(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 9248(%r12), %ymm1, %ymm1
vpaddw 10784(%r12), %ymm1, %ymm1
vmovdqa 9632(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 11168(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 10400(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 9248(%r12), %ymm8
vmovdqa 10400(%r12), %ymm9
vmovdqa %ymm8, 1024(%rsp)
vmovdqa %ymm0, 1056(%rsp)
vmovdqa %ymm1, 1088(%rsp)
vmovdqa %ymm7, 1120(%rsp)
vmovdqa %ymm5, 1152(%rsp)
vmovdqa %ymm2, 1184(%rsp)
vmovdqa %ymm3, 1216(%rsp)
vmovdqa %ymm9, 1248(%rsp)
vmovdqa 11680(%r12), %ymm0
vpsubw 11808(%r12), %ymm0, %ymm0
vmovdqa 12192(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11936(%r12), %ymm1, %ymm1
vpsubw 11552(%r12), %ymm0, %ymm0
vpaddw 12064(%r12), %ymm0, %ymm0
vmovdqa 12448(%r12), %ymm2
vpsubw 12576(%r12), %ymm2, %ymm2
vmovdqa 12960(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 12704(%r12), %ymm3, %ymm3
vpsubw 12320(%r12), %ymm2, %ymm2
vpaddw 12832(%r12), %ymm2, %ymm2
vmovdqa 13216(%r12), %ymm4
vpsubw 13344(%r12), %ymm4, %ymm4
vmovdqa 13728(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 13472(%r12), %ymm5, %ymm5
vpsubw 13088(%r12), %ymm4, %ymm4
vpaddw 13600(%r12), %ymm4, %ymm4
vpsubw 12320(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 11552(%r12), %ymm1, %ymm1
vpaddw 13088(%r12), %ymm1, %ymm1
vmovdqa 11936(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 13472(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 12704(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 11552(%r12), %ymm8
vmovdqa 12704(%r12), %ymm9
vmovdqa %ymm8, 1280(%rsp)
vmovdqa %ymm0, 1312(%rsp)
vmovdqa %ymm1, 1344(%rsp)
vmovdqa %ymm7, 1376(%rsp)
vmovdqa %ymm5, 1408(%rsp)
vmovdqa %ymm2, 1440(%rsp)
vmovdqa %ymm3, 1472(%rsp)
vmovdqa %ymm9, 1504(%rsp)
vmovdqa 13984(%r12), %ymm0
vpsubw 14112(%r12), %ymm0, %ymm0
vmovdqa 14496(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 14240(%r12), %ymm1, %ymm1
vpsubw 13856(%r12), %ymm0, %ymm0
vpaddw 14368(%r12), %ymm0, %ymm0
vmovdqa 14752(%r12), %ymm2
vpsubw 14880(%r12), %ymm2, %ymm2
vmovdqa 15264(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 15008(%r12), %ymm3, %ymm3
vpsubw 14624(%r12), %ymm2, %ymm2
vpaddw 15136(%r12), %ymm2, %ymm2
vmovdqa 15520(%r12), %ymm4
vpsubw 15648(%r12), %ymm4, %ymm4
vmovdqa 16032(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 15776(%r12), %ymm5, %ymm5
vpsubw 15392(%r12), %ymm4, %ymm4
vpaddw 15904(%r12), %ymm4, %ymm4
vpsubw 14624(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 13856(%r12), %ymm1, %ymm1
vpaddw 15392(%r12), %ymm1, %ymm1
vmovdqa 14240(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 15776(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 15008(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 13856(%r12), %ymm8
vmovdqa 15008(%r12), %ymm9
vmovdqa %ymm8, 1536(%rsp)
vmovdqa %ymm0, 1568(%rsp)
vmovdqa %ymm1, 1600(%rsp)
vmovdqa %ymm7, 1632(%rsp)
vmovdqa %ymm5, 1664(%rsp)
vmovdqa %ymm2, 1696(%rsp)
vmovdqa %ymm3, 1728(%rsp)
vmovdqa %ymm9, 1760(%rsp)
vmovdqa 0(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vmovdqa 256(%rsp), %ymm9
vpunpcklwd const0(%rip), %ymm9, %ymm10
vpunpckhwd const0(%rip), %ymm9, %ymm9
vmovdqa 512(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm10, %ymm7
vpaddd %ymm6, %ymm9, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm5, %ymm10, %ymm5
vpsubd %ymm6, %ymm9, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1536(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vpsubd %ymm9, %ymm7, %ymm7
vpsubd %ymm10, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpackusdw %ymm8, %ymm7, %ymm8
vmovdqa 768(%rsp), %ymm7
vpaddw 1024(%rsp), %ymm7, %ymm10
vpsubw 1024(%rsp), %ymm7, %ymm7
vpsrlw $2, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsllw $1, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsllw $7, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vmovdqa 1280(%rsp), %ymm9
vpsubw %ymm11, %ymm9, %ymm9
vpmullw %ymm15, %ymm5, %ymm3
vpsubw %ymm3, %ymm9, %ymm3
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpmullw %ymm12, %ymm10, %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpmullw %ymm12, %ymm9, %ymm9
vpsubw %ymm9, %ymm3, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vpmullw %ymm13, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vmovdqu 32(%rdi), %ymm3
vpaddw %ymm3, %ymm11, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 32(%rdi)
vmovdqu 448(%rdi), %ymm3
vpaddw %ymm3, %ymm6, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 448(%rdi)
vmovdqu 864(%rdi), %ymm3
vpaddw %ymm3, %ymm8, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 864(%rdi)
vmovdqu 1280(%rdi), %ymm3
vpaddw %ymm3, %ymm7, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1280(%rdi)
vmovdqu 54(%rdi), %ymm3
vpaddw %ymm3, %ymm10, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 54(%rdi)
vmovdqu 470(%rdi), %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 470(%rdi)
vmovdqu 886(%rdi), %ymm3
vpaddw %ymm3, %ymm5, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 886(%rdi)
vmovdqa 32(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vmovdqa 288(%rsp), %ymm7
vpunpcklwd const0(%rip), %ymm7, %ymm8
vpunpckhwd const0(%rip), %ymm7, %ymm7
vmovdqa 544(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm8, %ymm3
vpaddd %ymm6, %ymm7, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm11, %ymm8, %ymm11
vpsubd %ymm6, %ymm7, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1568(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vpsubd %ymm7, %ymm3, %ymm3
vpsubd %ymm8, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpackusdw %ymm4, %ymm3, %ymm4
vmovdqa 800(%rsp), %ymm3
vpaddw 1056(%rsp), %ymm3, %ymm8
vpsubw 1056(%rsp), %ymm3, %ymm3
vpsrlw $2, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsllw $1, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsllw $7, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vmovdqa 1312(%rsp), %ymm7
vpsubw %ymm5, %ymm7, %ymm7
vpmullw %ymm15, %ymm11, %ymm10
vpsubw %ymm10, %ymm7, %ymm10
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpmullw %ymm12, %ymm8, %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpmullw %ymm12, %ymm7, %ymm7
vpsubw %ymm7, %ymm10, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vpmullw %ymm13, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vmovdqu 136(%rdi), %ymm10
vpaddw %ymm10, %ymm5, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 136(%rdi)
vmovdqu 552(%rdi), %ymm10
vpaddw %ymm10, %ymm6, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 552(%rdi)
vmovdqu 968(%rdi), %ymm10
vpaddw %ymm10, %ymm4, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 968(%rdi)
vmovdqu 1384(%rdi), %ymm10
vpaddw %ymm10, %ymm3, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1384(%rdi)
vmovdqu 158(%rdi), %ymm10
vpaddw %ymm10, %ymm8, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 158(%rdi)
vmovdqu 574(%rdi), %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 574(%rdi)
vmovdqu 990(%rdi), %ymm10
vpaddw %ymm10, %ymm11, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 990(%rdi)
vmovdqa 64(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vmovdqa 320(%rsp), %ymm3
vpunpcklwd const0(%rip), %ymm3, %ymm4
vpunpckhwd const0(%rip), %ymm3, %ymm3
vmovdqa 576(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm4, %ymm10
vpaddd %ymm6, %ymm3, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm5, %ymm4, %ymm5
vpsubd %ymm6, %ymm3, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1600(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vpsubd %ymm3, %ymm10, %ymm10
vpsubd %ymm4, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpackusdw %ymm9, %ymm10, %ymm9
vmovdqa 832(%rsp), %ymm10
vpaddw 1088(%rsp), %ymm10, %ymm4
vpsubw 1088(%rsp), %ymm10, %ymm10
vpsrlw $2, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsllw $1, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsllw $7, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vmovdqa 1344(%rsp), %ymm3
vpsubw %ymm11, %ymm3, %ymm3
vpmullw %ymm15, %ymm5, %ymm8
vpsubw %ymm8, %ymm3, %ymm8
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpmullw %ymm12, %ymm4, %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpmullw %ymm12, %ymm3, %ymm3
vpsubw %ymm3, %ymm8, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vpmullw %ymm13, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vmovdqu 240(%rdi), %ymm8
vpaddw %ymm8, %ymm11, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 240(%rdi)
vmovdqu 656(%rdi), %ymm8
vpaddw %ymm8, %ymm6, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 656(%rdi)
vmovdqu 1072(%rdi), %ymm8
vpaddw %ymm8, %ymm9, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1072(%rdi)
vmovdqu 1488(%rdi), %ymm8
vpaddw %ymm8, %ymm10, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1488(%rdi)
vmovdqu 262(%rdi), %ymm8
vpaddw %ymm8, %ymm4, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 262(%rdi)
vmovdqu 678(%rdi), %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 678(%rdi)
vmovdqu 1094(%rdi), %ymm8
vpaddw %ymm8, %ymm5, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1094(%rdi)
vmovdqa 96(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vmovdqa 352(%rsp), %ymm10
vpunpcklwd const0(%rip), %ymm10, %ymm9
vpunpckhwd const0(%rip), %ymm10, %ymm10
vmovdqa 608(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm9, %ymm8
vpaddd %ymm6, %ymm10, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm11, %ymm9, %ymm11
vpsubd %ymm6, %ymm10, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1632(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vpsubd %ymm10, %ymm8, %ymm8
vpsubd %ymm9, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpackusdw %ymm7, %ymm8, %ymm7
vmovdqa 864(%rsp), %ymm8
vpaddw 1120(%rsp), %ymm8, %ymm9
vpsubw 1120(%rsp), %ymm8, %ymm8
vpsrlw $2, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsllw $1, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsllw $7, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vmovdqa 1376(%rsp), %ymm10
vpsubw %ymm5, %ymm10, %ymm10
vpmullw %ymm15, %ymm11, %ymm4
vpsubw %ymm4, %ymm10, %ymm4
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpmullw %ymm12, %ymm9, %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpmullw %ymm12, %ymm10, %ymm10
vpsubw %ymm10, %ymm4, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vpmullw %ymm13, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vmovdqu 344(%rdi), %ymm4
vpaddw %ymm4, %ymm5, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 344(%rdi)
vmovdqu 760(%rdi), %ymm4
vpaddw %ymm4, %ymm6, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 760(%rdi)
vmovdqu 1176(%rdi), %ymm4
vpaddw %ymm4, %ymm7, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1176(%rdi)
vmovdqu 1592(%rdi), %ymm4
vpaddw %ymm4, %ymm8, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1592(%rdi)
vmovdqu 366(%rdi), %ymm4
vpaddw %ymm4, %ymm9, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 366(%rdi)
vmovdqu 782(%rdi), %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 782(%rdi)
vmovdqu 1198(%rdi), %ymm4
vpaddw %ymm4, %ymm11, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1198(%rdi)
vmovdqa 128(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vmovdqa 384(%rsp), %ymm8
vpunpcklwd const0(%rip), %ymm8, %ymm7
vpunpckhwd const0(%rip), %ymm8, %ymm8
vmovdqa 640(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm7, %ymm4
vpaddd %ymm6, %ymm8, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm5, %ymm7, %ymm5
vpsubd %ymm6, %ymm8, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1664(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vpsubd %ymm8, %ymm4, %ymm4
vpsubd %ymm7, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpackusdw %ymm3, %ymm4, %ymm3
vmovdqa 896(%rsp), %ymm4
vpaddw 1152(%rsp), %ymm4, %ymm7
vpsubw 1152(%rsp), %ymm4, %ymm4
vpsrlw $2, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsllw $1, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsllw $7, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vmovdqa 1408(%rsp), %ymm8
vpsubw %ymm11, %ymm8, %ymm8
vpmullw %ymm15, %ymm5, %ymm9
vpsubw %ymm9, %ymm8, %ymm9
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpmullw %ymm12, %ymm7, %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpmullw %ymm12, %ymm8, %ymm8
vpsubw %ymm8, %ymm9, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vpmullw %ymm13, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vmovdqu 448(%rdi), %ymm9
vpaddw %ymm9, %ymm11, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 448(%rdi)
vmovdqu 864(%rdi), %ymm9
vpaddw %ymm9, %ymm6, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 864(%rdi)
vmovdqu 1280(%rdi), %ymm9
vpaddw %ymm9, %ymm3, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1280(%rdi)
vmovdqu 54(%rdi), %ymm9
vpaddw %ymm9, %ymm4, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 54(%rdi)
vmovdqu 470(%rdi), %ymm9
vpaddw %ymm9, %ymm7, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 470(%rdi)
vmovdqu 886(%rdi), %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 886(%rdi)
vmovdqu 1302(%rdi), %ymm9
vpaddw %ymm9, %ymm5, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1302(%rdi)
vmovdqa 160(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vmovdqa 416(%rsp), %ymm4
vpunpcklwd const0(%rip), %ymm4, %ymm3
vpunpckhwd const0(%rip), %ymm4, %ymm4
vmovdqa 672(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm3, %ymm9
vpaddd %ymm6, %ymm4, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm11, %ymm3, %ymm11
vpsubd %ymm6, %ymm4, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1696(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vpsubd %ymm4, %ymm9, %ymm9
vpsubd %ymm3, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpackusdw %ymm10, %ymm9, %ymm10
vmovdqa 928(%rsp), %ymm9
vpaddw 1184(%rsp), %ymm9, %ymm3
vpsubw 1184(%rsp), %ymm9, %ymm9
vpsrlw $2, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsllw $1, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsllw $7, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vmovdqa 1440(%rsp), %ymm4
vpsubw %ymm5, %ymm4, %ymm4
vpmullw %ymm15, %ymm11, %ymm7
vpsubw %ymm7, %ymm4, %ymm7
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpmullw %ymm12, %ymm3, %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpmullw %ymm12, %ymm4, %ymm4
vpsubw %ymm4, %ymm7, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vpmullw %ymm13, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vmovdqu 552(%rdi), %ymm7
vpaddw %ymm7, %ymm5, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 552(%rdi)
vmovdqu 968(%rdi), %ymm7
vpaddw %ymm7, %ymm6, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 968(%rdi)
vmovdqu 1384(%rdi), %ymm7
vpaddw %ymm7, %ymm10, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1384(%rdi)
vmovdqu 158(%rdi), %ymm7
vpaddw %ymm7, %ymm9, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 158(%rdi)
vmovdqu 574(%rdi), %ymm7
vpaddw %ymm7, %ymm3, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 574(%rdi)
vmovdqu 990(%rdi), %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 990(%rdi)
vmovdqu 1406(%rdi), %ymm7
vpaddw %ymm7, %ymm11, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1406(%rdi)
vmovdqa 192(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vmovdqa 448(%rsp), %ymm9
vpunpcklwd const0(%rip), %ymm9, %ymm10
vpunpckhwd const0(%rip), %ymm9, %ymm9
vmovdqa 704(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm10, %ymm7
vpaddd %ymm6, %ymm9, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm5, %ymm10, %ymm5
vpsubd %ymm6, %ymm9, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1728(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vpsubd %ymm9, %ymm7, %ymm7
vpsubd %ymm10, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpackusdw %ymm8, %ymm7, %ymm8
vmovdqa 960(%rsp), %ymm7
vpaddw 1216(%rsp), %ymm7, %ymm10
vpsubw 1216(%rsp), %ymm7, %ymm7
vpsrlw $2, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsllw $1, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsllw $7, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vmovdqa 1472(%rsp), %ymm9
vpsubw %ymm11, %ymm9, %ymm9
vpmullw %ymm15, %ymm5, %ymm3
vpsubw %ymm3, %ymm9, %ymm3
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpmullw %ymm12, %ymm10, %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpmullw %ymm12, %ymm9, %ymm9
vpsubw %ymm9, %ymm3, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vpmullw %ymm13, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vmovdqu 656(%rdi), %ymm3
vpaddw %ymm3, %ymm11, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 656(%rdi)
vmovdqu 1072(%rdi), %ymm3
vpaddw %ymm3, %ymm6, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1072(%rdi)
vmovdqu 1488(%rdi), %ymm3
vpaddw %ymm3, %ymm8, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1488(%rdi)
vmovdqu 262(%rdi), %ymm3
vpaddw %ymm3, %ymm7, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 262(%rdi)
vmovdqu 678(%rdi), %ymm3
vpaddw %ymm3, %ymm10, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 678(%rdi)
vmovdqu 1094(%rdi), %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1094(%rdi)
vmovdqu 1510(%rdi), %ymm3
vpaddw %ymm3, %ymm5, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1510(%rdi)
vmovdqa 224(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vmovdqa 480(%rsp), %ymm7
vpunpcklwd const0(%rip), %ymm7, %ymm8
vpunpckhwd const0(%rip), %ymm7, %ymm7
vmovdqa 736(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm8, %ymm3
vpaddd %ymm6, %ymm7, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm11, %ymm8, %ymm11
vpsubd %ymm6, %ymm7, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1760(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vpsubd %ymm7, %ymm3, %ymm3
vpsubd %ymm8, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpackusdw %ymm4, %ymm3, %ymm4
vmovdqa 992(%rsp), %ymm3
vpaddw 1248(%rsp), %ymm3, %ymm8
vpsubw 1248(%rsp), %ymm3, %ymm3
vpsrlw $2, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsllw $1, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsllw $7, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vmovdqa 1504(%rsp), %ymm7
vpsubw %ymm5, %ymm7, %ymm7
vpmullw %ymm15, %ymm11, %ymm10
vpsubw %ymm10, %ymm7, %ymm10
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpmullw %ymm12, %ymm8, %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpmullw %ymm12, %ymm7, %ymm7
vpsubw %ymm7, %ymm10, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vpmullw %ymm13, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vmovdqu 760(%rdi), %ymm10
vpaddw %ymm10, %ymm5, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 760(%rdi)
vmovdqu 1176(%rdi), %ymm10
vpaddw %ymm10, %ymm6, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1176(%rdi)
vmovdqu 1592(%rdi), %ymm10
vpaddw %ymm10, %ymm4, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1592(%rdi)
vmovdqu 366(%rdi), %ymm10
vpaddw %ymm10, %ymm3, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 366(%rdi)
vmovdqu 782(%rdi), %ymm10
vpaddw %ymm10, %ymm8, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 782(%rdi)
vmovdqu 1198(%rdi), %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1198(%rdi)
vmovdqu 1614(%rdi), %ymm10
vpaddw %ymm10, %ymm11, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1614(%rdi)
vmovdqa 192(%r12), %ymm0
vpsubw 320(%r12), %ymm0, %ymm0
vmovdqa 704(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 448(%r12), %ymm1, %ymm1
vpsubw 64(%r12), %ymm0, %ymm0
vpaddw 576(%r12), %ymm0, %ymm0
vmovdqa 960(%r12), %ymm2
vpsubw 1088(%r12), %ymm2, %ymm2
vmovdqa 1472(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 1216(%r12), %ymm3, %ymm3
vpsubw 832(%r12), %ymm2, %ymm2
vpaddw 1344(%r12), %ymm2, %ymm2
vmovdqa 1728(%r12), %ymm4
vpsubw 1856(%r12), %ymm4, %ymm4
vmovdqa 2240(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 1984(%r12), %ymm5, %ymm5
vpsubw 1600(%r12), %ymm4, %ymm4
vpaddw 2112(%r12), %ymm4, %ymm4
vpsubw 832(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 64(%r12), %ymm1, %ymm1
vpaddw 1600(%r12), %ymm1, %ymm1
vmovdqa 448(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 1984(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 1216(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 64(%r12), %ymm8
vmovdqa 1216(%r12), %ymm9
vmovdqa %ymm8, 0(%rsp)
vmovdqa %ymm0, 32(%rsp)
vmovdqa %ymm1, 64(%rsp)
vmovdqa %ymm7, 96(%rsp)
vmovdqa %ymm5, 128(%rsp)
vmovdqa %ymm2, 160(%rsp)
vmovdqa %ymm3, 192(%rsp)
vmovdqa %ymm9, 224(%rsp)
vmovdqa 2496(%r12), %ymm0
vpsubw 2624(%r12), %ymm0, %ymm0
vmovdqa 3008(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 2752(%r12), %ymm1, %ymm1
vpsubw 2368(%r12), %ymm0, %ymm0
vpaddw 2880(%r12), %ymm0, %ymm0
vmovdqa 3264(%r12), %ymm2
vpsubw 3392(%r12), %ymm2, %ymm2
vmovdqa 3776(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 3520(%r12), %ymm3, %ymm3
vpsubw 3136(%r12), %ymm2, %ymm2
vpaddw 3648(%r12), %ymm2, %ymm2
vmovdqa 4032(%r12), %ymm4
vpsubw 4160(%r12), %ymm4, %ymm4
vmovdqa 4544(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 4288(%r12), %ymm5, %ymm5
vpsubw 3904(%r12), %ymm4, %ymm4
vpaddw 4416(%r12), %ymm4, %ymm4
vpsubw 3136(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 2368(%r12), %ymm1, %ymm1
vpaddw 3904(%r12), %ymm1, %ymm1
vmovdqa 2752(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 4288(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 3520(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 2368(%r12), %ymm8
vmovdqa 3520(%r12), %ymm9
vmovdqa %ymm8, 256(%rsp)
vmovdqa %ymm0, 288(%rsp)
vmovdqa %ymm1, 320(%rsp)
vmovdqa %ymm7, 352(%rsp)
vmovdqa %ymm5, 384(%rsp)
vmovdqa %ymm2, 416(%rsp)
vmovdqa %ymm3, 448(%rsp)
vmovdqa %ymm9, 480(%rsp)
vmovdqa 4800(%r12), %ymm0
vpsubw 4928(%r12), %ymm0, %ymm0
vmovdqa 5312(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 5056(%r12), %ymm1, %ymm1
vpsubw 4672(%r12), %ymm0, %ymm0
vpaddw 5184(%r12), %ymm0, %ymm0
vmovdqa 5568(%r12), %ymm2
vpsubw 5696(%r12), %ymm2, %ymm2
vmovdqa 6080(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 5824(%r12), %ymm3, %ymm3
vpsubw 5440(%r12), %ymm2, %ymm2
vpaddw 5952(%r12), %ymm2, %ymm2
vmovdqa 6336(%r12), %ymm4
vpsubw 6464(%r12), %ymm4, %ymm4
vmovdqa 6848(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 6592(%r12), %ymm5, %ymm5
vpsubw 6208(%r12), %ymm4, %ymm4
vpaddw 6720(%r12), %ymm4, %ymm4
vpsubw 5440(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 4672(%r12), %ymm1, %ymm1
vpaddw 6208(%r12), %ymm1, %ymm1
vmovdqa 5056(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 6592(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 5824(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 4672(%r12), %ymm8
vmovdqa 5824(%r12), %ymm9
vmovdqa %ymm8, 512(%rsp)
vmovdqa %ymm0, 544(%rsp)
vmovdqa %ymm1, 576(%rsp)
vmovdqa %ymm7, 608(%rsp)
vmovdqa %ymm5, 640(%rsp)
vmovdqa %ymm2, 672(%rsp)
vmovdqa %ymm3, 704(%rsp)
vmovdqa %ymm9, 736(%rsp)
vmovdqa 7104(%r12), %ymm0
vpsubw 7232(%r12), %ymm0, %ymm0
vmovdqa 7616(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 7360(%r12), %ymm1, %ymm1
vpsubw 6976(%r12), %ymm0, %ymm0
vpaddw 7488(%r12), %ymm0, %ymm0
vmovdqa 7872(%r12), %ymm2
vpsubw 8000(%r12), %ymm2, %ymm2
vmovdqa 8384(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 8128(%r12), %ymm3, %ymm3
vpsubw 7744(%r12), %ymm2, %ymm2
vpaddw 8256(%r12), %ymm2, %ymm2
vmovdqa 8640(%r12), %ymm4
vpsubw 8768(%r12), %ymm4, %ymm4
vmovdqa 9152(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 8896(%r12), %ymm5, %ymm5
vpsubw 8512(%r12), %ymm4, %ymm4
vpaddw 9024(%r12), %ymm4, %ymm4
vpsubw 7744(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 6976(%r12), %ymm1, %ymm1
vpaddw 8512(%r12), %ymm1, %ymm1
vmovdqa 7360(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 8896(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 8128(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 6976(%r12), %ymm8
vmovdqa 8128(%r12), %ymm9
vmovdqa %ymm8, 768(%rsp)
vmovdqa %ymm0, 800(%rsp)
vmovdqa %ymm1, 832(%rsp)
vmovdqa %ymm7, 864(%rsp)
vmovdqa %ymm5, 896(%rsp)
vmovdqa %ymm2, 928(%rsp)
vmovdqa %ymm3, 960(%rsp)
vmovdqa %ymm9, 992(%rsp)
vmovdqa 9408(%r12), %ymm0
vpsubw 9536(%r12), %ymm0, %ymm0
vmovdqa 9920(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 9664(%r12), %ymm1, %ymm1
vpsubw 9280(%r12), %ymm0, %ymm0
vpaddw 9792(%r12), %ymm0, %ymm0
vmovdqa 10176(%r12), %ymm2
vpsubw 10304(%r12), %ymm2, %ymm2
vmovdqa 10688(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 10432(%r12), %ymm3, %ymm3
vpsubw 10048(%r12), %ymm2, %ymm2
vpaddw 10560(%r12), %ymm2, %ymm2
vmovdqa 10944(%r12), %ymm4
vpsubw 11072(%r12), %ymm4, %ymm4
vmovdqa 11456(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 11200(%r12), %ymm5, %ymm5
vpsubw 10816(%r12), %ymm4, %ymm4
vpaddw 11328(%r12), %ymm4, %ymm4
vpsubw 10048(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 9280(%r12), %ymm1, %ymm1
vpaddw 10816(%r12), %ymm1, %ymm1
vmovdqa 9664(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 11200(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 10432(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 9280(%r12), %ymm8
vmovdqa 10432(%r12), %ymm9
vmovdqa %ymm8, 1024(%rsp)
vmovdqa %ymm0, 1056(%rsp)
vmovdqa %ymm1, 1088(%rsp)
vmovdqa %ymm7, 1120(%rsp)
vmovdqa %ymm5, 1152(%rsp)
vmovdqa %ymm2, 1184(%rsp)
vmovdqa %ymm3, 1216(%rsp)
vmovdqa %ymm9, 1248(%rsp)
vmovdqa 11712(%r12), %ymm0
vpsubw 11840(%r12), %ymm0, %ymm0
vmovdqa 12224(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 11968(%r12), %ymm1, %ymm1
vpsubw 11584(%r12), %ymm0, %ymm0
vpaddw 12096(%r12), %ymm0, %ymm0
vmovdqa 12480(%r12), %ymm2
vpsubw 12608(%r12), %ymm2, %ymm2
vmovdqa 12992(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 12736(%r12), %ymm3, %ymm3
vpsubw 12352(%r12), %ymm2, %ymm2
vpaddw 12864(%r12), %ymm2, %ymm2
vmovdqa 13248(%r12), %ymm4
vpsubw 13376(%r12), %ymm4, %ymm4
vmovdqa 13760(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 13504(%r12), %ymm5, %ymm5
vpsubw 13120(%r12), %ymm4, %ymm4
vpaddw 13632(%r12), %ymm4, %ymm4
vpsubw 12352(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 11584(%r12), %ymm1, %ymm1
vpaddw 13120(%r12), %ymm1, %ymm1
vmovdqa 11968(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 13504(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 12736(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 11584(%r12), %ymm8
vmovdqa 12736(%r12), %ymm9
vmovdqa %ymm8, 1280(%rsp)
vmovdqa %ymm0, 1312(%rsp)
vmovdqa %ymm1, 1344(%rsp)
vmovdqa %ymm7, 1376(%rsp)
vmovdqa %ymm5, 1408(%rsp)
vmovdqa %ymm2, 1440(%rsp)
vmovdqa %ymm3, 1472(%rsp)
vmovdqa %ymm9, 1504(%rsp)
vmovdqa 14016(%r12), %ymm0
vpsubw 14144(%r12), %ymm0, %ymm0
vmovdqa 14528(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 14272(%r12), %ymm1, %ymm1
vpsubw 13888(%r12), %ymm0, %ymm0
vpaddw 14400(%r12), %ymm0, %ymm0
vmovdqa 14784(%r12), %ymm2
vpsubw 14912(%r12), %ymm2, %ymm2
vmovdqa 15296(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 15040(%r12), %ymm3, %ymm3
vpsubw 14656(%r12), %ymm2, %ymm2
vpaddw 15168(%r12), %ymm2, %ymm2
vmovdqa 15552(%r12), %ymm4
vpsubw 15680(%r12), %ymm4, %ymm4
vmovdqa 16064(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 15808(%r12), %ymm5, %ymm5
vpsubw 15424(%r12), %ymm4, %ymm4
vpaddw 15936(%r12), %ymm4, %ymm4
vpsubw 14656(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 13888(%r12), %ymm1, %ymm1
vpaddw 15424(%r12), %ymm1, %ymm1
vmovdqa 14272(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 15808(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 15040(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 13888(%r12), %ymm8
vmovdqa 15040(%r12), %ymm9
vmovdqa %ymm8, 1536(%rsp)
vmovdqa %ymm0, 1568(%rsp)
vmovdqa %ymm1, 1600(%rsp)
vmovdqa %ymm7, 1632(%rsp)
vmovdqa %ymm5, 1664(%rsp)
vmovdqa %ymm2, 1696(%rsp)
vmovdqa %ymm3, 1728(%rsp)
vmovdqa %ymm9, 1760(%rsp)
vmovdqa 0(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vmovdqa 256(%rsp), %ymm3
vpunpcklwd const0(%rip), %ymm3, %ymm4
vpunpckhwd const0(%rip), %ymm3, %ymm3
vmovdqa 512(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm4, %ymm10
vpaddd %ymm6, %ymm3, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm5, %ymm4, %ymm5
vpsubd %ymm6, %ymm3, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1536(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vpsubd %ymm3, %ymm10, %ymm10
vpsubd %ymm4, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpackusdw %ymm9, %ymm10, %ymm9
vmovdqa 768(%rsp), %ymm10
vpaddw 1024(%rsp), %ymm10, %ymm4
vpsubw 1024(%rsp), %ymm10, %ymm10
vpsrlw $2, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsllw $1, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsllw $7, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vmovdqa 1280(%rsp), %ymm3
vpsubw %ymm11, %ymm3, %ymm3
vpmullw %ymm15, %ymm5, %ymm8
vpsubw %ymm8, %ymm3, %ymm8
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpmullw %ymm12, %ymm4, %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpmullw %ymm12, %ymm3, %ymm3
vpsubw %ymm3, %ymm8, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vpmullw %ymm13, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vmovdqu 64(%rdi), %ymm8
vpaddw %ymm8, %ymm11, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 64(%rdi)
vmovdqu 480(%rdi), %ymm8
vpaddw %ymm8, %ymm6, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 480(%rdi)
vmovdqu 896(%rdi), %ymm8
vpaddw %ymm8, %ymm9, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 896(%rdi)
vmovdqu 1312(%rdi), %ymm8
vpaddw %ymm8, %ymm10, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1312(%rdi)
vmovdqu 86(%rdi), %ymm8
vpaddw %ymm8, %ymm4, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 86(%rdi)
vmovdqu 502(%rdi), %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 502(%rdi)
vmovdqu 918(%rdi), %ymm8
vpaddw %ymm8, %ymm5, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 918(%rdi)
vmovdqa 32(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vmovdqa 288(%rsp), %ymm10
vpunpcklwd const0(%rip), %ymm10, %ymm9
vpunpckhwd const0(%rip), %ymm10, %ymm10
vmovdqa 544(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm9, %ymm8
vpaddd %ymm6, %ymm10, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm11, %ymm9, %ymm11
vpsubd %ymm6, %ymm10, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1568(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vpsubd %ymm10, %ymm8, %ymm8
vpsubd %ymm9, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpackusdw %ymm7, %ymm8, %ymm7
vmovdqa 800(%rsp), %ymm8
vpaddw 1056(%rsp), %ymm8, %ymm9
vpsubw 1056(%rsp), %ymm8, %ymm8
vpsrlw $2, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsllw $1, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsllw $7, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vmovdqa 1312(%rsp), %ymm10
vpsubw %ymm5, %ymm10, %ymm10
vpmullw %ymm15, %ymm11, %ymm4
vpsubw %ymm4, %ymm10, %ymm4
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpmullw %ymm12, %ymm9, %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpmullw %ymm12, %ymm10, %ymm10
vpsubw %ymm10, %ymm4, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vpmullw %ymm13, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vmovdqu 168(%rdi), %ymm4
vpaddw %ymm4, %ymm5, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 168(%rdi)
vmovdqu 584(%rdi), %ymm4
vpaddw %ymm4, %ymm6, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 584(%rdi)
vmovdqu 1000(%rdi), %ymm4
vpaddw %ymm4, %ymm7, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1000(%rdi)
vmovdqu 1416(%rdi), %ymm4
vpaddw %ymm4, %ymm8, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1416(%rdi)
vmovdqu 190(%rdi), %ymm4
vpaddw %ymm4, %ymm9, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 190(%rdi)
vmovdqu 606(%rdi), %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 606(%rdi)
vmovdqu 1022(%rdi), %ymm4
vpaddw %ymm4, %ymm11, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1022(%rdi)
vmovdqa 64(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vmovdqa 320(%rsp), %ymm8
vpunpcklwd const0(%rip), %ymm8, %ymm7
vpunpckhwd const0(%rip), %ymm8, %ymm8
vmovdqa 576(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm7, %ymm4
vpaddd %ymm6, %ymm8, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm5, %ymm7, %ymm5
vpsubd %ymm6, %ymm8, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1600(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vpsubd %ymm8, %ymm4, %ymm4
vpsubd %ymm7, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpackusdw %ymm3, %ymm4, %ymm3
vmovdqa 832(%rsp), %ymm4
vpaddw 1088(%rsp), %ymm4, %ymm7
vpsubw 1088(%rsp), %ymm4, %ymm4
vpsrlw $2, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsllw $1, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsllw $7, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vmovdqa 1344(%rsp), %ymm8
vpsubw %ymm11, %ymm8, %ymm8
vpmullw %ymm15, %ymm5, %ymm9
vpsubw %ymm9, %ymm8, %ymm9
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpmullw %ymm12, %ymm7, %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpmullw %ymm12, %ymm8, %ymm8
vpsubw %ymm8, %ymm9, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vpmullw %ymm13, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vmovdqu 272(%rdi), %ymm9
vpaddw %ymm9, %ymm11, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 272(%rdi)
vmovdqu 688(%rdi), %ymm9
vpaddw %ymm9, %ymm6, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 688(%rdi)
vmovdqu 1104(%rdi), %ymm9
vpaddw %ymm9, %ymm3, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1104(%rdi)
vmovdqu 1520(%rdi), %ymm9
vpaddw %ymm9, %ymm4, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1520(%rdi)
vmovdqu 294(%rdi), %ymm9
vpaddw %ymm9, %ymm7, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 294(%rdi)
vmovdqu 710(%rdi), %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 710(%rdi)
vmovdqu 1126(%rdi), %ymm9
vpaddw %ymm9, %ymm5, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovdqu %ymm9, 1126(%rdi)
vmovdqa 96(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vmovdqa 352(%rsp), %ymm4
vpunpcklwd const0(%rip), %ymm4, %ymm3
vpunpckhwd const0(%rip), %ymm4, %ymm4
vmovdqa 608(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm3, %ymm9
vpaddd %ymm6, %ymm4, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm11, %ymm3, %ymm11
vpsubd %ymm6, %ymm4, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1632(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vpsubd %ymm4, %ymm9, %ymm9
vpsubd %ymm3, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpackusdw %ymm10, %ymm9, %ymm10
vmovdqa 864(%rsp), %ymm9
vpaddw 1120(%rsp), %ymm9, %ymm3
vpsubw 1120(%rsp), %ymm9, %ymm9
vpsrlw $2, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsllw $1, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsllw $7, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vmovdqa 1376(%rsp), %ymm4
vpsubw %ymm5, %ymm4, %ymm4
vpmullw %ymm15, %ymm11, %ymm7
vpsubw %ymm7, %ymm4, %ymm7
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpmullw %ymm12, %ymm3, %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpmullw %ymm12, %ymm4, %ymm4
vpsubw %ymm4, %ymm7, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vpmullw %ymm13, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vmovdqu 376(%rdi), %ymm7
vpaddw %ymm7, %ymm5, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 376(%rdi)
vmovdqu 792(%rdi), %ymm7
vpaddw %ymm7, %ymm6, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 792(%rdi)
vmovdqu 1208(%rdi), %ymm7
vpaddw %ymm7, %ymm10, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1208(%rdi)
vmovdqu 1624(%rdi), %ymm7
vpand mask_9_7(%rip), %ymm9, %ymm8
vpaddw %ymm7, %ymm8, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1624(%rdi)
vpshufb rol_rol_16(%rip), %ymm9, %ymm9
vextracti128 $1, %ymm9, %xmm9
vpand mask_7_9(%rip), %ymm9, %ymm9
vmovdqu 0(%rdi), %ymm7
vpaddw %ymm7, %ymm9, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 0(%rdi)
vmovdqu 398(%rdi), %ymm7
vpaddw %ymm7, %ymm3, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 398(%rdi)
vmovdqu 814(%rdi), %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 814(%rdi)
vmovdqu 1230(%rdi), %ymm7
vpaddw %ymm7, %ymm11, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovdqu %ymm7, 1230(%rdi)
vmovdqa 128(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vmovdqa 384(%rsp), %ymm9
vpunpcklwd const0(%rip), %ymm9, %ymm10
vpunpckhwd const0(%rip), %ymm9, %ymm9
vmovdqa 640(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm10, %ymm7
vpaddd %ymm6, %ymm9, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm5, %ymm10, %ymm5
vpsubd %ymm6, %ymm9, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1664(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vpsubd %ymm9, %ymm7, %ymm7
vpsubd %ymm10, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpackusdw %ymm8, %ymm7, %ymm8
vmovdqa 896(%rsp), %ymm7
vpaddw 1152(%rsp), %ymm7, %ymm10
vpsubw 1152(%rsp), %ymm7, %ymm7
vpsrlw $2, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsllw $1, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsllw $7, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vmovdqa 1408(%rsp), %ymm9
vpsubw %ymm11, %ymm9, %ymm9
vpmullw %ymm15, %ymm5, %ymm3
vpsubw %ymm3, %ymm9, %ymm3
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpmullw %ymm12, %ymm10, %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpmullw %ymm12, %ymm9, %ymm9
vpsubw %ymm9, %ymm3, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vpmullw %ymm13, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vmovdqu 480(%rdi), %ymm3
vpaddw %ymm3, %ymm11, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 480(%rdi)
vmovdqu 896(%rdi), %ymm3
vpaddw %ymm3, %ymm6, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 896(%rdi)
vmovdqu 1312(%rdi), %ymm3
vpaddw %ymm3, %ymm8, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1312(%rdi)
vmovdqu 86(%rdi), %ymm3
vpaddw %ymm3, %ymm7, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 86(%rdi)
vmovdqu 502(%rdi), %ymm3
vpaddw %ymm3, %ymm10, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 502(%rdi)
vmovdqu 918(%rdi), %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 918(%rdi)
vmovdqu 1334(%rdi), %ymm3
vpaddw %ymm3, %ymm5, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovdqu %ymm3, 1334(%rdi)
vmovdqa 160(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vmovdqa 416(%rsp), %ymm7
vpunpcklwd const0(%rip), %ymm7, %ymm8
vpunpckhwd const0(%rip), %ymm7, %ymm7
vmovdqa 672(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm8, %ymm3
vpaddd %ymm6, %ymm7, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm11, %ymm8, %ymm11
vpsubd %ymm6, %ymm7, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1696(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vpsubd %ymm7, %ymm3, %ymm3
vpsubd %ymm8, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpackusdw %ymm4, %ymm3, %ymm4
vmovdqa 928(%rsp), %ymm3
vpaddw 1184(%rsp), %ymm3, %ymm8
vpsubw 1184(%rsp), %ymm3, %ymm3
vpsrlw $2, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsllw $1, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsllw $7, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vmovdqa 1440(%rsp), %ymm7
vpsubw %ymm5, %ymm7, %ymm7
vpmullw %ymm15, %ymm11, %ymm10
vpsubw %ymm10, %ymm7, %ymm10
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpmullw %ymm12, %ymm8, %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpmullw %ymm12, %ymm7, %ymm7
vpsubw %ymm7, %ymm10, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vpmullw %ymm13, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vmovdqu 584(%rdi), %ymm10
vpaddw %ymm10, %ymm5, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 584(%rdi)
vmovdqu 1000(%rdi), %ymm10
vpaddw %ymm10, %ymm6, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1000(%rdi)
vmovdqu 1416(%rdi), %ymm10
vpaddw %ymm10, %ymm4, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1416(%rdi)
vmovdqu 190(%rdi), %ymm10
vpaddw %ymm10, %ymm3, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 190(%rdi)
vmovdqu 606(%rdi), %ymm10
vpaddw %ymm10, %ymm8, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 606(%rdi)
vmovdqu 1022(%rdi), %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1022(%rdi)
vmovdqu 1438(%rdi), %ymm10
vpaddw %ymm10, %ymm11, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovdqu %ymm10, 1438(%rdi)
vmovdqa 192(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vmovdqa 448(%rsp), %ymm3
vpunpcklwd const0(%rip), %ymm3, %ymm4
vpunpckhwd const0(%rip), %ymm3, %ymm3
vmovdqa 704(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm4, %ymm10
vpaddd %ymm6, %ymm3, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm5, %ymm4, %ymm5
vpsubd %ymm6, %ymm3, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1728(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vpsubd %ymm3, %ymm10, %ymm10
vpsubd %ymm4, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpackusdw %ymm9, %ymm10, %ymm9
vmovdqa 960(%rsp), %ymm10
vpaddw 1216(%rsp), %ymm10, %ymm4
vpsubw 1216(%rsp), %ymm10, %ymm10
vpsrlw $2, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsllw $1, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsllw $7, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vmovdqa 1472(%rsp), %ymm3
vpsubw %ymm11, %ymm3, %ymm3
vpmullw %ymm15, %ymm5, %ymm8
vpsubw %ymm8, %ymm3, %ymm8
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpmullw %ymm12, %ymm4, %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpmullw %ymm12, %ymm3, %ymm3
vpsubw %ymm3, %ymm8, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vpmullw %ymm13, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vmovdqu 688(%rdi), %ymm8
vpaddw %ymm8, %ymm11, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 688(%rdi)
vmovdqu 1104(%rdi), %ymm8
vpaddw %ymm8, %ymm6, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1104(%rdi)
vmovdqu 1520(%rdi), %ymm8
vpaddw %ymm8, %ymm9, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1520(%rdi)
vmovdqu 294(%rdi), %ymm8
vpaddw %ymm8, %ymm10, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 294(%rdi)
vmovdqu 710(%rdi), %ymm8
vpaddw %ymm8, %ymm4, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 710(%rdi)
vmovdqu 1126(%rdi), %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1126(%rdi)
vmovdqu 1542(%rdi), %ymm8
vpaddw %ymm8, %ymm5, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovdqu %ymm8, 1542(%rdi)
vmovdqa 224(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vmovdqa 480(%rsp), %ymm10
vpunpcklwd const0(%rip), %ymm10, %ymm9
vpunpckhwd const0(%rip), %ymm10, %ymm10
vmovdqa 736(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm9, %ymm8
vpaddd %ymm6, %ymm10, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm11, %ymm9, %ymm11
vpsubd %ymm6, %ymm10, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1760(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vpsubd %ymm10, %ymm8, %ymm8
vpsubd %ymm9, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpackusdw %ymm7, %ymm8, %ymm7
vmovdqa 992(%rsp), %ymm8
vpaddw 1248(%rsp), %ymm8, %ymm9
vpsubw 1248(%rsp), %ymm8, %ymm8
vpsrlw $2, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsllw $1, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsllw $7, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vmovdqa 1504(%rsp), %ymm10
vpsubw %ymm5, %ymm10, %ymm10
vpmullw %ymm15, %ymm11, %ymm4
vpsubw %ymm4, %ymm10, %ymm4
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpmullw %ymm12, %ymm9, %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpmullw %ymm12, %ymm10, %ymm10
vpsubw %ymm10, %ymm4, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vpmullw %ymm13, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vmovdqu 792(%rdi), %ymm4
vpaddw %ymm4, %ymm5, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 792(%rdi)
vmovdqu 1208(%rdi), %ymm4
vpaddw %ymm4, %ymm6, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1208(%rdi)
vmovdqu 1624(%rdi), %ymm4
vpand mask_9_7(%rip), %ymm7, %ymm3
vpaddw %ymm4, %ymm3, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1624(%rdi)
vpshufb rol_rol_16(%rip), %ymm7, %ymm7
vextracti128 $1, %ymm7, %xmm7
vpand mask_7_9(%rip), %ymm7, %ymm7
vmovdqu 0(%rdi), %ymm4
vpaddw %ymm4, %ymm7, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 0(%rdi)
vmovdqu 398(%rdi), %ymm4
vpaddw %ymm4, %ymm8, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 398(%rdi)
vmovdqu 814(%rdi), %ymm4
vpaddw %ymm4, %ymm9, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 814(%rdi)
vmovdqu 1230(%rdi), %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovdqu %ymm4, 1230(%rdi)
vmovdqa 224(%r12), %ymm0
vpsubw 352(%r12), %ymm0, %ymm0
vmovdqa 736(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 480(%r12), %ymm1, %ymm1
vpsubw 96(%r12), %ymm0, %ymm0
vpaddw 608(%r12), %ymm0, %ymm0
vmovdqa 992(%r12), %ymm2
vpsubw 1120(%r12), %ymm2, %ymm2
vmovdqa 1504(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 1248(%r12), %ymm3, %ymm3
vpsubw 864(%r12), %ymm2, %ymm2
vpaddw 1376(%r12), %ymm2, %ymm2
vmovdqa 1760(%r12), %ymm4
vpsubw 1888(%r12), %ymm4, %ymm4
vmovdqa 2272(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 2016(%r12), %ymm5, %ymm5
vpsubw 1632(%r12), %ymm4, %ymm4
vpaddw 2144(%r12), %ymm4, %ymm4
vpsubw 864(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 96(%r12), %ymm1, %ymm1
vpaddw 1632(%r12), %ymm1, %ymm1
vmovdqa 480(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 2016(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 1248(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 96(%r12), %ymm8
vmovdqa 1248(%r12), %ymm9
vmovdqa %ymm8, 0(%rsp)
vmovdqa %ymm0, 32(%rsp)
vmovdqa %ymm1, 64(%rsp)
vmovdqa %ymm7, 96(%rsp)
vmovdqa %ymm5, 128(%rsp)
vmovdqa %ymm2, 160(%rsp)
vmovdqa %ymm3, 192(%rsp)
vmovdqa %ymm9, 224(%rsp)
vmovdqa 2528(%r12), %ymm0
vpsubw 2656(%r12), %ymm0, %ymm0
vmovdqa 3040(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 2784(%r12), %ymm1, %ymm1
vpsubw 2400(%r12), %ymm0, %ymm0
vpaddw 2912(%r12), %ymm0, %ymm0
vmovdqa 3296(%r12), %ymm2
vpsubw 3424(%r12), %ymm2, %ymm2
vmovdqa 3808(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 3552(%r12), %ymm3, %ymm3
vpsubw 3168(%r12), %ymm2, %ymm2
vpaddw 3680(%r12), %ymm2, %ymm2
vmovdqa 4064(%r12), %ymm4
vpsubw 4192(%r12), %ymm4, %ymm4
vmovdqa 4576(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 4320(%r12), %ymm5, %ymm5
vpsubw 3936(%r12), %ymm4, %ymm4
vpaddw 4448(%r12), %ymm4, %ymm4
vpsubw 3168(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 2400(%r12), %ymm1, %ymm1
vpaddw 3936(%r12), %ymm1, %ymm1
vmovdqa 2784(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 4320(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 3552(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 2400(%r12), %ymm8
vmovdqa 3552(%r12), %ymm9
vmovdqa %ymm8, 256(%rsp)
vmovdqa %ymm0, 288(%rsp)
vmovdqa %ymm1, 320(%rsp)
vmovdqa %ymm7, 352(%rsp)
vmovdqa %ymm5, 384(%rsp)
vmovdqa %ymm2, 416(%rsp)
vmovdqa %ymm3, 448(%rsp)
vmovdqa %ymm9, 480(%rsp)
vmovdqa 4832(%r12), %ymm0
vpsubw 4960(%r12), %ymm0, %ymm0
vmovdqa 5344(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 5088(%r12), %ymm1, %ymm1
vpsubw 4704(%r12), %ymm0, %ymm0
vpaddw 5216(%r12), %ymm0, %ymm0
vmovdqa 5600(%r12), %ymm2
vpsubw 5728(%r12), %ymm2, %ymm2
vmovdqa 6112(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 5856(%r12), %ymm3, %ymm3
vpsubw 5472(%r12), %ymm2, %ymm2
vpaddw 5984(%r12), %ymm2, %ymm2
vmovdqa 6368(%r12), %ymm4
vpsubw 6496(%r12), %ymm4, %ymm4
vmovdqa 6880(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 6624(%r12), %ymm5, %ymm5
vpsubw 6240(%r12), %ymm4, %ymm4
vpaddw 6752(%r12), %ymm4, %ymm4
vpsubw 5472(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 4704(%r12), %ymm1, %ymm1
vpaddw 6240(%r12), %ymm1, %ymm1
vmovdqa 5088(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 6624(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 5856(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 4704(%r12), %ymm8
vmovdqa 5856(%r12), %ymm9
vmovdqa %ymm8, 512(%rsp)
vmovdqa %ymm0, 544(%rsp)
vmovdqa %ymm1, 576(%rsp)
vmovdqa %ymm7, 608(%rsp)
vmovdqa %ymm5, 640(%rsp)
vmovdqa %ymm2, 672(%rsp)
vmovdqa %ymm3, 704(%rsp)
vmovdqa %ymm9, 736(%rsp)
vmovdqa 7136(%r12), %ymm0
vpsubw 7264(%r12), %ymm0, %ymm0
vmovdqa 7648(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 7392(%r12), %ymm1, %ymm1
vpsubw 7008(%r12), %ymm0, %ymm0
vpaddw 7520(%r12), %ymm0, %ymm0
vmovdqa 7904(%r12), %ymm2
vpsubw 8032(%r12), %ymm2, %ymm2
vmovdqa 8416(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 8160(%r12), %ymm3, %ymm3
vpsubw 7776(%r12), %ymm2, %ymm2
vpaddw 8288(%r12), %ymm2, %ymm2
vmovdqa 8672(%r12), %ymm4
vpsubw 8800(%r12), %ymm4, %ymm4
vmovdqa 9184(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 8928(%r12), %ymm5, %ymm5
vpsubw 8544(%r12), %ymm4, %ymm4
vpaddw 9056(%r12), %ymm4, %ymm4
vpsubw 7776(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 7008(%r12), %ymm1, %ymm1
vpaddw 8544(%r12), %ymm1, %ymm1
vmovdqa 7392(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 8928(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 8160(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 7008(%r12), %ymm8
vmovdqa 8160(%r12), %ymm9
vmovdqa %ymm8, 768(%rsp)
vmovdqa %ymm0, 800(%rsp)
vmovdqa %ymm1, 832(%rsp)
vmovdqa %ymm7, 864(%rsp)
vmovdqa %ymm5, 896(%rsp)
vmovdqa %ymm2, 928(%rsp)
vmovdqa %ymm3, 960(%rsp)
vmovdqa %ymm9, 992(%rsp)
vmovdqa 9440(%r12), %ymm0
vpsubw 9568(%r12), %ymm0, %ymm0
vmovdqa 9952(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 9696(%r12), %ymm1, %ymm1
vpsubw 9312(%r12), %ymm0, %ymm0
vpaddw 9824(%r12), %ymm0, %ymm0
vmovdqa 10208(%r12), %ymm2
vpsubw 10336(%r12), %ymm2, %ymm2
vmovdqa 10720(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 10464(%r12), %ymm3, %ymm3
vpsubw 10080(%r12), %ymm2, %ymm2
vpaddw 10592(%r12), %ymm2, %ymm2
vmovdqa 10976(%r12), %ymm4
vpsubw 11104(%r12), %ymm4, %ymm4
vmovdqa 11488(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 11232(%r12), %ymm5, %ymm5
vpsubw 10848(%r12), %ymm4, %ymm4
vpaddw 11360(%r12), %ymm4, %ymm4
vpsubw 10080(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 9312(%r12), %ymm1, %ymm1
vpaddw 10848(%r12), %ymm1, %ymm1
vmovdqa 9696(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 11232(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 10464(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 9312(%r12), %ymm8
vmovdqa 10464(%r12), %ymm9
vmovdqa %ymm8, 1024(%rsp)
vmovdqa %ymm0, 1056(%rsp)
vmovdqa %ymm1, 1088(%rsp)
vmovdqa %ymm7, 1120(%rsp)
vmovdqa %ymm5, 1152(%rsp)
vmovdqa %ymm2, 1184(%rsp)
vmovdqa %ymm3, 1216(%rsp)
vmovdqa %ymm9, 1248(%rsp)
vmovdqa 11744(%r12), %ymm0
vpsubw 11872(%r12), %ymm0, %ymm0
vmovdqa 12256(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 12000(%r12), %ymm1, %ymm1
vpsubw 11616(%r12), %ymm0, %ymm0
vpaddw 12128(%r12), %ymm0, %ymm0
vmovdqa 12512(%r12), %ymm2
vpsubw 12640(%r12), %ymm2, %ymm2
vmovdqa 13024(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 12768(%r12), %ymm3, %ymm3
vpsubw 12384(%r12), %ymm2, %ymm2
vpaddw 12896(%r12), %ymm2, %ymm2
vmovdqa 13280(%r12), %ymm4
vpsubw 13408(%r12), %ymm4, %ymm4
vmovdqa 13792(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 13536(%r12), %ymm5, %ymm5
vpsubw 13152(%r12), %ymm4, %ymm4
vpaddw 13664(%r12), %ymm4, %ymm4
vpsubw 12384(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 11616(%r12), %ymm1, %ymm1
vpaddw 13152(%r12), %ymm1, %ymm1
vmovdqa 12000(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 13536(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 12768(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 11616(%r12), %ymm8
vmovdqa 12768(%r12), %ymm9
vmovdqa %ymm8, 1280(%rsp)
vmovdqa %ymm0, 1312(%rsp)
vmovdqa %ymm1, 1344(%rsp)
vmovdqa %ymm7, 1376(%rsp)
vmovdqa %ymm5, 1408(%rsp)
vmovdqa %ymm2, 1440(%rsp)
vmovdqa %ymm3, 1472(%rsp)
vmovdqa %ymm9, 1504(%rsp)
vmovdqa 14048(%r12), %ymm0
vpsubw 14176(%r12), %ymm0, %ymm0
vmovdqa 14560(%r12), %ymm1
vpsubw %ymm0, %ymm1, %ymm1
vpsubw 14304(%r12), %ymm1, %ymm1
vpsubw 13920(%r12), %ymm0, %ymm0
vpaddw 14432(%r12), %ymm0, %ymm0
vmovdqa 14816(%r12), %ymm2
vpsubw 14944(%r12), %ymm2, %ymm2
vmovdqa 15328(%r12), %ymm3
vpsubw %ymm2, %ymm3, %ymm3
vpsubw 15072(%r12), %ymm3, %ymm3
vpsubw 14688(%r12), %ymm2, %ymm2
vpaddw 15200(%r12), %ymm2, %ymm2
vmovdqa 15584(%r12), %ymm4
vpsubw 15712(%r12), %ymm4, %ymm4
vmovdqa 16096(%r12), %ymm5
vpsubw %ymm4, %ymm5, %ymm5
vpsubw 15840(%r12), %ymm5, %ymm5
vpsubw 15456(%r12), %ymm4, %ymm4
vpaddw 15968(%r12), %ymm4, %ymm4
vpsubw 14688(%r12), %ymm1, %ymm1
vpsubw %ymm1, %ymm5, %ymm5
vpsubw %ymm3, %ymm5, %ymm5
vpsubw 13920(%r12), %ymm1, %ymm1
vpaddw 15456(%r12), %ymm1, %ymm1
vmovdqa 14304(%r12), %ymm6
vpsubw %ymm2, %ymm6, %ymm7
vmovdqa 15840(%r12), %ymm2
vpsubw %ymm7, %ymm2, %ymm2
vpsubw 15072(%r12), %ymm2, %ymm2
vpsubw %ymm0, %ymm7, %ymm7
vpaddw %ymm4, %ymm7, %ymm7
vmovdqa 13920(%r12), %ymm8
vmovdqa 15072(%r12), %ymm9
vmovdqa %ymm8, 1536(%rsp)
vmovdqa %ymm0, 1568(%rsp)
vmovdqa %ymm1, 1600(%rsp)
vmovdqa %ymm7, 1632(%rsp)
vmovdqa %ymm5, 1664(%rsp)
vmovdqa %ymm2, 1696(%rsp)
vmovdqa %ymm3, 1728(%rsp)
vmovdqa %ymm9, 1760(%rsp)
vmovdqa 0(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vmovdqa 256(%rsp), %ymm8
vpunpcklwd const0(%rip), %ymm8, %ymm7
vpunpckhwd const0(%rip), %ymm8, %ymm8
vmovdqa 512(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm7, %ymm4
vpaddd %ymm6, %ymm8, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm5, %ymm7, %ymm5
vpsubd %ymm6, %ymm8, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1536(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vpsubd %ymm8, %ymm4, %ymm4
vpsubd %ymm7, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpackusdw %ymm3, %ymm4, %ymm3
vmovdqa 768(%rsp), %ymm4
vpaddw 1024(%rsp), %ymm4, %ymm7
vpsubw 1024(%rsp), %ymm4, %ymm4
vpsrlw $2, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsllw $1, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsllw $7, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vmovdqa 1280(%rsp), %ymm8
vpsubw %ymm11, %ymm8, %ymm8
vpmullw %ymm15, %ymm5, %ymm9
vpsubw %ymm9, %ymm8, %ymm9
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpmullw %ymm12, %ymm7, %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpmullw %ymm12, %ymm8, %ymm8
vpsubw %ymm8, %ymm9, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vpmullw %ymm13, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vmovdqu 96(%rdi), %ymm9
vpaddw %ymm9, %ymm11, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 96(%rdi)
vmovdqu 512(%rdi), %ymm9
vpaddw %ymm9, %ymm6, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 512(%rdi)
vmovdqu 928(%rdi), %ymm9
vpaddw %ymm9, %ymm3, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 928(%rdi)
vmovdqu 1344(%rdi), %ymm9
vpaddw %ymm9, %ymm4, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 1344(%rdi)
vmovdqu 118(%rdi), %ymm9
vpaddw %ymm9, %ymm7, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 118(%rdi)
vmovdqu 534(%rdi), %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 534(%rdi)
vmovdqu 950(%rdi), %ymm9
vpaddw %ymm9, %ymm5, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 950(%rdi)
vmovdqa 32(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vmovdqa 288(%rsp), %ymm4
vpunpcklwd const0(%rip), %ymm4, %ymm3
vpunpckhwd const0(%rip), %ymm4, %ymm4
vmovdqa 544(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm3, %ymm9
vpaddd %ymm6, %ymm4, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm11, %ymm3, %ymm11
vpsubd %ymm6, %ymm4, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1568(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vpsubd %ymm4, %ymm9, %ymm9
vpsubd %ymm3, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpackusdw %ymm10, %ymm9, %ymm10
vmovdqa 800(%rsp), %ymm9
vpaddw 1056(%rsp), %ymm9, %ymm3
vpsubw 1056(%rsp), %ymm9, %ymm9
vpsrlw $2, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsllw $1, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsllw $7, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vmovdqa 1312(%rsp), %ymm4
vpsubw %ymm5, %ymm4, %ymm4
vpmullw %ymm15, %ymm11, %ymm7
vpsubw %ymm7, %ymm4, %ymm7
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpmullw %ymm12, %ymm3, %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpmullw %ymm12, %ymm4, %ymm4
vpsubw %ymm4, %ymm7, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vpmullw %ymm13, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vmovdqu 200(%rdi), %ymm7
vpaddw %ymm7, %ymm5, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 200(%rdi)
vmovdqu 616(%rdi), %ymm7
vpaddw %ymm7, %ymm6, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 616(%rdi)
vmovdqu 1032(%rdi), %ymm7
vpaddw %ymm7, %ymm10, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 1032(%rdi)
vmovdqu 1448(%rdi), %ymm7
vpaddw %ymm7, %ymm9, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 1448(%rdi)
vmovdqu 222(%rdi), %ymm7
vpaddw %ymm7, %ymm3, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 222(%rdi)
vmovdqu 638(%rdi), %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 638(%rdi)
vmovdqu 1054(%rdi), %ymm7
vpaddw %ymm7, %ymm11, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 1054(%rdi)
vmovdqa 64(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vmovdqa 320(%rsp), %ymm9
vpunpcklwd const0(%rip), %ymm9, %ymm10
vpunpckhwd const0(%rip), %ymm9, %ymm9
vmovdqa 576(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm10, %ymm7
vpaddd %ymm6, %ymm9, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm5, %ymm10, %ymm5
vpsubd %ymm6, %ymm9, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1600(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vpsubd %ymm9, %ymm7, %ymm7
vpsubd %ymm10, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpackusdw %ymm8, %ymm7, %ymm8
vmovdqa 832(%rsp), %ymm7
vpaddw 1088(%rsp), %ymm7, %ymm10
vpsubw 1088(%rsp), %ymm7, %ymm7
vpsrlw $2, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsllw $1, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsllw $7, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vmovdqa 1344(%rsp), %ymm9
vpsubw %ymm11, %ymm9, %ymm9
vpmullw %ymm15, %ymm5, %ymm3
vpsubw %ymm3, %ymm9, %ymm3
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpmullw %ymm12, %ymm10, %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpmullw %ymm12, %ymm9, %ymm9
vpsubw %ymm9, %ymm3, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vpmullw %ymm13, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vmovdqu 304(%rdi), %ymm3
vpaddw %ymm3, %ymm11, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovq %xmm3, 304(%rdi)
vmovdqu 720(%rdi), %ymm3
vpaddw %ymm3, %ymm6, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovq %xmm3, 720(%rdi)
vmovdqu 1136(%rdi), %ymm3
vpaddw %ymm3, %ymm8, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovq %xmm3, 1136(%rdi)
vmovdqu 1552(%rdi), %ymm3
vpaddw %ymm3, %ymm7, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovq %xmm3, 1552(%rdi)
vmovdqu 326(%rdi), %ymm3
vpaddw %ymm3, %ymm10, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovq %xmm3, 326(%rdi)
vmovdqu 742(%rdi), %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovq %xmm3, 742(%rdi)
vmovdqu 1158(%rdi), %ymm3
vpaddw %ymm3, %ymm5, %ymm3
vpand mask_mod4096(%rip), %ymm3, %ymm3
vmovq %xmm3, 1158(%rdi)
vmovdqa 96(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm9
vpunpckhwd const0(%rip), %ymm5, %ymm10
vpslld $1, %ymm9, %ymm9
vpslld $1, %ymm10, %ymm10
vmovdqa 352(%rsp), %ymm7
vpunpcklwd const0(%rip), %ymm7, %ymm8
vpunpckhwd const0(%rip), %ymm7, %ymm7
vmovdqa 608(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm8, %ymm3
vpaddd %ymm6, %ymm7, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm11, %ymm8, %ymm11
vpsubd %ymm6, %ymm7, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1632(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vpsubd %ymm7, %ymm3, %ymm3
vpsubd %ymm8, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpackusdw %ymm4, %ymm3, %ymm4
vmovdqa 864(%rsp), %ymm3
vpaddw 1120(%rsp), %ymm3, %ymm8
vpsubw 1120(%rsp), %ymm3, %ymm3
vpsrlw $2, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsllw $1, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsllw $7, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vmovdqa 1376(%rsp), %ymm7
vpsubw %ymm5, %ymm7, %ymm7
vpmullw %ymm15, %ymm11, %ymm10
vpsubw %ymm10, %ymm7, %ymm10
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpmullw %ymm12, %ymm8, %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpmullw %ymm12, %ymm7, %ymm7
vpsubw %ymm7, %ymm10, %ymm7
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm6, %ymm7, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vpmullw %ymm13, %ymm7, %ymm7
vpsubw %ymm7, %ymm6, %ymm6
vmovdqu 408(%rdi), %ymm10
vpaddw %ymm10, %ymm5, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovq %xmm10, 408(%rdi)
vmovdqu 824(%rdi), %ymm10
vpaddw %ymm10, %ymm6, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovq %xmm10, 824(%rdi)
vmovdqu 1240(%rdi), %ymm10
vpaddw %ymm10, %ymm4, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovq %xmm10, 1240(%rdi)
vmovdqu 14(%rdi), %ymm10
vpaddw %ymm10, %ymm3, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovq %xmm10, 14(%rdi)
vmovdqu 430(%rdi), %ymm10
vpaddw %ymm10, %ymm8, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovq %xmm10, 430(%rdi)
vmovdqu 846(%rdi), %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovq %xmm10, 846(%rdi)
vmovdqu 1262(%rdi), %ymm10
vpaddw %ymm10, %ymm11, %ymm10
vpand mask_mod4096(%rip), %ymm10, %ymm10
vmovq %xmm10, 1262(%rdi)
vmovdqa 128(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm7
vpunpckhwd const0(%rip), %ymm11, %ymm8
vpslld $1, %ymm7, %ymm7
vpslld $1, %ymm8, %ymm8
vmovdqa 384(%rsp), %ymm3
vpunpcklwd const0(%rip), %ymm3, %ymm4
vpunpckhwd const0(%rip), %ymm3, %ymm3
vmovdqa 640(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm4, %ymm10
vpaddd %ymm6, %ymm3, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm5, %ymm4, %ymm5
vpsubd %ymm6, %ymm3, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1664(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vpsubd %ymm3, %ymm10, %ymm10
vpsubd %ymm4, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpackusdw %ymm9, %ymm10, %ymm9
vmovdqa 896(%rsp), %ymm10
vpaddw 1152(%rsp), %ymm10, %ymm4
vpsubw 1152(%rsp), %ymm10, %ymm10
vpsrlw $2, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsllw $1, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsllw $7, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vmovdqa 1408(%rsp), %ymm3
vpsubw %ymm11, %ymm3, %ymm3
vpmullw %ymm15, %ymm5, %ymm8
vpsubw %ymm8, %ymm3, %ymm8
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpmullw %ymm12, %ymm4, %ymm3
vpaddw %ymm3, %ymm9, %ymm3
vpmullw %ymm12, %ymm3, %ymm3
vpsubw %ymm3, %ymm8, %ymm3
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm6, %ymm3, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vpmullw %ymm13, %ymm3, %ymm3
vpsubw %ymm3, %ymm6, %ymm6
vmovdqu 512(%rdi), %ymm8
vpaddw %ymm8, %ymm11, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovq %xmm8, 512(%rdi)
vmovdqu 928(%rdi), %ymm8
vpaddw %ymm8, %ymm6, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovq %xmm8, 928(%rdi)
vmovdqu 1344(%rdi), %ymm8
vpaddw %ymm8, %ymm9, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovq %xmm8, 1344(%rdi)
vmovdqu 118(%rdi), %ymm8
vpaddw %ymm8, %ymm10, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovq %xmm8, 118(%rdi)
vmovdqu 534(%rdi), %ymm8
vpaddw %ymm8, %ymm4, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovq %xmm8, 534(%rdi)
vmovdqu 950(%rdi), %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovq %xmm8, 950(%rdi)
vmovdqu 1366(%rdi), %ymm8
vpaddw %ymm8, %ymm5, %ymm8
vpand mask_mod4096(%rip), %ymm8, %ymm8
vmovq %xmm8, 1366(%rdi)
vmovdqa 160(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm3
vpunpckhwd const0(%rip), %ymm5, %ymm4
vpslld $1, %ymm3, %ymm3
vpslld $1, %ymm4, %ymm4
vmovdqa 416(%rsp), %ymm10
vpunpcklwd const0(%rip), %ymm10, %ymm9
vpunpckhwd const0(%rip), %ymm10, %ymm10
vmovdqa 672(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm9, %ymm8
vpaddd %ymm6, %ymm10, %ymm7
vpsubd %ymm3, %ymm8, %ymm8
vpsubd %ymm4, %ymm7, %ymm7
vpsubd %ymm11, %ymm9, %ymm11
vpsubd %ymm6, %ymm10, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1696(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vpsubd %ymm10, %ymm8, %ymm8
vpsubd %ymm9, %ymm7, %ymm7
vpsrld $1, %ymm8, %ymm8
vpsrld $1, %ymm7, %ymm7
vpand mask32_to_16(%rip), %ymm8, %ymm8
vpand mask32_to_16(%rip), %ymm7, %ymm7
vpackusdw %ymm7, %ymm8, %ymm7
vmovdqa 928(%rsp), %ymm8
vpaddw 1184(%rsp), %ymm8, %ymm9
vpsubw 1184(%rsp), %ymm8, %ymm8
vpsrlw $2, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsllw $1, %ymm5, %ymm10
vpsubw %ymm10, %ymm9, %ymm10
vpsllw $7, %ymm11, %ymm9
vpsubw %ymm9, %ymm10, %ymm9
vpsrlw $3, %ymm9, %ymm9
vpsubw %ymm7, %ymm9, %ymm9
vmovdqa 1440(%rsp), %ymm10
vpsubw %ymm5, %ymm10, %ymm10
vpmullw %ymm15, %ymm11, %ymm4
vpsubw %ymm4, %ymm10, %ymm4
vpmullw %ymm14, %ymm9, %ymm9
vpsubw %ymm9, %ymm7, %ymm7
vpmullw %ymm12, %ymm9, %ymm10
vpaddw %ymm10, %ymm7, %ymm10
vpmullw %ymm12, %ymm10, %ymm10
vpsubw %ymm10, %ymm4, %ymm10
vpmullw %ymm14, %ymm10, %ymm10
vpsubw %ymm6, %ymm10, %ymm10
vpsrlw $3, %ymm10, %ymm10
vpsubw %ymm8, %ymm10, %ymm10
vpsubw %ymm10, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vpmullw %ymm13, %ymm10, %ymm10
vpsubw %ymm10, %ymm6, %ymm6
vmovdqu 616(%rdi), %ymm4
vpaddw %ymm4, %ymm5, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovq %xmm4, 616(%rdi)
vmovdqu 1032(%rdi), %ymm4
vpaddw %ymm4, %ymm6, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovq %xmm4, 1032(%rdi)
vmovdqu 1448(%rdi), %ymm4
vpaddw %ymm4, %ymm7, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovq %xmm4, 1448(%rdi)
vmovdqu 222(%rdi), %ymm4
vpaddw %ymm4, %ymm8, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovq %xmm4, 222(%rdi)
vmovdqu 638(%rdi), %ymm4
vpaddw %ymm4, %ymm9, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovq %xmm4, 638(%rdi)
vmovdqu 1054(%rdi), %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovq %xmm4, 1054(%rdi)
vmovdqu 1470(%rdi), %ymm4
vpaddw %ymm4, %ymm11, %ymm4
vpand mask_mod4096(%rip), %ymm4, %ymm4
vmovq %xmm4, 1470(%rdi)
vmovdqa 192(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm10
vpunpckhwd const0(%rip), %ymm11, %ymm9
vpslld $1, %ymm10, %ymm10
vpslld $1, %ymm9, %ymm9
vmovdqa 448(%rsp), %ymm8
vpunpcklwd const0(%rip), %ymm8, %ymm7
vpunpckhwd const0(%rip), %ymm8, %ymm8
vmovdqa 704(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm5
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm5, %ymm7, %ymm4
vpaddd %ymm6, %ymm8, %ymm3
vpsubd %ymm10, %ymm4, %ymm4
vpsubd %ymm9, %ymm3, %ymm3
vpsubd %ymm5, %ymm7, %ymm5
vpsubd %ymm6, %ymm8, %ymm6
vpsrld $1, %ymm5, %ymm5
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm5, %ymm5
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm5, %ymm6
vmovdqa 1728(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vpsubd %ymm8, %ymm4, %ymm4
vpsubd %ymm7, %ymm3, %ymm3
vpsrld $1, %ymm4, %ymm4
vpsrld $1, %ymm3, %ymm3
vpand mask32_to_16(%rip), %ymm4, %ymm4
vpand mask32_to_16(%rip), %ymm3, %ymm3
vpackusdw %ymm3, %ymm4, %ymm3
vmovdqa 960(%rsp), %ymm4
vpaddw 1216(%rsp), %ymm4, %ymm7
vpsubw 1216(%rsp), %ymm4, %ymm4
vpsrlw $2, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsllw $1, %ymm11, %ymm8
vpsubw %ymm8, %ymm7, %ymm8
vpsllw $7, %ymm5, %ymm7
vpsubw %ymm7, %ymm8, %ymm7
vpsrlw $3, %ymm7, %ymm7
vpsubw %ymm3, %ymm7, %ymm7
vmovdqa 1472(%rsp), %ymm8
vpsubw %ymm11, %ymm8, %ymm8
vpmullw %ymm15, %ymm5, %ymm9
vpsubw %ymm9, %ymm8, %ymm9
vpmullw %ymm14, %ymm7, %ymm7
vpsubw %ymm7, %ymm3, %ymm3
vpmullw %ymm12, %ymm7, %ymm8
vpaddw %ymm8, %ymm3, %ymm8
vpmullw %ymm12, %ymm8, %ymm8
vpsubw %ymm8, %ymm9, %ymm8
vpmullw %ymm14, %ymm8, %ymm8
vpsubw %ymm6, %ymm8, %ymm8
vpsrlw $3, %ymm8, %ymm8
vpsubw %ymm4, %ymm8, %ymm8
vpsubw %ymm8, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vpmullw %ymm13, %ymm8, %ymm8
vpsubw %ymm8, %ymm6, %ymm6
vmovdqu 720(%rdi), %ymm9
vpaddw %ymm9, %ymm11, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 720(%rdi)
vmovdqu 1136(%rdi), %ymm9
vpaddw %ymm9, %ymm6, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 1136(%rdi)
vmovdqu 1552(%rdi), %ymm9
vpaddw %ymm9, %ymm3, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 1552(%rdi)
vmovdqu 326(%rdi), %ymm9
vpaddw %ymm9, %ymm4, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 326(%rdi)
vmovdqu 742(%rdi), %ymm9
vpaddw %ymm9, %ymm7, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 742(%rdi)
vmovdqu 1158(%rdi), %ymm9
vpaddw %ymm9, %ymm8, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 1158(%rdi)
vmovdqu 1574(%rdi), %ymm9
vpaddw %ymm9, %ymm5, %ymm9
vpand mask_mod4096(%rip), %ymm9, %ymm9
vmovq %xmm9, 1574(%rdi)
vmovdqa 224(%rsp), %ymm5
vpunpcklwd const0(%rip), %ymm5, %ymm8
vpunpckhwd const0(%rip), %ymm5, %ymm7
vpslld $1, %ymm8, %ymm8
vpslld $1, %ymm7, %ymm7
vmovdqa 480(%rsp), %ymm4
vpunpcklwd const0(%rip), %ymm4, %ymm3
vpunpckhwd const0(%rip), %ymm4, %ymm4
vmovdqa 736(%rsp), %ymm6
vpunpcklwd const0(%rip), %ymm6, %ymm11
vpunpckhwd const0(%rip), %ymm6, %ymm6
vpaddd %ymm11, %ymm3, %ymm9
vpaddd %ymm6, %ymm4, %ymm10
vpsubd %ymm8, %ymm9, %ymm9
vpsubd %ymm7, %ymm10, %ymm10
vpsubd %ymm11, %ymm3, %ymm11
vpsubd %ymm6, %ymm4, %ymm6
vpsrld $1, %ymm11, %ymm11
vpsrld $1, %ymm6, %ymm6
vpand mask32_to_16(%rip), %ymm11, %ymm11
vpand mask32_to_16(%rip), %ymm6, %ymm6
vpackusdw %ymm6, %ymm11, %ymm6
vmovdqa 1760(%rsp), %ymm11
vpunpcklwd const0(%rip), %ymm11, %ymm4
vpunpckhwd const0(%rip), %ymm11, %ymm3
vpslld $1, %ymm4, %ymm4
vpslld $1, %ymm3, %ymm3
vpsubd %ymm4, %ymm9, %ymm9
vpsubd %ymm3, %ymm10, %ymm10
vpsrld $1, %ymm9, %ymm9
vpsrld $1, %ymm10, %ymm10
vpand mask32_to_16(%rip), %ymm9, %ymm9
vpand mask32_to_16(%rip), %ymm10, %ymm10
vpackusdw %ymm10, %ymm9, %ymm10
vmovdqa 992(%rsp), %ymm9
vpaddw 1248(%rsp), %ymm9, %ymm3
vpsubw 1248(%rsp), %ymm9, %ymm9
vpsrlw $2, %ymm9, %ymm9
vpsubw %ymm6, %ymm9, %ymm9
vpmullw %ymm14, %ymm9, %ymm9
vpsllw $1, %ymm5, %ymm4
vpsubw %ymm4, %ymm3, %ymm4
vpsllw $7, %ymm11, %ymm3
vpsubw %ymm3, %ymm4, %ymm3
vpsrlw $3, %ymm3, %ymm3
vpsubw %ymm10, %ymm3, %ymm3
vmovdqa 1504(%rsp), %ymm4
vpsubw %ymm5, %ymm4, %ymm4
vpmullw %ymm15, %ymm11, %ymm7
vpsubw %ymm7, %ymm4, %ymm7
vpmullw %ymm14, %ymm3, %ymm3
vpsubw %ymm3, %ymm10, %ymm10
vpmullw %ymm12, %ymm3, %ymm4
vpaddw %ymm4, %ymm10, %ymm4
vpmullw %ymm12, %ymm4, %ymm4
vpsubw %ymm4, %ymm7, %ymm4
vpmullw %ymm14, %ymm4, %ymm4
vpsubw %ymm6, %ymm4, %ymm4
vpsrlw $3, %ymm4, %ymm4
vpsubw %ymm9, %ymm4, %ymm4
vpsubw %ymm4, %ymm9, %ymm9
vpsubw %ymm9, %ymm6, %ymm6
vpmullw %ymm13, %ymm4, %ymm4
vpsubw %ymm4, %ymm6, %ymm6
vmovdqu 824(%rdi), %ymm7
vpaddw %ymm7, %ymm5, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 824(%rdi)
vmovdqu 1240(%rdi), %ymm7
vpaddw %ymm7, %ymm6, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 1240(%rdi)
vmovdqu 14(%rdi), %ymm7
vpaddw %ymm7, %ymm10, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 14(%rdi)
vmovdqu 430(%rdi), %ymm7
vpaddw %ymm7, %ymm9, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 430(%rdi)
vmovdqu 846(%rdi), %ymm7
vpaddw %ymm7, %ymm3, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 846(%rdi)
vmovdqu 1262(%rdi), %ymm7
vpaddw %ymm7, %ymm4, %ymm7
vpand mask_mod4096(%rip), %ymm7, %ymm7
vmovq %xmm7, 1262(%rdi)
mov %r8, %rsp
pop %r12
ret