fix x86 sh[lr]d, *not* sh[lr]q. if you like AT&T form, it's sh[lr]dq.
authorJacob Lifshay <programmerjake@gmail.com>
Thu, 6 Oct 2022 01:33:55 +0000 (18:33 -0700)
committerJacob Lifshay <programmerjake@gmail.com>
Thu, 6 Oct 2022 01:33:55 +0000 (18:33 -0700)
for an example, see https://gcc.godbolt.org/z/ME4bE7Mdv

openpower/sv/biginteger.mdwn

index 5e4a4f770331b681214dd330408aaee94cd28086..d4dc5a20296ec7dba4757cfe23e0cc2f2a0e61f4 100644 (file)
@@ -28,9 +28,9 @@ Dynamic SIMD ALUs for maximum performance and effectiveness.
 Covered in [[biginteger/analysis]] the summary is that standard `adde`
 is sufficient for SVP64 Vectorisation of big-integer addition (and `subfe`
 for subtraction) but that big-integer shift, multiply and divide require an
-extra 3-in 2-out instructions, similar to Intel's 
-[shlq](https://www.felixcloutier.com/x86/shld)
-and [shrq](https://www.felixcloutier.com/x86/shrd),
+extra 3-in 2-out instructions, similar to Intel's
+[shld](https://www.felixcloutier.com/x86/shld)
+and [shrd](https://www.felixcloutier.com/x86/shrd),
 `mulx` and `divq`, to be efficient.
 The same instruction (`maddedu`) is used in both
 big-divide and big-multiply because 'maddedu''s primary