Bug 1244: changes to pospopcnt
[libreriscv.git] / conferences / fosdem2024 / fosdem2024_ddffirst / fosdem2024_ddffirst.tex
index 58550e9924ebba6c72e407f02f245cbe5dddb5ca..04805956b4ec69c52215cd79a878d57512640706 100644 (file)
@@ -183,17 +183,19 @@ for (i = 0; i < VL; i++)
   \begin{itemize}
        \item   Positional popcount adds up the totals of each bit set to 1 in each bit-position, of an array of input values.
        \item   Notoriously difficult to do in SIMD assembler: typically 550 lines
+    \item https://github.com/clausecker/pospop
 
    \end{itemize}
        
        \lstinputlisting[language={}]{pospopcount.c}
+
        
 }
 
 \frame{\frametitle{Pospopcount}
        
        \begin{center}
-               \includegraphics[width=0.6\textwidth]{pospopcount.png}
+               \includegraphics[width=0.5\textwidth]{pospopcount.png}
        \end{center}
          \begin{itemize}
                \item   The challenge is to perform an appropriate transpose of the data (the CPU can only work on registers, horizontally),
@@ -213,7 +215,7 @@ for (i = 0; i < VL; i++)
 
                \item   The draft gbbd instruction implements the transpose (shown above), 
                                preparing the data to use the standard popcount instruction.
-
+                          (gbbd is based on Power ISA vgbbd)
        
        \end{itemize}