Bug 1244: changes to description pospopcount
[libreriscv.git] / conferences / fosdem2024 / fosdem2024_ddffirst / fosdem2024_ddffirst.tex
index ea65ac8ebe2dfd3e098ef1096e397844337446cb..58550e9924ebba6c72e407f02f245cbe5dddb5ca 100644 (file)
@@ -170,7 +170,7 @@ for (i = 0; i < VL; i++)
                identical to general-purpose Simple-V DD-FFirst...
        \end{itemize}
        
-}
+}Po
 
 \frame{\frametitle{maxloc}
   \begin{itemize}
@@ -183,6 +183,7 @@ for (i = 0; i < VL; i++)
   \begin{itemize}
        \item   Positional popcount adds up the totals of each bit set to 1 in each bit-position, of an array of input values.
        \item   Notoriously difficult to do in SIMD assembler: typically 550 lines
+
    \end{itemize}
        
        \lstinputlisting[language={}]{pospopcount.c}
@@ -194,7 +195,12 @@ for (i = 0; i < VL; i++)
        \begin{center}
                \includegraphics[width=0.6\textwidth]{pospopcount.png}
        \end{center}
-       
+         \begin{itemize}
+               \item   The challenge is to perform an appropriate transpose of the data (the CPU can only work on registers, horizontally),
+               in blocks that suit the processor and the ISA capacity.
+
+               
+       \end{itemize}
 }
 
 \frame{\frametitle{Pospopcount}
@@ -202,6 +208,14 @@ for (i = 0; i < VL; i++)
        \begin{center}
                \includegraphics[width=0.6\textwidth]{array_popcnt.png}
        \end{center}
+
+  \begin{itemize}
+
+               \item   The draft gbbd instruction implements the transpose (shown above), 
+                               preparing the data to use the standard popcount instruction.
+
+       
+       \end{itemize}
        
 }