add example code
authorLuke Kenneth Casson Leighton <lkcl@lkcl.net>
Tue, 5 Jun 2018 04:29:51 +0000 (05:29 +0100)
committerLuke Kenneth Casson Leighton <lkcl@lkcl.net>
Tue, 5 Jun 2018 04:29:51 +0000 (05:29 +0100)
simple_v_extension/simple_v_chennai_2018.tex

index b651b156f7147bd7d264dd888d552b43f3bf7f94..164850ac5e6f25691e20f6a7d759506a0cc547ea 100644 (file)
@@ -643,11 +643,10 @@ loop:
  \begin{itemize}
    \item EVERY register operation is inherently parallelised\\
             (scalar ops are just vectors of length 1)\vspace{4pt}
+   \item Tightly coupled with the core (instruction issue)\\
+         could be disabled through MISA switch\vspace{4pt}
    \item An extra pipeline phase is pretty much essential\\
          for fast low-latency implementations\vspace{4pt}
-   \item Assuming an instruction FIFO, N ops could be taken off\\
-         of a parallel op per cycle (avoids filling entire FIFO;\\
-         also is less work per cycle: lower complexity / latency)\vspace{4pt}
    \item With zeroing off, skipping non-predicated elements is hard:\\
          it is however an optimisation (and could be skipped).\vspace{4pt}
    \item Setting up the Register/Predication tables (interpreting the\\