add comment
[riscv-isa-sim.git] / riscv / processor.cc
index 237eedc19fc4d0626d9358740594b9ea48ae7204..3b0d3956ff8b8dc3fedb8387db8661b9c642a2ca 100644 (file)
@@ -15,6 +15,9 @@
 #include <limits.h>
 #include <stdexcept>
 #include <algorithm>
+#ifdef SPIKE_SIMPLEV
+#include "sv_insn_redirect.h"
+#endif
 
 #undef STATE
 #define STATE state
@@ -23,11 +26,18 @@ processor_t::processor_t(const char* isa, simif_t* sim, uint32_t id,
         bool halt_on_reset)
   : debug(false), halt_request(false), sim(sim), ext(NULL), id(id),
   halt_on_reset(halt_on_reset), last_pc(1), executions(1)
+#ifdef SPIKE_SIMPLEV
+    , s(this)
+#endif
 {
   parse_isa_string(isa);
   register_base_instructions();
 
+#ifdef SPIKE_SIMPLEV
+  mmu = new sv_mmu_t(sim, this);
+#else
   mmu = new mmu_t(sim, this);
+#endif
 
   disassembler = new disassembler_t(max_xlen);
   if (ext)
@@ -128,6 +138,81 @@ void state_t::reset(reg_t max_isa)
   tselect = 0;
   for (unsigned int i = 0; i < num_triggers; i++)
     mcontrol[i].type = 2;
+#ifdef SPIKE_SIMPLEV
+  // set SV CSR banks to default (full) sizes
+  msv.state_size = 1;
+  ssv.state_size = 1;
+  usv.state_size = 3;
+  // VL and MVL all 0
+  msv.vl = msv.mvl = 0;
+  ssv.vl = ssv.mvl = 0;
+  usv.vl = usv.mvl = 0;
+  // SUBVL all 1, including in xesvstate
+  msv.subvl = 1;
+  ssv.subvl = 1;
+  usv.subvl = 1;
+  mesvstate = sesvstate = 0;
+#endif
+}
+
+void sv_shape_t::setup_map()
+{
+    int order[3] = {};
+    int lims[3] = {xsz, ysz, zsz};
+    int idxs[3] = {0,0,0};
+
+    switch (permute) {
+        case SV_SHAPE_PERM_XYZ: order[0] = 0; order[1] = 1; order[2] = 2; break;
+        case SV_SHAPE_PERM_XZY: order[0] = 0; order[1] = 2; order[2] = 1; break;
+        case SV_SHAPE_PERM_YXZ: order[0] = 1; order[1] = 0; order[2] = 2; break;
+        case SV_SHAPE_PERM_YZX: order[0] = 1; order[1] = 2; order[2] = 0; break;
+        case SV_SHAPE_PERM_ZXY: order[0] = 2; order[1] = 0; order[2] = 1; break;
+        case SV_SHAPE_PERM_ZYX: order[0] = 2; order[1] = 1; order[2] = 0; break;
+        default: throw trap_illegal_instruction(0);
+    }
+    for (int i = 0; i < 128; i++)
+    {
+        uint8_t new_idx = idxs[0] + idxs[1] * xsz + idxs[2] * xsz * ysz;
+        map[i] = new_idx;
+        for (int j = 0; j < 3; j++)
+        {
+            idxs[order[j]] = idxs[order[j]] + 1;
+            if (idxs[order[j]] != lims[order[j]]) {
+                break;
+            }
+            idxs[order[j]] = 0;
+        }
+    }
+}
+
+int state_t::sv_csr_sz()
+{
+    if (prv == PRV_M)
+        return SV_MCSR_SZ;
+    if (prv == PRV_S)
+        return SV_SCSR_SZ;
+    return SV_UCSR_SZ;
+}
+sv_csr_t &state_t::sv()
+{
+    if (prv == PRV_M)
+        return get_msv();
+    if (prv == PRV_S)
+        return get_ssv();
+    return get_usv();
+}
+
+sv_shape_t* state_t::get_shape(reg_t reg, bool pred)
+{
+    if (prv == PRV_M || prv == PRV_S || reg == 0) {
+        return NULL;
+    }
+    for (int i = 0; i < 3; i++) {
+        if (remap[i].regidx == reg && remap[i].pred == pred) {
+            return &shape[i];
+        }
+    }
+    return NULL;
 }
 
 void processor_t::set_debug(bool value)
@@ -271,6 +356,7 @@ void processor_t::take_trap(trap_t& t, reg_t epc)
   // by default, trap to M-mode, unless delegated to S-mode
   reg_t bit = t.cause();
   reg_t deleg = state.medeleg;
+  reg_t svstate = get_csr(CSR_SV_STATE);
   bool interrupt = (bit & ((reg_t)1 << (max_xlen-1))) != 0;
   if (interrupt)
     deleg = state.mideleg, bit &= ~((reg_t)1 << (max_xlen-1));
@@ -279,6 +365,7 @@ void processor_t::take_trap(trap_t& t, reg_t epc)
     state.pc = state.stvec;
     state.scause = t.cause();
     state.sepc = epc;
+    state.sesvstate = svstate;
     state.stval = t.get_tval();
 
     reg_t s = state.mstatus;
@@ -291,6 +378,7 @@ void processor_t::take_trap(trap_t& t, reg_t epc)
     reg_t vector = (state.mtvec & 1) && interrupt ? 4*bit : 0;
     state.pc = (state.mtvec & ~(reg_t)1) + vector;
     state.mepc = epc;
+    state.mesvstate = svstate;
     state.mcause = t.cause();
     state.mtval = t.get_tval();
 
@@ -327,36 +415,258 @@ int processor_t::paddr_bits()
   return max_xlen == 64 ? 50 : 34;
 }
 
-void processor_t::set_csr(int which, reg_t val)
+void state_t::get_csr_start_end(int &start, int &end)
 {
-  val = zext_xlen(val);
+    start = sv().state_bank * 4;
+    end = start + (1 << (sv().state_size+1));
+    start = std::min(sv_csr_sz(), start);
+    end = std::min(sv_csr_sz(), end);
+    fprintf(stderr, "sv state csr start/end: %d %d\n", start, end);
+}
+
+void state_t::sv_csr_reg_unpack()
+{
+    // okaaay and now "unpack" the CAM to make it easier to use.  this
+    // approach is not designed to be efficient right now.  optimise later
+    // first clear the old tables
+    memset(sv().sv_int_tb, 0, sizeof(sv().sv_int_tb));
+    memset(sv().sv_fp_tb, 0, sizeof(sv().sv_fp_tb));
+    // now walk the CAM and unpack it
+    int start = 0;
+    int end = 0;
+    get_csr_start_end(start, end);
+    for (int i = start; i < end; i++)
+    {
+        union sv_reg_csr_entry *c = &sv().sv_csrs[i];
+        uint64_t idx = c->b.regkey;
+        sv_reg_entry *r;
+        if (c->u == 0)
+        {
+            break;
+        }
+        // XXX damn.  this basically duplicates sv_insn_t::get_regentry.
+        if (c->b.type == 1)
+        {
+            r = &sv().sv_int_tb[idx];
+        }
+        else
+        {
+            r = &sv().sv_fp_tb[idx];
+        }
+        r->elwidth = c->b.elwidth;
+        r->regidx = c->b.regidx;
+        r->isvec = c->b.isvec;
+        r->active = true;
+        fprintf(stderr, "setting REGCFG type:%d isvec:%d %d %d\n",
+                        c->b.type, r->isvec, (int)idx, (int)r->regidx);
+    }
+}
+
+void state_t::sv_csr_pred_unpack()
+{
+    memset(sv().sv_pred_int_tb, 0, sizeof(sv().sv_pred_int_tb));
+    memset(sv().sv_pred_fp_tb, 0, sizeof(sv().sv_pred_fp_tb));
+    int start = 0;
+    int end = 0;
+    get_csr_start_end(start, end);
+    for (int i = start; i < end; i++)
+    {
+        union sv_pred_csr_entry *c = &sv().sv_pred_csrs[i];
+        uint64_t idx = c->b.regkey;
+        if (c->u == 0)
+        {
+            break;
+        }
+        sv_pred_entry *r;
+        // XXX damn.  this basically duplicates sv_insn_t::get_predentry.
+        if (c->b.type == 1)
+        {
+            r = &sv().sv_pred_int_tb[idx];
+        }
+        else
+        {
+            r = &sv().sv_pred_fp_tb[idx];
+        }
+        r->regidx = c->b.regidx;
+        r->zero   = c->b.zero;
+        r->inv    = c->b.inv;
+        r->ffirst = c->b.ffirst;
+        r->active = true;
+        fprintf(stderr, "setting PREDCFG %d type:%d zero:%d %d %d\n",
+                        i, c->b.type, r->zero, (int)idx, (int)r->regidx);
+    }
+}
+
+reg_t processor_t::set_csr(int which, reg_t val, bool imm_mode)
+{
+  reg_t old_val = get_csr(which);
+  val = _zext_xlen(val);
   reg_t delegable_ints = MIP_SSIP | MIP_STIP | MIP_SEIP
                        | ((ext != NULL) << IRQ_COP);
   reg_t all_ints = delegable_ints | MIP_MSIP | MIP_MTIP;
-#ifdef SPIKE_SIMPLEV
-  // SV SETVL includes the target register in the lower bits (0-31)
-  uint64_t sv_target = 0;
-  uint64_t sv_which = which & ~CSR_SVSETVL_MASK;
-  if (sv_which == CSR_SVSETVL_BASE)
-  {
-    sv_target = which & CSR_SVSETVL_MASK;
-    which = sv_which;
-  }
-#endif
+  fprintf(stderr, "set CSR %x %lx\n", which, val);
   switch (which)
   {
 #ifdef SPIKE_SIMPLEV
-    case CSR_SVSETVL_BASE:
-      val = std::min((uint64_t)63,
-                 std::min((uint64_t)val,
-                           state.XPR[sv_target]));
-      // use CSR_SVSETVL_R0 to set VL to zero without side-effects
-      if (sv_target != 0)
+    case CSR_SV_MVL:
+      state.sv().mvl = std::min(val+1, (uint64_t)64); // limited to XLEN width
+      old_val = state.sv().mvl - 1;
+      // TODO XXX throw exception if val == 0
+      fprintf(stderr, "set MVL %lx\n", state.sv().mvl);
+      break;
+    case CSR_SV_STATE:
+    {
+      // bits 0-5: mvl - 6-11: vl - 12-17: srcoffs - 18-23: destoffs
+      set_csr(CSR_SV_MVL, get_field(val, SV_STATE_VL ));
+      set_csr(CSR_SV_VL , get_field(val, SV_STATE_MVL));
+      set_csr(CSR_SV_SUBVL , get_field(val, SV_STATE_SUBVL)+1);
+      // decode (and limit) src/dest VL offsets
+      reg_t srcoffs = get_field(val, SV_STATE_SRCOFFS);
+      reg_t destoffs = get_field(val, SV_STATE_DESTOFFS);
+      state.sv().srcoffs  = std::min(srcoffs , state.sv().vl-1);
+      state.sv().destoffs = std::min(destoffs, state.sv().vl-1);
+      // decode (and limit) src/dest SUBVL offsets
+      reg_t subdestoffs = get_field(val, SV_STATE_DSVOFFS);
+      state.sv().dsvoffs = std::min(subdestoffs, state.sv().subvl-1);
+      //int state_bank = get_field(val, SV_STATE_BANK);
+      //int state_size = get_field(val, SV_STATE_SIZE);
+      //set_csr(CSR_USVCFG, state_bank | (state_size << 3));
+      break;
+    }
+    case CSR_SV_CFG:
+    {
+      int old_bank = state.sv().state_bank;
+      int old_size = state.sv().state_size;
+      state.sv().state_bank = get_field(val, SV_CFG_BANK);
+      state.sv().state_size = get_field(val, SV_CFG_SIZE);
+      if (old_bank != state.sv().state_bank ||
+          old_size != state.sv().state_size)
       {
-          state.XPR.write(sv_target, val);
+        // if the bank or size is changed, the csrs that are enabled
+        // also changes.  easiest thing in software: recalculate them all
+        state.sv_csr_pred_unpack();
+        state.sv_csr_reg_unpack();
       }
-      state.vl = val;
       break;
+    }
+    case CSR_SV_SUBVL:
+      state.sv().subvl = std::max(1, std::min(4, (int)val));
+      old_val = state.sv().subvl;
+      // TODO XXX throw exception if val attempted to be set == 0
+      fprintf(stderr, "set SUBVL %lx\n", state.sv().subvl);
+      break;
+    case CSR_SV_VL:
+      state.sv().vl = std::min(state.sv().mvl, val + 1);
+      old_val = state.sv().mvl - 1;
+      // TODO XXX throw exception if val == 0
+      fprintf(stderr, "set VL %lx\n", state.sv().vl);
+      break;
+    case CSR_SVREGTOP:
+    case CSR_SVREGBOT:
+    {
+      bool top = (which == CSR_SVREGTOP);
+      uint64_t v = (uint64_t)val;
+      fprintf(stderr, "set SVREG %d %lx\n", top, v);
+      int start = 0;
+      int end = 0;
+      state.get_csr_start_end(start, end);
+      uint64_t res_old = 0;
+      int num_entries = val & 0xf;
+      int max_xlen_entries = (xlen == 64) ? 4 : 2;
+      if (!imm_mode) {
+          num_entries = max_xlen_entries;
+      }
+      // read 2 16-bit entries for RV32, 4 16-bit entries for RV64
+      int popidx = 0;
+      for (int i = 0; i < num_entries; i++) {
+          uint64_t svcfg = 0;
+          if (!imm_mode) {
+              uint64_t mask = 0xffffUL << (i*16UL);
+              svcfg = get_field(v, mask);
+              fprintf(stderr, "SVREG mask %lx cfg %lx\n", mask, svcfg);
+              if (!svcfg && i > 0) {
+                break;
+              }
+          }
+          // see regpush on how this works.
+          uint64_t res = state.sv().regpush(svcfg, end, top);
+          if (res != 0) {
+              res_old |= res << (popidx * 16UL);
+              popidx += 1;
+              if (popidx == max_xlen_entries) {
+                break;
+              }
+          }
+      }
+      old_val = res_old;
+      state.sv_csr_reg_unpack();
+      break;
+    }
+    case CSR_SVPREDCFG0:
+    case CSR_SVPREDCFG1:
+    case CSR_SVPREDCFG2:
+    case CSR_SVPREDCFG3:
+    case CSR_SVPREDCFG4:
+    case CSR_SVPREDCFG5:
+    case CSR_SVPREDCFG6:
+    case CSR_SVPREDCFG7:
+    {
+      // comments removed as it's near-identical to the regs version
+      // TODO: macro-ify
+      uint64_t v = (uint64_t)val;
+      int tbidx = (which - CSR_SVPREDCFG0) * 2;
+      fprintf(stderr, "set PREDCFG %d %lx\n", tbidx, v);
+      state.sv().sv_pred_csrs[tbidx].u = get_field(v, 0xffff);
+      state.sv().sv_pred_csrs[tbidx+1].u = get_field(v, 0xffff0000);
+      int clroffset = 2;
+      if (xlen == 64)
+      {
+          state.sv().sv_pred_csrs[tbidx+2].u = get_field(v, 0xffffUL<<32);
+          state.sv().sv_pred_csrs[tbidx+3].u = get_field(v, 0xffffUL<<48);
+          clroffset = 4;
+      }
+      for (int i = tbidx+clroffset; i < 16; i++)
+      {
+          state.sv().sv_pred_csrs[i].u = 0;
+      }
+      state.sv_csr_pred_unpack();
+      break;
+    }
+    case CSR_UREMAP:
+    {
+      state.remap[0].regidx = get_field(val, SV_REMAP_REGIDX0);
+      state.remap[1].regidx = get_field(val, SV_REMAP_REGIDX1);
+      state.remap[2].regidx = get_field(val, SV_REMAP_REGIDX2);
+      state.remap[0].pred = get_field(val, SV_REMAP_PRED0);
+      state.remap[1].pred = get_field(val, SV_REMAP_PRED1);
+      state.remap[2].pred = get_field(val, SV_REMAP_PRED2);
+      state.remap[0].shape = get_field(val, SV_REMAP_SHAPE0);
+      state.remap[1].shape = get_field(val, SV_REMAP_SHAPE1);
+      state.remap[2].shape = get_field(val, SV_REMAP_SHAPE2);
+      break;
+    }
+    case CSR_USHAPE0:
+    case CSR_USHAPE1:
+    case CSR_USHAPE2:
+    {
+      int shapeidx = which - CSR_USHAPE0;
+      state.shape[shapeidx].xsz = get_field(val, SV_SHAPE_XDIM) + 1;
+      state.shape[shapeidx].ysz = get_field(val, SV_SHAPE_YDIM) + 1;
+      state.shape[shapeidx].zsz = get_field(val, SV_SHAPE_ZDIM) + 1;
+      state.shape[shapeidx].offs = (get_field(val, (1<<7 )) ? 0x1 : 0) |
+                                   (get_field(val, (1<<15)) ? 0x2 : 0) |
+                                   (get_field(val, (1<<23)) ? 0x4 : 0);
+      state.shape[shapeidx].permute = get_field(val, SV_SHAPE_PERM);
+      state.shape[shapeidx].setup_map();
+      fprintf(stderr, "sv shape %d x %d y %d z %d offs %d perm %d\n",
+              shapeidx,
+              state.shape[shapeidx].xsz,
+              state.shape[shapeidx].ysz,
+              state.shape[shapeidx].zsz,
+              state.shape[shapeidx].offs,
+              state.shape[shapeidx].permute);
+      break;
+    }
 #endif
     case CSR_FFLAGS:
       dirty_fp_state;
@@ -471,11 +781,13 @@ void processor_t::set_csr(int which, reg_t val)
       break;
     }
     case CSR_SEPC: state.sepc = val & ~(reg_t)1; break;
+    case CSR_SESVSTATE: state.sesvstate = val; break;
     case CSR_STVEC: state.stvec = val >> 2 << 2; break;
     case CSR_SSCRATCH: state.sscratch = val; break;
     case CSR_SCAUSE: state.scause = val; break;
     case CSR_STVAL: state.stval = val; break;
     case CSR_MEPC: state.mepc = val & ~(reg_t)1; break;
+    case CSR_MESVSTATE: state.mesvstate = val; break;
     case CSR_MTVEC: state.mtvec = val & ~(reg_t)2; break;
     case CSR_MSCRATCH: state.mscratch = val; break;
     case CSR_MCAUSE: state.mcause = val; break;
@@ -555,6 +867,7 @@ void processor_t::set_csr(int which, reg_t val)
       state.dscratch = val;
       break;
   }
+  return old_val;
 }
 
 reg_t processor_t::get_csr(int which)
@@ -582,8 +895,43 @@ reg_t processor_t::get_csr(int which)
   switch (which)
   {
 #ifdef SPIKE_SIMPLEV
-    case CSR_SVGETV:
-      return state.vl;
+    case CSR_SV_VL:
+      return state.sv().vl;
+    case CSR_SV_CFG:
+      return (state.sv().state_bank)      | (state.sv().state_size<<3);
+    case CSR_SV_STATE:
+      fprintf(stderr, "get CSR_SV_STATE vl %ld mvl %ld subvl %ld\n",
+                            state.sv().vl,
+                            state.sv().mvl,
+                            state.sv().subvl);
+      return ((std::max((int)state.sv().vl, 1))-1)     |
+             ((std::max((int)state.sv().mvl, 1)-1)<<6) |
+             (state.sv().srcoffs<<12)     |
+             (state.sv().destoffs<<18) |
+             ((std::max((int)state.sv().subvl, 1)-1)<<24)   |
+             (state.sv().dsvoffs<<26);
+    case CSR_SV_MVL:
+      return state.sv().mvl;
+    case CSR_SV_SUBVL:
+      return state.sv().subvl;
+    case CSR_SVREGTOP:
+    case CSR_SVREGBOT:
+      return 0;// XXX TODO: return correct entry
+    case CSR_SVPREDCFG0:
+    case CSR_SVPREDCFG1:
+    case CSR_SVPREDCFG2:
+    case CSR_SVPREDCFG3:
+    case CSR_SVPREDCFG4:
+    case CSR_SVPREDCFG5:
+    case CSR_SVPREDCFG6:
+    case CSR_SVPREDCFG7:
+      return 0;// XXX TODO: return correct entry
+    case CSR_UREMAP:
+      return 0;// XXX TODO: return correct entry
+    case CSR_USHAPE0:
+    case CSR_USHAPE1:
+    case CSR_USHAPE2:
+      return 0;// XXX TODO: return correct entry
 #endif
     case CSR_FFLAGS:
       require_fp;
@@ -632,6 +980,7 @@ reg_t processor_t::get_csr(int which)
     case CSR_SIP: return state.mip & state.mideleg;
     case CSR_SIE: return state.mie & state.mideleg;
     case CSR_SEPC: return state.sepc & pc_alignment_mask();
+    case CSR_SESVSTATE: return state.sesvstate;
     case CSR_STVAL: return state.stval;
     case CSR_STVEC: return state.stvec;
     case CSR_SCAUSE:
@@ -647,6 +996,7 @@ reg_t processor_t::get_csr(int which)
     case CSR_MIP: return state.mip;
     case CSR_MIE: return state.mie;
     case CSR_MEPC: return state.mepc & pc_alignment_mask();
+    case CSR_MESVSTATE: return state.mesvstate;
     case CSR_MSCRATCH: return state.mscratch;
     case CSR_MCAUSE: return state.mcause;
     case CSR_MTVAL: return state.mtval;
@@ -847,3 +1197,4 @@ void processor_t::trigger_updated()
     }
   }
 }
+