remove extra arg from old roundz function

[ieee754fpu.git] / src / add / fpbase.py
diff --git a/src/add/fpbase.py b/src/add/fpbase.py

index 962dfcf661aa4ba285b0562254f8c118dc815b49..db95eb13e2a4ef7ae7199c6a29e05865674fc62a 100644 (file)
--- a/src/add/fpbase.py
+++ b/src/add/fpbase.py
@@ -96,6 +96,14 @@ class FPNumBase:
          self.is_overflowed = Signal(reset_less=True)
          self.is_denormalised = Signal(reset_less=True)
          self.exp_128 = Signal(reset_less=True)
+        self.exp_sub_n126 = Signal((e_width, True), reset_less=True)
+        self.exp_lt_n126 = Signal(reset_less=True)
+        self.exp_gt_n126 = Signal(reset_less=True)
+        self.exp_gt127 = Signal(reset_less=True)
+        self.exp_n127 = Signal(reset_less=True)
+        self.exp_n126 = Signal(reset_less=True)
+        self.m_zero = Signal(reset_less=True)
+        self.m_msbzero = Signal(reset_less=True)
  
      def elaborate(self, platform):
          m = Module()
@@ -105,27 +113,38 @@ class FPNumBase:
          m.d.comb += self.is_overflowed.eq(self._is_overflowed())
          m.d.comb += self.is_denormalised.eq(self._is_denormalised())
          m.d.comb += self.exp_128.eq(self.e == self.P128)
+        m.d.comb += self.exp_sub_n126.eq(self.e - self.N126)
+        m.d.comb += self.exp_gt_n126.eq(self.exp_sub_n126 > 0)
+        m.d.comb += self.exp_lt_n126.eq(self.exp_sub_n126 < 0)
+        m.d.comb += self.exp_gt127.eq(self.e > self.P127)
+        m.d.comb += self.exp_n127.eq(self.e == self.N127)
+        m.d.comb += self.exp_n126.eq(self.e == self.N126)
+        m.d.comb += self.m_zero.eq(self.m == self.mzero)
+        m.d.comb += self.m_msbzero.eq(self.m[self.e_start] == 0)
  
          return m
  
      def _is_nan(self):
-        return (self.e == self.P128) & (self.m != 0)
+        return (self.exp_128) & (~self.m_zero)
  
      def _is_inf(self):
-        return (self.e == self.P128) & (self.m == 0)
+        return (self.exp_128) & (self.m_zero)
  
      def _is_zero(self):
-        return (self.e == self.N127) & (self.m == self.mzero)
+        return (self.exp_n127) & (self.m_zero)
  
      def _is_overflowed(self):
-        return (self.e > self.P127)
+        return self.exp_gt127
  
      def _is_denormalised(self):
-        return (self.e == self.N126) & (self.m[self.e_start] == 0)
+        return (self.exp_n126) & (self.m_msbzero)
+
+    def copy(self, inp):
+        return [self.s.eq(inp.s), self.e.eq(inp.e), self.m.eq(inp.m)]
  
  
  class FPNumOut(FPNumBase):
-    """ Floating-point Number Class, variable-width TODO (currently 32-bit)
+    """ Floating-point Number Class
  
          Contains signals for an incoming copy of the value, decoded into
          sign / exponent / mantissa.
@@ -165,8 +184,122 @@ class FPNumOut(FPNumBase):
          return self.create(s, self.N127, 0)
  
  
+class MultiShiftRMerge:
+    """ shifts down (right) and merges lower bits into m[0].
+        m[0] is the "sticky" bit, basically
+    """
+    def __init__(self, width, s_max=None):
+        if s_max is None:
+            s_max = int(log(width) / log(2))
+        self.smax = s_max
+        self.m = Signal(width, reset_less=True)
+        self.inp = Signal(width, reset_less=True)
+        self.diff = Signal(s_max, reset_less=True)
+        self.width = width
+
+    def elaborate(self, platform):
+        m = Module()
+
+        rs = Signal(self.width, reset_less=True)
+        m_mask = Signal(self.width, reset_less=True)
+        smask = Signal(self.width, reset_less=True)
+        stickybit = Signal(reset_less=True)
+        maxslen = Signal(self.smax, reset_less=True)
+        maxsleni = Signal(self.smax, reset_less=True)
+
+        sm = MultiShift(self.width-1)
+        m0s = Const(0, self.width-1)
+        mw = Const(self.width-1, len(self.diff))
+        m.d.comb += [maxslen.eq(Mux(self.diff > mw, mw, self.diff)),
+                     maxsleni.eq(Mux(self.diff > mw, 0, mw-self.diff)),
+                    ]
+
+        m.d.comb += [
+                # shift mantissa by maxslen, mask by inverse
+                rs.eq(sm.rshift(self.inp[1:], maxslen)),
+                m_mask.eq(sm.rshift(~m0s, maxsleni)),
+                smask.eq(self.inp[1:] & m_mask),
+                # sticky bit combines all mask (and mantissa low bit)
+                stickybit.eq(smask.bool() | self.inp[0]),
+                # mantissa result contains m[0] already.
+                self.m.eq(Cat(stickybit, rs))
+           ]
+        return m
+
+
+class FPNumShift(FPNumBase):
+    """ Floating-point Number Class for shifting
+    """
+    def __init__(self, mainm, op, inv, width, m_extra=True):
+        FPNumBase.__init__(self, width, m_extra)
+        self.latch_in = Signal()
+        self.mainm = mainm
+        self.inv = inv
+        self.op = op
+
+    def elaborate(self, platform):
+        m = FPNumBase.elaborate(self, platform)
+
+        m.d.comb += self.s.eq(op.s)
+        m.d.comb += self.e.eq(op.e)
+        m.d.comb += self.m.eq(op.m)
+
+        with self.mainm.State("align"):
+            with m.If(self.e < self.inv.e):
+                m.d.sync += self.shift_down()
+
+        return m
+
+    def shift_down(self, inp):
+        """ shifts a mantissa down by one. exponent is increased to compensate
+
+            accuracy is lost as a result in the mantissa however there are 3
+            guard bits (the latter of which is the "sticky" bit)
+        """
+        return [self.e.eq(inp.e + 1),
+                self.m.eq(Cat(inp.m[0] | inp.m[1], inp.m[2:], 0))
+               ]
+
+    def shift_down_multi(self, diff):
+        """ shifts a mantissa down. exponent is increased to compensate
+
+            accuracy is lost as a result in the mantissa however there are 3
+            guard bits (the latter of which is the "sticky" bit)
+
+            this code works by variable-shifting the mantissa by up to
+            its maximum bit-length: no point doing more (it'll still be
+            zero).
+
+            the sticky bit is computed by shifting a batch of 1s by
+            the same amount, which will introduce zeros.  it's then
+            inverted and used as a mask to get the LSBs of the mantissa.
+            those are then |'d into the sticky bit.
+        """
+        sm = MultiShift(self.width)
+        mw = Const(self.m_width-1, len(diff))
+        maxslen = Mux(diff > mw, mw, diff)
+        rs = sm.rshift(self.m[1:], maxslen)
+        maxsleni = mw - maxslen
+        m_mask = sm.rshift(self.m1s[1:], maxsleni) # shift and invert
+
+        stickybits = reduce(or_, self.m[1:] & m_mask) | self.m[0]
+        return [self.e.eq(self.e + diff),
+                self.m.eq(Cat(stickybits, rs))
+               ]
+
+    def shift_up_multi(self, diff):
+        """ shifts a mantissa up. exponent is decreased to compensate
+        """
+        sm = MultiShift(self.width)
+        mw = Const(self.m_width, len(diff))
+        maxslen = Mux(diff > mw, mw, diff)
+
+        return [self.e.eq(self.e - diff),
+                self.m.eq(sm.lshift(self.m, maxslen))
+               ]
+
  class FPNumIn(FPNumBase):
-    """ Floating-point Number Class, variable-width TODO (currently 32-bit)
+    """ Floating-point Number Class
  
          Contains signals for an incoming copy of the value, decoded into
          sign / exponent / mantissa.
@@ -185,9 +318,9 @@ class FPNumIn(FPNumBase):
      def elaborate(self, platform):
          m = FPNumBase.elaborate(self, platform)
  
-        m.d.comb += self.latch_in.eq(self.op.ack & self.op.stb)
-        with m.If(self.latch_in):
-            m.d.sync += self.decode(self.v)
+        #m.d.comb += self.latch_in.eq(self.op.ack & self.op.stb)
+        #with m.If(self.latch_in):
+        #    m.d.sync += self.decode(self.v)
  
          return m
  
@@ -205,17 +338,17 @@ class FPNumIn(FPNumBase):
                  self.s.eq(v[-1]),                 # sign
                  ]
  
-    def shift_down(self):
+    def shift_down(self, inp):
          """ shifts a mantissa down by one. exponent is increased to compensate
  
              accuracy is lost as a result in the mantissa however there are 3
              guard bits (the latter of which is the "sticky" bit)
          """
-        return [self.e.eq(self.e + 1),
-                self.m.eq(Cat(self.m[0] | self.m[1], self.m[2:], 0))
+        return [self.e.eq(inp.e + 1),
+                self.m.eq(Cat(inp.m[0] | inp.m[1], inp.m[2:], 0))
                 ]
  
-    def shift_down_multi(self, diff):
+    def shift_down_multi(self, diff, inp=None):
          """ shifts a mantissa down. exponent is increased to compensate
  
              accuracy is lost as a result in the mantissa however there are 3
@@ -230,16 +363,19 @@ class FPNumIn(FPNumBase):
              inverted and used as a mask to get the LSBs of the mantissa.
              those are then |'d into the sticky bit.
          """
+        if inp is None:
+            inp = self
          sm = MultiShift(self.width)
          mw = Const(self.m_width-1, len(diff))
          maxslen = Mux(diff > mw, mw, diff)
-        rs = sm.rshift(self.m[1:], maxslen)
+        rs = sm.rshift(inp.m[1:], maxslen)
          maxsleni = mw - maxslen
          m_mask = sm.rshift(self.m1s[1:], maxsleni) # shift and invert
  
-        stickybits = reduce(or_, self.m[1:] & m_mask) | self.m[0]
-        return [self.e.eq(self.e + diff),
-                self.m.eq(Cat(stickybits, rs))
+        #stickybit = reduce(or_, inp.m[1:] & m_mask) | inp.m[0]
+        stickybit = (inp.m[1:] & m_mask).bool() | inp.m[0]
+        return [self.e.eq(inp.e + diff),
+                self.m.eq(Cat(stickybit, rs))
                 ]
  
      def shift_up_multi(self, diff):
@@ -253,13 +389,57 @@ class FPNumIn(FPNumBase):
                  self.m.eq(sm.lshift(self.m, maxslen))
                 ]
  
-class FPOp:
+class Trigger:
+    def __init__(self):
+
+        self.stb = Signal(reset=0)
+        self.ack = Signal()
+        self.trigger = Signal(reset_less=True)
+
+    def elaborate(self, platform):
+        m = Module()
+        m.d.comb += self.trigger.eq(self.stb & self.ack)
+        return m
+
+    def copy(self, inp):
+        return [self.stb.eq(inp.stb),
+                self.ack.eq(inp.ack)
+               ]
+
+    def ports(self):
+        return [self.stb, self.ack]
+
+
+class FPOp(Trigger):
      def __init__(self, width):
+        Trigger.__init__(self)
          self.width = width
  
          self.v   = Signal(width)
-        self.stb = Signal()
-        self.ack = Signal()
+
+    def chain_inv(self, in_op, extra=None):
+        stb = in_op.stb
+        if extra is not None:
+            stb = stb & extra
+        return [self.v.eq(in_op.v),          # receive value
+                self.stb.eq(stb),      # receive STB
+                in_op.ack.eq(~self.ack), # send ACK
+               ]
+
+    def chain_from(self, in_op, extra=None):
+        stb = in_op.stb
+        if extra is not None:
+            stb = stb & extra
+        return [self.v.eq(in_op.v),          # receive value
+                self.stb.eq(stb),      # receive STB
+                in_op.ack.eq(self.ack), # send ACK
+               ]
+
+    def copy(self, inp):
+        return [self.v.eq(inp.v),
+                self.stb.eq(inp.stb),
+                self.ack.eq(inp.ack)
+               ]
  
      def ports(self):
          return [self.v, self.stb, self.ack]
@@ -274,6 +454,12 @@ class Overflow:
  
          self.roundz = Signal(reset_less=True)
  
+    def copy(self, inp):
+        return [self.guard.eq(inp.guard),
+                self.round_bit.eq(inp.round_bit),
+                self.sticky.eq(inp.sticky),
+                self.m0.eq(inp.m0)]
+
      def elaborate(self, platform):
          m = Module()
          m.d.comb += self.roundz.eq(self.guard & \
@@ -298,6 +484,7 @@ class FPBase:
              m.next = next_state
              m.d.sync += [
                  # op is latched in from FPNumIn class on same ack/stb
+                v.decode(op.v),
                  op.ack.eq(0)
              ]
          with m.Else():
@@ -313,7 +500,7 @@ class FPBase:
              both cases *effectively multiply the number stored by 2*,
              which has to be taken into account when extracting the result.
          """
-        with m.If(a.e == a.N127):
+        with m.If(a.exp_n127):
              m.d.sync += a.e.eq(a.N126) # limit a exponent
          with m.Else():
              m.d.sync += a.m[-1].eq(1) # set top mantissa bit
@@ -371,11 +558,10 @@ class FPBase:
          with m.Else():
              m.next = next_state
  
-    def roundz(self, m, z, of, next_state):
+    def roundz(self, m, z, roundz):
          """ performs rounding on the output.  TODO: different kinds of rounding
          """
-        m.next = next_state
-        with m.If(of.roundz):
+        with m.If(roundz):
              m.d.sync += z.m.eq(z.m + 1) # mantissa rounds up
              with m.If(z.m == z.m1s): # all 1s
                  m.d.sync += z.e.eq(z.e + 1) # exponent rounds up