agx: mv agx_read/write_regs to validator

since agx_index::channels is now always correct. Signed-off-by: Alyssa Rosenzweig <alyssa@rosenzweig.io> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/26963>
2023-12-24 13:01:01 -04:00
parent b7da198274
commit b8c80c5e80
3 changed files with 157 additions and 158 deletions
--- a/src/asahi/compiler/agx_compiler.h
+++ b/src/asahi/compiler/agx_compiler.h
@@ -874,8 +874,7 @@ agx_validate(UNUSED agx_context *ctx, UNUSED const char *after_str)
 }
 #endif

-unsigned agx_read_registers(const agx_instr *I, unsigned s);
-unsigned agx_write_registers(const agx_instr *I, unsigned d);
+enum agx_size agx_split_width(const agx_instr *I);
 bool agx_allows_16bit_immediate(agx_instr *I);

 struct agx_copy {
--- a/src/asahi/compiler/agx_register_allocate.c
+++ b/src/asahi/compiler/agx_register_allocate.c
@@ -38,43 +38,7 @@ struct ra_ctx {
   unsigned bound;
 };

-/** Returns number of registers written by an instruction */
-unsigned
-agx_write_registers(const agx_instr *I, unsigned d)
-{
-   unsigned size = agx_size_align_16(I->dest[d].size);
-
-   switch (I->op) {
-   case AGX_OPCODE_ITER:
-   case AGX_OPCODE_ITERPROJ:
-      assert(1 <= I->channels && I->channels <= 4);
-      return I->channels * size;
-
-   case AGX_OPCODE_IMAGE_LOAD:
-   case AGX_OPCODE_TEXTURE_LOAD:
-   case AGX_OPCODE_TEXTURE_SAMPLE:
-      /* Even when masked out, these clobber 4 registers */
-      return 4 * size;
-
-   case AGX_OPCODE_DEVICE_LOAD:
-   case AGX_OPCODE_LOCAL_LOAD:
-   case AGX_OPCODE_STACK_LOAD:
-   case AGX_OPCODE_LD_TILE:
-      /* Can write 16-bit or 32-bit. Anything logically 64-bit is already
-       * expanded to 32-bit in the mask.
-       */
-      return util_bitcount(I->mask) * MIN2(size, 2);
-
-   case AGX_OPCODE_LDCF:
-      return 6;
-   case AGX_OPCODE_COLLECT:
-      return I->nr_srcs * agx_size_align_16(I->src[0].size);
-   default:
-      return size;
-   }
-}
-
-static inline enum agx_size
+enum agx_size
 agx_split_width(const agx_instr *I)
 {
   enum agx_size width = ~0;
@@ -92,38 +56,6 @@ agx_split_width(const agx_instr *I)
   return width;
 }

-/*
- * Return number of registers required for coordinates for a
- * texture/image instruction. We handle layer + sample index as 32-bit even when
- * only the lower 16-bits are present.
- */
-static unsigned
-agx_coordinate_registers(const agx_instr *I)
-{
-   switch (I->dim) {
-   case AGX_DIM_1D:
-      return 2 * 1;
-   case AGX_DIM_1D_ARRAY:
-      return 2 * 2;
-   case AGX_DIM_2D:
-      return 2 * 2;
-   case AGX_DIM_2D_ARRAY:
-      return 2 * 3;
-   case AGX_DIM_2D_MS:
-      return 2 * 3;
-   case AGX_DIM_3D:
-      return 2 * 3;
-   case AGX_DIM_CUBE:
-      return 2 * 3;
-   case AGX_DIM_CUBE_ARRAY:
-      return 2 * 4;
-   case AGX_DIM_2D_MS_ARRAY:
-      return 2 * 3;
-   }
-
-   unreachable("Invalid texture dimension");
-}
-
 /*
 * Calculate register demand in 16-bit registers. Becuase we allocate in SSA,
 * this calculation is exact in linear-time. Depends on liveness information.
@@ -216,93 +148,6 @@ agx_calc_register_demand(agx_context *ctx, uint8_t *widths)
   return max_demand;
 }

-unsigned
-agx_read_registers(const agx_instr *I, unsigned s)
-{
-   unsigned size = agx_size_align_16(I->src[s].size);
-
-   switch (I->op) {
-   case AGX_OPCODE_SPLIT:
-      return I->nr_dests * agx_size_align_16(agx_split_width(I));
-
-   case AGX_OPCODE_DEVICE_STORE:
-   case AGX_OPCODE_LOCAL_STORE:
-   case AGX_OPCODE_STACK_STORE:
-   case AGX_OPCODE_ST_TILE:
-      /* See agx_write_registers */
-      if (s == 0)
-         return util_bitcount(I->mask) * MIN2(size, 2);
-      else
-         return size;
-
-   case AGX_OPCODE_ZS_EMIT:
-      if (s == 1) {
-         /* Depth (bit 0) is fp32, stencil (bit 1) is u16 in the hw but we pad
-          * up to u32 for simplicity
-          */
-         bool z = !!(I->zs & 1);
-         bool s = !!(I->zs & 2);
-         assert(z || s);
-
-         return (z && s) ? 4 : z ? 2 : 1;
-      } else {
-         return 1;
-      }
-
-   case AGX_OPCODE_IMAGE_WRITE:
-      if (s == 0)
-         return 4 * size /* data */;
-      else if (s == 1)
-         return agx_coordinate_registers(I);
-      else
-         return size;
-
-   case AGX_OPCODE_IMAGE_LOAD:
-   case AGX_OPCODE_TEXTURE_LOAD:
-   case AGX_OPCODE_TEXTURE_SAMPLE:
-      if (s == 0) {
-         return agx_coordinate_registers(I);
-      } else if (s == 1) {
-         /* LOD */
-         if (I->lod_mode == AGX_LOD_MODE_LOD_GRAD) {
-            switch (I->dim) {
-            case AGX_DIM_1D:
-            case AGX_DIM_1D_ARRAY:
-               return 2 * 2 * 1;
-            case AGX_DIM_2D:
-            case AGX_DIM_2D_ARRAY:
-            case AGX_DIM_2D_MS_ARRAY:
-            case AGX_DIM_2D_MS:
-               return 2 * 2 * 2;
-            case AGX_DIM_CUBE:
-            case AGX_DIM_CUBE_ARRAY:
-            case AGX_DIM_3D:
-               return 2 * 2 * 3;
-            }
-
-            unreachable("Invalid texture dimension");
-         } else {
-            return 1;
-         }
-      } else if (s == 5) {
-         /* Compare/offset */
-         return 2 * ((!!I->shadow) + (!!I->offset));
-      } else {
-         return size;
-      }
-
-   case AGX_OPCODE_ATOMIC:
-   case AGX_OPCODE_LOCAL_ATOMIC:
-      if (s == 0 && I->atomic_opc == AGX_ATOMIC_OPC_CMPXCHG)
-         return size * 2;
-      else
-         return size;
-
-   default:
-      return size;
-   }
-}
-
 static bool
 find_regs_simple(struct ra_ctx *rctx, unsigned count, unsigned align,
                 unsigned *out)
--- a/src/asahi/compiler/agx_validate.c
+++ b/src/asahi/compiler/agx_validate.c
@@ -120,6 +120,161 @@ agx_validate_defs(agx_instr *I, BITSET_WORD *defs)
   return true;
 }

+/** Returns number of registers written by an instruction */
+static unsigned
+agx_write_registers(const agx_instr *I, unsigned d)
+{
+   unsigned size = agx_size_align_16(I->dest[d].size);
+
+   switch (I->op) {
+   case AGX_OPCODE_ITER:
+   case AGX_OPCODE_ITERPROJ:
+      assert(1 <= I->channels && I->channels <= 4);
+      return I->channels * size;
+
+   case AGX_OPCODE_IMAGE_LOAD:
+   case AGX_OPCODE_TEXTURE_LOAD:
+   case AGX_OPCODE_TEXTURE_SAMPLE:
+      /* Even when masked out, these clobber 4 registers */
+      return 4 * size;
+
+   case AGX_OPCODE_DEVICE_LOAD:
+   case AGX_OPCODE_LOCAL_LOAD:
+   case AGX_OPCODE_STACK_LOAD:
+   case AGX_OPCODE_LD_TILE:
+      /* Can write 16-bit or 32-bit. Anything logically 64-bit is already
+       * expanded to 32-bit in the mask.
+       */
+      return util_bitcount(I->mask) * MIN2(size, 2);
+
+   case AGX_OPCODE_LDCF:
+      return 6;
+   case AGX_OPCODE_COLLECT:
+      return I->nr_srcs * agx_size_align_16(I->src[0].size);
+   default:
+      return size;
+   }
+}
+
+/*
+ * Return number of registers required for coordinates for a
+ * texture/image instruction. We handle layer + sample index as 32-bit even when
+ * only the lower 16-bits are present.
+ */
+static unsigned
+agx_coordinate_registers(const agx_instr *I)
+{
+   switch (I->dim) {
+   case AGX_DIM_1D:
+      return 2 * 1;
+   case AGX_DIM_1D_ARRAY:
+      return 2 * 2;
+   case AGX_DIM_2D:
+      return 2 * 2;
+   case AGX_DIM_2D_ARRAY:
+      return 2 * 3;
+   case AGX_DIM_2D_MS:
+      return 2 * 3;
+   case AGX_DIM_3D:
+      return 2 * 3;
+   case AGX_DIM_CUBE:
+      return 2 * 3;
+   case AGX_DIM_CUBE_ARRAY:
+      return 2 * 4;
+   case AGX_DIM_2D_MS_ARRAY:
+      return 2 * 3;
+   }
+
+   unreachable("Invalid texture dimension");
+}
+
+static unsigned
+agx_read_registers(const agx_instr *I, unsigned s)
+{
+   unsigned size = agx_size_align_16(I->src[s].size);
+
+   switch (I->op) {
+   case AGX_OPCODE_SPLIT:
+      return I->nr_dests * agx_size_align_16(agx_split_width(I));
+
+   case AGX_OPCODE_DEVICE_STORE:
+   case AGX_OPCODE_LOCAL_STORE:
+   case AGX_OPCODE_STACK_STORE:
+   case AGX_OPCODE_ST_TILE:
+      /* See agx_write_registers */
+      if (s == 0)
+         return util_bitcount(I->mask) * MIN2(size, 2);
+      else
+         return size;
+
+   case AGX_OPCODE_ZS_EMIT:
+      if (s == 1) {
+         /* Depth (bit 0) is fp32, stencil (bit 1) is u16 in the hw but we pad
+          * up to u32 for simplicity
+          */
+         bool z = !!(I->zs & 1);
+         bool s = !!(I->zs & 2);
+         assert(z || s);
+
+         return (z && s) ? 4 : z ? 2 : 1;
+      } else {
+         return 1;
+      }
+
+   case AGX_OPCODE_IMAGE_WRITE:
+      if (s == 0)
+         return 4 * size /* data */;
+      else if (s == 1)
+         return agx_coordinate_registers(I);
+      else
+         return size;
+
+   case AGX_OPCODE_IMAGE_LOAD:
+   case AGX_OPCODE_TEXTURE_LOAD:
+   case AGX_OPCODE_TEXTURE_SAMPLE:
+      if (s == 0) {
+         return agx_coordinate_registers(I);
+      } else if (s == 1) {
+         /* LOD */
+         if (I->lod_mode == AGX_LOD_MODE_LOD_GRAD) {
+            switch (I->dim) {
+            case AGX_DIM_1D:
+            case AGX_DIM_1D_ARRAY:
+               return 2 * 2 * 1;
+            case AGX_DIM_2D:
+            case AGX_DIM_2D_ARRAY:
+            case AGX_DIM_2D_MS_ARRAY:
+            case AGX_DIM_2D_MS:
+               return 2 * 2 * 2;
+            case AGX_DIM_CUBE:
+            case AGX_DIM_CUBE_ARRAY:
+            case AGX_DIM_3D:
+               return 2 * 2 * 3;
+            }
+
+            unreachable("Invalid texture dimension");
+         } else {
+            return 1;
+         }
+      } else if (s == 5) {
+         /* Compare/offset */
+         return 2 * ((!!I->shadow) + (!!I->offset));
+      } else {
+         return size;
+      }
+
+   case AGX_OPCODE_ATOMIC:
+   case AGX_OPCODE_LOCAL_ATOMIC:
+      if (s == 0 && I->atomic_opc == AGX_ATOMIC_OPC_CMPXCHG)
+         return size * 2;
+      else
+         return size;
+
+   default:
+      return size;
+   }
+}
+
 /* Type check the dimensionality of sources and destinations. */
 static bool
 agx_validate_width(agx_context *ctx)