Allow scalar fallback for pattern root stmt
authorRichard Biener <rguenther@suse.de>
Thu, 10 Dec 2020 09:34:32 +0000 (10:34 +0100)
committerRichard Biener <rguenther@suse.de>
Thu, 10 Dec 2020 09:39:53 +0000 (10:39 +0100)
This adjusts the SLP build to allow a pattern root stmt to be
built from scalars.  I've noticed this in PR98211 where we fail
to promote a SLP subtree to a simple splat operation and instead
emit a series of uniform vector operations.  The bb-slp-div-1.c
testcase is now vectorized on x86_64 but only the store so I
adjusted it to expect the load to be vectorized.

2020-12-10  Richard Biener  <rguenther@suse.de>

* tree-vect-slp.c (vect_get_and_check_slp_defs): Do
not mark the defs to occur in a pattern if it is the
pattern root and record the original stmt defs in that
case.

* gcc.dg/vect/bb-slp-div-1.c: Expect the load to be
vectorized.

gcc/testsuite/gcc.dg/vect/bb-slp-div-1.c
gcc/tree-vect-slp.c

index 87ffc9b897b8e23330187f864ad534a1f47193d7..1eea9233b701fa775bd3e986c409aca333eae179 100644 (file)
@@ -16,4 +16,7 @@ f (void)
   x[7] /= 9;
 }
 
-/* { dg-final { scan-tree-dump "optimized: basic block" "slp2" { xfail *-*-* } } } */
+/* We can vectorize the store from a CTOR built from scalar division
+   results but ideally we'd like to see vectorizing the load and the
+   division as well.  */
+/* { dg-final { scan-tree-dump "transform load" "slp2" { xfail *-*-* } } } */
index d248ce2c3f71d947e950207a518707af59ab51eb..e93e9c7a2d3d9810147299831d5634feaab8ed7e 100644 (file)
@@ -544,12 +544,21 @@ vect_get_and_check_slp_defs (vec_info *vinfo, unsigned char swap,
          continue;
        }
 
-      if (def_stmt_info && is_pattern_stmt_p (def_stmt_info))
-       oprnd_info->any_pattern = true;
-
       oprnd_info->def_stmts.quick_push (def_stmt_info);
       oprnd_info->ops.quick_push (oprnd);
 
+      if (def_stmt_info
+         && is_pattern_stmt_p (def_stmt_info))
+       {
+         if (STMT_VINFO_RELATED_STMT (vect_orig_stmt (def_stmt_info))
+             != def_stmt_info)
+           oprnd_info->any_pattern = true;
+         else
+           /* If we promote this to external use the original stmt def.  */
+           oprnd_info->ops.last ()
+             = gimple_get_lhs (vect_orig_stmt (def_stmt_info)->stmt);
+       }
+
       /* If there's a extern def on a backedge make sure we can
         code-generate at the region start.
         ???  This is another case that could be fixed by adjusting