# f16
--reset

--cfg=f16f16f32,f16
--stag=ab,ba --wtag=ab,ba --dtag=ab
--runtime_dims_masks=0,2:1,1:0,3:1
--bia_dt=undef,f32 --bia_mask=2

--attr-scales=
--attr-post-ops=
--batch=shapes_2d

--attr-scales=src:common:0.25*+wei:common:0.5*+dst:common:2.25*
--attr-post-ops=sum
--batch=shapes_2d

--attr-scales=src:common:0.25*+wei:per_oc:0.5*+dst:common:2.25*
--attr-post-ops=relu
--batch=shapes_2d


--stag=ba --wtag=ab,ba --dtag=ab
--runtime_dims_masks=3:1,3:3
--bia_dt=f16 --bia_mask=1,2,3
--attr-scales=src:common:0.25*+wei:common:0.5*+dst:common:2.25*
--attr-post-ops=add:f32,sum+mul:s32:per_oc+linear:2:-1
--batch=shapes_2d

# test any
--reset
--cfg=f16f16f32,f16
--stag=ab,ba,any --wtag=ab,ba,any --dtag=ab,any
--batch=shapes_2d

# 3d
--reset
--cfg=f16f16f32,f16
--stag=abc,acb --wtag=abc,acb --dtag=abc
--bia_dt=undef,f32 --bia_mask=4,6

--runtime_dims_masks=0,1:1
--attr-post-ops=,sum
--batch=shapes_3d

--runtime_dims_masks=2:4,6:6,3:5,7:7
--attr-scales=src:common:0.25*+wei:common:0.5*+dst:common:2.25*
--attr-post-ops=sum+relu+add:u8
--batch=shapes_3d

# runtime
--reset
--skip-impl=ref

--cfg=f16f16f32,f16
--stag=ab,ba --wtag=ab,ba --dtag=ab
--runtime_dims_masks=0,2:1,0:2,2:3
--bia_dt=undef,f32
--bia_mask=2

--attr-scales=src:common:0.25*+wei:common:0.5*+dst:common:2.25*
--attr-post-ops=,sum:2+relu+mul:f32:per_oc
--batch=shapes_2d

# data-tags or non-trivial strides
--reset
--skip-impl=ref
--allow-enum-tags-only=0
--cfg=f16
--stag=acbde,bacde,cabde,abced,abdce
--dtag=acbde,bacde,cabde,abced,abdce
--wtag=abcde,acbde
3x5x7x11x13:1x1x1x13x13

# batch size smaller than num_threads
--reset
--stag=abc --wtag=abc --dtag=abc
--cfg=f16 --bia_dt=f32 --bia_mask=4
2x20x30:2x30x4
2x20x30:1x30x4
