--reset

--mb=2,16
--stag=any,axb
--dtag=any,axb
--alg=direct

# Training
## Forward
--dir=FWD_B
--cfg=f32,bf16bf16bf16,f16,f32f32s8,f16f16s8,f16f16u8
--attr-post-ops=,relu,sum:0.25+relu:0.5
--batch=shapes_basic_gpu
## Backward
--dir=BWD_D,BWD_WB
--attr-post-ops=
--batch=shapes_basic_gpu

# Inference
--dir=FWD_I
--cfg=u8s8s32,u8s8bf16,u8s8f16
--attr-oscale=,common:0.25,per_oc:5
--attr-post-ops=,sum:0.25+add:f32:per_oc+relu:0.5:0:0.75+add:f32:per_tensor
--batch=shapes_basic_gpu

### Wino with postops
--reset --cfg=f16,f32 --stag=any,nhwc --alg=wino
--match=.*[^k][^d][0-9]kh3[^0-9].*       # only 3x3 convolutions so far
--mb=2,32
--attr-post-ops=,sum:0.25+relu:0.5
--batch=shapes_basic_gpu
