Îmi place cum am decis că multimodal înseamnă doar "text + imagine înăuntru, text afară" și orice altă combinație de modalități este "omni"