主要为语音和视觉。

人工智能时代(AI),人机交互在我们的日常生活中已经得到广泛的应用。

语音指的是用户通过直接发出声音,机器的麦克风接收后转化为指令。

视觉指的是用户通过手势、人脸容貌表情等动作,机器通过摄像头接收后转化为指令。