
随着人工智能技术的飞速发展,AI大模型在理解人类语言方面取得了显著进展,能够越来越贴合人们日常的交互需求。与AI大模型的优秀表现相比,当下智能家居行业体验却显得不那么“智能”。
目前,多数智能家居系统依赖预设规则引擎,用户必须手动配置诸如“温度>30℃开空调”等等诸多触发条件,使得整个智能家居交互过程显得既机械又繁琐。如果能把大模型的能力接入进来,则会简单且智能很多。比如你直接说“当我读书时,帮我打开台灯,播放舒缓的音乐”,系统在识别到读书动作时就会自动完成操作。
小米认为,AI与物理世界的深度结合是智能科技的下一站,而我们在AIoT领域的所有积累,都是为了迎接这一时刻的到来,「大模型+智能家居」是行业大势所趋。
11月14日,小米发布智能家居未来探索方案XiaomiMiloco(全称XiaomiLocalCopilot),行业率先探索由大模型驱动全屋智能生活。基于大模型独特的开发范式,用户可以跟智能家居系统对话沟通,经过大模型的推理计算,自动完成家庭生活中的各类智能需求和规则,实现更广泛、更具创意的智能联动。

探索方案不仅重构了家庭智能交互范式,还高度重视隐私安全问题,端侧部署大模型保障用户隐私不被侵犯。目前,Miloco已面向全社会开放,并在GitHub上线,开发者可部署、体验,参与技术共建。
GitHub地址:https://github.com/XiaoMi/xiaomi-miloco
Miloco让家拥有“理解生活” 的能力
传统智能家居的体验瓶颈,本质源于“规则预设固化” 与“生态协同不足”的双重制约。用户需手动配置繁琐的自动化规则,且不同品牌设备间缺乏统一联动标准,最终不得不花费大量精力“适配系统”。
而探索方案的核心目标,是为家庭赋予一个能理解生活细节的“AI大脑”——它可保存 “雨天关窗”“睡前调温”等场景偏好,能读懂“想睡个好觉”背后对温度、光线、噪音的综合需求,更能实现跨生态设备协作,在持续交互中优化体验,真正做到越用越贴心。
这种“懂生活” 的能力,得益于Miloco对大模型技术的场景化落地。作为智能家居未来探索方案,Miloco将自研大模型能力部署到家庭边缘设备,结合米家摄像机的实时视觉信息,通过标准化的MCP协议封装,实现米家生态与HomeAssistant(全球最大开源智能家居社区)生态的无缝打通,同时开放支持第三方IoT平台接入,让“用自然语言定义全屋智能”从概念走向实用。
硬核技术架构,筑牢体验基石
Miloco的全屋智能差异化体验,依托于XiaomiMiMo-VL-Miloco-7B端侧视觉语言大模型与四层完整架构的坚实支撑,从交互、感知、生态、安全四个维度优化全屋智能的交互逻辑与扩展能力,构建更贴合用户需求的智能家居解决方案。
核心支撑:XiaomiMiMo-VL-Miloco-7B 端侧视觉语言大模型
作为Miloco智能体验的技术核心,XiaomiMiMo-VL-Miloco-7B 端侧视觉语言大模型为全屋智能赋予了“感知+理解”的核心能力,是实现场景化智能联动的关键所在。
XiaomiMiMo-VL-Miloco 端侧视觉语言模型,基于小米自研MiMo-VL-7B大模型优化构建,凭借强大的视觉-语言融合能力,赋予家庭摄像头“理解画面”的感知力。轻松实现全屋视觉问答(比如查询“看看画面里有什么”“看看我的猫在哪”)、规则智能触发(当有人在读书时,打开台灯;当有人在玩手机时,发送米家通知提醒)、复杂联动控制(看看小孩有没有在玩手机?在玩手机的话音箱播放“该写作业了”;根据画面中人的心情状态去设置灯光颜色),还能完成场景化动态推理(当画面里面有人时,根据画面中人的穿衣风格来生成赞美文案,然后用智能音箱播报生成的赞美文案;当画面里有人在睡觉,根据画面中人是否盖被子来调整空调的温度)。
这一技术突破推动智能家居从“单一条件触发”的初级阶段,正式迈入“多维度场景感知”的高阶形态,而这一核心能力的落地与延伸,均依赖于Miloco的四层完整架构体系。
四层完整架构:保障系统稳定与扩展潜力
从用户交互到硬件支撑,Miloco构建了全链路技术体系并实现全部开放——开发者可修改和扩展体系中任何一层的能力,确保功能稳定落地与未来灵活扩展,更为“开放共创” 预留出足以承载无限创意的充足空间。

用户层:负责用户与系统的交互,当前已支持WebUI交互方式,后续将规划App端接入,进一步降低使用门槛;
应用层:作为系统“决策中枢”,承接用户层需求,负责能力调度、大模型管理、云端服务协同及MCP服务适配;
能力平台层:提供信息源接入、设备控制、空间建模、存储记忆、多模态理解等底层能力,为上层应用提供技术支撑;
硬件层:涵盖算力、存储、网络等基础硬件支持,确保端侧计算高效运行,保障数据处理的实时性与安全性。
Miloco的开放性打破了生态壁垒——开发者可借助其大模型能力,联动HomeAssistant以及第三方平台的设备,探索更具想象力的全屋智能场景。同时,方案坚持“隐私安全优先”原则,所有视觉数据可在家庭端侧完成计算,不向外部服务器传输,从技术层面保障“家庭隐私不外流”,打消用户数据安全顾虑,真正实现“开放与安全兼顾”。
探索体验新方向,推动智能家居进入大模型时代
探索方案Miloco的发布,是小米将大模型技术落地家庭场景的重要实践,更是对智能家居体验升级的一次探索。通过端侧大模型与全链路开放的结合,为行业提供了一种新的技术思路:让智能家居告别传统“硬编码规则” 的局限,转向“对话式交互 +视觉感知”的人机交互新形态。
这种新形态的核心,是从“人适应设备” 到“设备适应人”的转变:用户无需学习复杂操作,可通过自然语言轻松设置自动化;设备不再是孤立的控制单元,而是能主动理解场景、协同工作的“生活辅助伙伴”。
未来,小米将持续迭代Miloco的技术能力,与全球开发者共同推动全屋智能行业向着更开放、更智能、更贴合用户需求的方向发展。



























































