Building IoT: the backbone of Smart Buildings - Wattsense

建筑能源(Building energy预测在减少能源浪费以及确保为未来使用而储存足够的可持续能源方面发挥着至关重要的作用。不过,现有的建筑能源预测模型精度较低,且其适用范围通常较为有限。因此,本文提出了一种新型的混合模型,该模型结合了卷积神经网络和双向长短期记忆网络(bidirectional long short-term memory,BiLSTM,用于建筑能源预测。该混合模型利用卷积神经网络来捕捉数据中的空间模式和特征;同时,利用双向长短期记忆网络来捕捉时间上的依赖关系和长期趋势。此外,本文还将建筑内的占用人数作为额外输入参数纳入混合模型中,从而提升了能源预测的准确性。这一改进也提升了该能源预测模型的实际应用价值。该混合模型的性能经过了全面而严格的测试。该模型已经通过多种评估指标进行了验证,包括预测准确性、平均绝对误差和均方误差。模拟结果表明,该模型的性能优于现有的各种先进方法。该模型不仅提升了预测的准确性,还有助于相关方优化能源使用方式,从而提高建筑物的整体能源效率。

论文:Occupant-Aware Deep Learning Model for Energy Prediction in Smart Buildings

下载论文https://t.zsxq.com/uskX1

请索引第108篇论文


这篇文章对做 AI+交叉(城市计算、智慧能源、建筑信息物理系统、IoT 时序)的读者,这篇值得细读的地方不只是 "CNN+BiLSTM 又水一篇建筑能耗",而是它把 occupant count(居住者人数)作为一等公民塞进模型,并且在跨月、高缺失率的真实场景下把 R² 稳在了 0.97 量级。下面按"背景→架构→数据→结果→对交叉研究的启发"拆给你。

01 为什么"居住者"这条特征值得单独拎出来

建筑能耗占社会总能耗约 1/3,建筑相关 CO₂ 占全球 40%,供暖+制冷又吃掉建筑能耗的 63%——这些数字在这篇文章的 Introduction 里摆得很清楚。但过往 SOTA 里,无论是 ARIMA、SVR 的混合,还是纯 LSTM/GRU 的 DL 路线,大多把"人"隐式地藏在能耗曲线里,没把 occupancy count 当显式输入。作者论点很朴素: occupancy 不直接依赖地理和建筑类型,是跨场景泛化的好杠杆;而且人数和能耗的耦合(上班早高峰灯+空调+插座一起拉)本来就是非线性时空依赖,CNN 抽空间局部模式、BiLSTM 抽双向时序,occupancy 一加,泛化就上来了。

论文里 cite 的 Binbusayyis & Sha 2025(Heliyon)其实也做过 CNN-BiLSTM 做能耗,但没显式用 occupancy,也没做 month-wise 鲁棒性;这篇就是把这两件事补上了。

02 模型架构:CNN 抽"空间"、BiLSTM 抽"时间",occupancy 嵌在输入里

输入设计很克制:滑动窗口 (look_back, 3),三列分别是 Date&Time(D)、Occupant Count(O)、Energy Consumed(E),看过去 look_back 个时间步,预测下一天(E_nextday)。注意这里作者把"时间戳"本身也当特征——不是简单转成数值,而是保留在 D 里让 CNN 去卷局部周期(周间/日间模式)。

CNN 那段:Conv1D(64 filter, kernel=3, ReLU)→ MaxPooling1D(pool=2)。公式写成 F = σ(X * W + b),作用是把窗口内"某几步人数跳升 + 能耗滞后响应"这种局部空间模式滤出来。作者特地选 Conv1D 而不是 2D,因为输入是 (time_step, feature) 的 1D 时序矩阵,卷的是"时间轴方向上的局部特征拼接"。

BiLSTM 那段:CNN 输出的 feature map 直接喂给 Bidirectional LSTM(64 units, ReLU)。为什么不用 GRU、也不用单向 LSTM?论文给了三层理由:① AMI 类电表数据有明显周期性,双向能同时抓"过去依赖 + 未来上下文"(虽然推理时未来不可见,但训练时双向能让表征更稳,且下一天预测属于中等 horizon,双向收益仍在);② 长程依赖建模 BiLSTM > LSTM > GRU;③ 本文场景人数波动是双向影响的(比如下班前半小时人数开始掉、能耗还撑一会儿,这种前后依赖单向抓不全)。

表 II 给的时间复杂度也值得瞄一眼:CNN-BiLSTM 是 O(n·m²),比纯 BiLSTM 的 O(2n·m²) 还低——因为 CNN 先把空间维度压了一道,BiLSTM 只在降维后的序列上跑,这是混合架构的工程红利。


Fig.1 智能建筑储能场景示意

Fig.2 模型工作流:滑动窗口输入 → CNN → BiLSTM → 下一天能耗

Fig.3 LSTM 门控 vs BiLSTM 双向展开

Fig.4 两阶段 CNN-BiLSTM 架构细节

03 数据集:真实建筑、15 min 粒度、敢留"洞"测鲁棒

数据集引的是 [39] Scientific Data 2022 那个 "three-year dataset for building energy & occupancy"——2018.5.22–2019.2.21,一栋分南北楼的办公楼,本文只用南楼。原始采样:能耗 15 min、occupant count 1 min(靠 CO₂ + WiFi 推算),对齐到 15 min 统一粒度。

表 IV 把全量特征列得很全,但本文只高亮用了 D+O+E 三个(粗体是作者选的),天气/HVAC/室内温湿度都留着没进模型——这是个明显的"留给后续扩"的口子,也是你可以复现时加码的地方:

缺失值处理策略挺务实:孤立点线性插值,连续 >10 个点的洞故意不填,留着测模型对缺失的耐受。表 V 的月度缺失率一看就知道作者在刻意压压力测试——11 月缺 59.4%,8 月 22.21%,2 月 37.07%,但六月和 12 月又是满的。人数-能耗相关系数也按月晃:6/7 月 0.91(暑假前办公饱满),11 月掉到 0.58(缺太多 + 供暖季模式变了),2 月又回 0.81。

Fig.5 各月缺失值分布可视化

Fig.6 月度六参数相关性矩阵,O-E 那条每月都在变

04 结果:R² 0.97 不算新闻,跨月不掉才是

实验分两块:同月(七月前三周训 → 七月第四周测)和跨月(七月训 → 八月测;以及表 VI 的 9×9 全交叉)。

同月七月:MSE=0.0473,MAE=0.1374,R²=0.97003760——已经很顶。但更值得说的是 July → August:R²=0.9723,MSE=0.2077,MAE=0.31112。咦,八月 R² 反而比七月略高?论文没专门解释,但看图 8 八月曲线贴合度确实好,可能八月办公模式更规律 + 七月归一化尺度在八月仍适用。这种"训一个月推相邻月 R² 不降反微升"在真实建筑数据里算少见,侧面说明 occupancy 这个特征确实把"人"的迁移模式带住了。

Fig.7 七月预测 vs 实际

Fig.8 八月预测 vs 实际,July 训 → August 测

SOTA 对比(表 VII)更能看出 occupancy 的杠杆:

折算一下:R² 比 LPEENCKFDML 高 ~35%、比 MLAIECPM 高 ~11%、比 ECPLEBMAIE 高 ~21%;MSE 比 CAMLMECPRB 低 ~35%、比 ESEGRPUML 低 ~27%。Fig.9 三个柱状图摆一起,差距肉眼可见。

Fig.9 R² / MAE / MSE 三类指标对比柱状图

05 真正的值钱点在表 VI:9×9 跨月全矩阵

很多建筑能耗论文只敢报"同月划分 7:3",这篇把 train on Month X → test on Month Y 全跑了一遍(表 VI),9 个训练月 × 9 个测试月,R² 几乎全在 96.76–99.54 之间。几个值得品味的细节:

• 自己训自己测 → 当然最高(对角线 97.47–99.54)

• 十月训 → 二月测 R²=99.25,十月训→九月测 99.34,十月训→八月测 99.24——十月这个月像"万能 donor"

• 十一月(缺 59.4%)训出来的模型,测别的月也能到 96.84–99.06,说明连续大洞虽然让收敛慢(Fig.10 十一月 loss 下落略迟),但不至于崩

• 反过来,拿别的月训 → 测十一月,R² 也还在 97.89–99.21,模型对"测试集有大洞"也扛得住

(注:表 VI 原表 Feb 列 Jun 行空缺,应是 Feb 训 → Jun 测属"未来训过去测"被作者剔除,时间分割是严格按日历前向的,无 look-ahead。)

Fig.10 各月训练 Loss & MAE 随 epoch 变化,十一月(缺 59.4%)收敛略慢但没崩

06 对 AI+交叉研究者的几点启发

这篇文章方法本身不花哨(CNN-BiLSTM 在 2026 年算"经典组合"了),但它给的几个信号对做智慧能源/城市 IoT/建筑 CPS 的本硕博更值得接:

① "人"作为显式特征,在 IoT 时序预测里普遍被低估。这篇 occupant count 一加,R² 从 0.80–0.91 基线抬到 0.97,说明很多"设备侧数据-only"的模型其实在偷偷拟合人的模式,不如直接把人的代理变量(WiFi 计数、门禁、CO₂、摄像头去隐私计数)端到端喂进去。城市计算里交通/商圈/电网负荷都同理。

② 混合架构的"分工"要讲清楚。CNN 抽局部空间(本文是 "同一窗口内 D-O-E 的局部耦合"),BiLSTM 抽双向时序——这套在 AMI 电表、用水、交通流、环境 PM2.5 都能直接套。表 II 的时间复杂度对比也提醒你:CNN 先降维再进 BiLSTM,比裸 BiLSTM 省一半。

③ 跨时间泛化 > 同集 7:3。这篇的表 VI 是全文章最值钱的部分——很多论文 R² 0.99 是同集随机划分刷出来的,这篇敢做 month-out,且缺失率 60% 的十一月都稳,工程说服力立刻不一样。做 IoT 时序的读者,下次审稿人问"你这模型过三个月还能用吗",把这篇的表 VI 甩回去。

④ 可扩展口子开得很大。本文只用了 D+O+E 三个特征,表 IV 里天气 4 个、HVAC 4 个、室内环境 2 个全没用——你把这些都叠进去 + 加 Attention(Related Work 里 Binbusayyis 的 CNN-BiLSTM+Attention 已经做了)+ 多建筑联邦/迁移,就是一篇 follow-up。数据集 [39] 是 Sci Data 公开的三年的数据,[40] 是另一个 domestic 数据集(本文作者在 [40] 上也跑了,R² 93%,证了跨数据集泛化),复现门槛不高。

⑤ 局限也要看清:单建筑(只南楼)、固定预测 horizon=1 天、没做多步+自适应 horizon。作者在 Conclusion 里也认了,未来方向写的是"多建筑大规模 + 可解释性 + 多 horizon"。这几个坑就是你要冲 IEEE TAI / TSG / Applied Energy 的入口。

如果你做 AI+智慧能源/城市计算/建筑 IoT,occupant-aware 这条线才刚起头——这篇是 2026 年 TAI 给出的一个"轻量基线 + 跨月鲁棒"的样本,架构不复杂、数据可复现、扩展位明确。比起追花哨的 LLM-for-time-series,先把"人"这条特征在你自己的 IoT 预测任务里试一轮,说不定 R² 就能蹦 10 个点。


微信群

内容中包含的图片若涉及版权问题,请及时与我们联系删除