什么是生物信号处理——解读身体发出的数据
生物信号(生物信号)是生物系统产生的电气、力学和化学信号的总称。
ECG(Electrocardiography,心电图)记录心脏的电活动。由P波、QRS波群和T波构成的波形对于诊断心律、心律失常和心肌缺血不可或缺。EEG(Electroencephalography,脑电图)从头皮记录大脑的电活动,通过α波、β波、θ波、δ波的频率带域评估认知状态和睡眠阶段。EMG(Electromyography,肌电图)测量肌肉的电活动,应用于运动控制和康复领域。EDA(Electrodermal Activity,皮肤电活动)捕捉由汗腺活动引起的皮肤电导变化,作为自律神经系统觉醒度和压力反应的指标。PPG(Photoplethysmography,光电容积脉搏波)通过光学方式测量血容量变化,在Apple Watch和Oura Ring等可穿戴设备中被广泛采用。RSP(Respiration,呼吸)从气流或胸壁扩张记录呼吸模式。EOG(Electrooculography,眼电图)检测眼球运动。
这些原始数据无法直接使用。它们被电磁干扰、电源噪声、体动伪影(ECG信号时间的18.7%因运动伪影而丢失)、传感器故障、传输错误等噪声所覆盖。若没有去噪、峰值检测、特征提取、频率分解、非线性分析等信号处理步骤,就无法从生物信号中提取有意义的信息。
传统上,这一处理依赖于专用商业软件(AcqKnowledge、Kubios、LabChart)和基于MATLAB的工具(Ledalab、PsPM)。高昂的许可费用、黑盒算法和可重复性限制一直是其痛点。Python生态系统的成熟与开放科学的潮流,使得NeuroKit2等开源库得以兴起。
NeuroKit2——用2行代码实现临床研究级别的信号处理
NeuroKit2是由Dominique Makowski(萨塞克斯大学助理教授)为核心的研究团队开发的Python开源库。2021年,相关论文发表于*Behavior Research Methods*期刊(Makowski et al., 2021),并以MIT许可证在GitHub上公开发布。
其设计理念简明扼要:
"即使是不具备广泛编程知识或生物医学工程信号处理背景的研究人员和临床医生,也能仅凭两行代码完成生理学数据分析。"
实际上,ECG分析只需以下两行代码即可完成:
ecg = nk.ecg_simulate(duration=15, sampling_rate=1000, heart_rate=80)
signals, info = nk.ecg_process(ecg, sampling_rate=1000)
支持的生物信号模态
NeuroKit2支持ECG、PPG/BVP、RSP、EDA/GSR、EMG、EOG、EGG(胃电图,开发中)、EDR(ECG衍生呼吸)等7+种模态。在大多数竞争库仅专注于单一模态的情况下,NeuroKit2能够以统一API处理所有模态,这是其最大的差异化优势。
ECG处理流水线
ecg_process()函数可一次性执行信号清洗、峰值检测、划分(P波、QRS波群、T波检测)。R波检测算法内置8种,包括NeuroKit(默认)、Pan & Tompkins(1985)、Hamilton(2002)、Zong et al.(2003)、Martinez et al.(2004)、Christov(2004)、Gamboa(2008)、Elgendi et al.(2010),在UoG数据库上达到了0.9761的精度。同时支持12导联多通道ECG。
HRV(心率变异性)分析——124项指标
心率变异性是反映自主神经系统活动的重要生物指标。NeuroKit2可一次性计算124项HRV指标。
时域:RMSSD、MeanNN、SDNN、SDSD、CVNN等。频域:ULF、VLF、LF、HF、VHF功率,LF/HF比值,LFn、HFn、LnHF。非线性指标:SD1、SD2、SD2/SD1、CSI(心脏交感神经指数)、CVI(心脏迷走神经指数)、SampEn(样本熵)。
这种全面性足以媲美商业软件Kubios(HRV分析的黄金标准)。
复杂性分析——112项非线性指标
NeuroKit2的复杂性分析模块提供112项非线性指标,包括熵类指标(Shannon、Approximate、Sample、Fuzzy、Multiscale、Composite Multiscale)、分形维数(Sevcik、Katz、线长度)、去趋势波动分析(DFA)、李雅普诺夫指数等。
Makowski等人的研究"The Structure of Chaos"(2022年,MDPI Entropy)对这112项指标进行了实证比较,结果表明12项精选指标可解释全部指标总方差的85.97%。
EDA分析
自动分解EDA的紧张性成分(SCL:皮肤电导水平)和时相性成分(SCR:皮肤电导反应),并进行峰值检测与振幅提取。内置信号质量评估功能。
与同类工具的比较——NeuroKit2有何不同
Python生物信号处理生态系统中存在多个主要库。
BioSPPy是支持ECG、RSP、EDA、EMG、EEG、PPG的多模态库,与NeuroKit2存在最直接的竞争关系。NeuroKit2将BioSPPy的算法作为选项集成在内部,确保BioSPPy用户迁移至NeuroKit2时的兼容性。
MNE-Python是专注于脑信号(EEG、MEG、sEEG、ECoG)的行业标准。在源定位(脑内信号源估算)方面具备最先进的性能。在脑波分析领域,MNE-Python是首选,与NeuroKit2形成互补关系。
HeartPy专注于ECG和PPG,专为噪声较多的现场数据而设计。其独特之处在于可在Arduino和Teensy微控制器上运行,在实时嵌入式应用场景中HeartPy具有优势。
WFDB是PhysioNet的官方库,专注于数据输入输出。由MIT-LCP开发,是访问PhysioNet数据库不可或缺的工具。
BrainFlow为生物传感器硬件提供统一SDK。以C++为核心,支持Python、C#、Java、MATLAB、Rust绑定,在与OpenBCI等设备的连接方面表现出色。
pyEDA专注于EDA/GSR,在WESAD数据集上实现了97%的压力检测精度。
NeuroKit2的独特性在于:以统一API处理7种模态的多模态支持、112项复杂性指标、内置并可比较8种R波检测算法,以及仅需2行代码即可完成的低准入门槛。已与BioSPPy、HeartPy、Systole、nolds等竞争库进行对比验证,将现有工具算法作为选项纳入的包容性设计理念,支撑着其作为世界标准的地位。
应用领域——生物信号开创数字健康的未来
情感识别与情感计算
ECG、EDA、PPG是情感的高可靠性指标。EEG在4种情感分类中达到88.86%的识别精度,ECG+EMG+生物信号的多模态方案在4种情感状态下达到79.3%,集成深度学习方案的F1分数达到90.96%。NeuroKit2在这些研究中被广泛用于生物信号的预处理与特征提取。
数字生物标志物与远程患者监测
数字生物标志物使临床环境之外的连续生理测量成为可能。美国CMS(医疗保险和医疗补助服务中心)自2026年1月起,将远程患者监测(RPM)的最低天数要求从16天放宽至2至15天,加速了其普及推广。在从可穿戴设备采集的原始数据的质量管理与特征提取方面,NeuroKit2等标准化开源工具的作用日益凸显。
可穿戴健康生态系统
Apple Watch(用户超过2亿)搭载FDA批准的ECG、心房颤动历史记录、血氧、睡眠呼吸暂停检测以及高血压提醒(2025年9月获FDA批准)。高血压检测通过光学心率传感器与机器学习实现,并经2000余名参与者验证。预计首年可向100万以上未确诊用户发出通知。
Oura Ring(第四代)在消费级可穿戴设备中获得HRV精度最高评级,并于2025年下半年引入"累积压力"生物标志物。WHOOP提供26Hz心率采集与"健康寿命"指标,MG版本搭载ECG与心房颤动检测。Ultrahuman正在构建整合戒指、环境监测仪、血液检测与AI解读的一体化生态系统。
NeuroKit2作为解析上述可穿戴设备输出的PPG及加速度数据的工具,被研究人员用于验证可穿戴算法。它是连接消费级设备原始数据与研究级分析结果的基础设施。
临床应用
Beacon Biosignals通过FDA批准的Waveband EEG设备实现了居家神经诊断。EpiWatch(约翰斯·霍普金斯大学衍生公司)利用Apple Watch进行发作监测,获得FDA 510(k)批准。在这些临床AI的背后,EEG和ECG的信号处理流水线不可或缺,NeuroKit2等开源工具为研究开发提供了基础支撑。
VC投资动态——涌入数字健康领域的资金
主要投资案例
Beacon Biosignals 在2025年11月的B轮融资中筹得8,600万美元,累计融资超过1.21亿美元。Innoviva、Google Ventures、Nexus NeuroTech Ventures、S32、Catalio Capital及武田药品参与投资。专注于AI驱动的EEG脑健康生物标志物。
日本的テックドクター在2025年5月的B轮融资中筹得120亿日元,累计达180亿日元。JAFCO、NVCC、三井住友资本参与投资。旗下数字生物标志物开发平台"SelfBase"已正式落地运营。
宏观层面的投资动向
a16z Bio + Health在2025年配置了7亿美元,a16z旗下AI项目中有50%布局于医疗健康领域。a16z与礼来(Eli Lilly)共同设立了规模最高达5亿美元的生物科技生态系统基金。
美国数字健康初创企业在2025年共筹得142亿美元(同比增长35%)。全球数字健康融资在2025年达到223亿美元(同比增长19%),平均交易规模为2,030万美元(增长29%)。
生物信号采集与处理系统市场预计将从2024年的约28亿美元增长至2033年的52亿美元(复合年均增长率7.1%)。可穿戴医疗设备市场将从2025年的1,030亿美元扩大至2034年的5,053亿美元(复合年均增长率20%)。
挑战与限制
运动伪影
运动伪影是可穿戴设备采集生物信号时面临的最大挑战。ECG信号有18.7%的时间因运动伪影而丢失,导致误报性心动过速检测。在日常环境中提升抗噪性,需要在算法和硬件两个层面持续改进。
实时处理
NeuroKit2主要面向离线/批量分析设计,未针对实时嵌入式应用进行优化。HeartPy(支持Arduino/Teensy)和BrainFlow(C++核心)更适合实时/嵌入式应用场景。
临床验证
开源工具往往缺乏作为医疗器械所必需的正式临床验证。许多数字生物标志物无法从研究阶段走向监管机构的审批。AI/ML软件医疗器械(SaMD)需要大规模、高质量的标注数据集,而持续学习系统在安全性与有效性的监管合规方面存在挑战。
隐私
生物信号可能使个人被重新识别。脑电图(EEG)数据有可能泄露敏感信息。GDPR限制了健康相关数据的二次利用,国际数据传输的限制也给研究合作带来了困难。
日本动向——数字生物标志物与超老龄化社会
日本正面临着全球最快速的老龄化问题,以及随之而来的医疗费用急剧增加和地区医疗资源分布不均等结构性挑战。生物信号处理与数字生物标志物是应对这一挑战的有力解决方案。
TechDoctor(テックドクター)通过B轮融资筹集了120亿日元,其数字生物标志物开发平台"SelfBase"可从可穿戴设备中持续采集和分析生物数据(睡眠、运动、脉搏)。该公司已与100余家研究机构和企业开展合作研究,并与艾昆纬(IQVIA)日本在临床研究解决方案领域达成战略合作。
中外制药在多个药物研发项目中引入了通过可穿戴设备进行客观、持续生理数据采集的方案,积极推进数字生物标志物项目。日立则开发了便携式、应用程序及可穿戴型数字生物标志物,重点关注老年人的健康促进与疾病预防。
2025年《医疗法》修订正式确立了在线诊疗的法律地位,这是推动与远程患者监测相结合的数字生物标志物普及的重要里程碑。
科研费项目(2024—2029年)正在研究利用数字生物标志物进行衰弱评估;东京大学报告了基于AI的心电图(ECG)分析用于检测心功能下降的成果;2025年JSAI会议上则发布了利用张量ECG分析推断心肌梗死的研究成果。
日本可穿戴医疗设备市场预计将从2025年的约22亿美元增长至2034年的86亿美元。数字疗法(DTx)市场则有望从2026年的1.5亿美元扩大至2035年的11.3亿美元(年复合增长率23.6%)。
未来展望——生物信号处理成为标准基础设施的那一天
2026〜2027年:随着Apple Watch、Oura Ring、WHOOP等可穿戴设备FDA批准功能的扩展,面向消费者的生物信号数据预计将呈爆炸式增长。对NeuroKit2等标准化开源处理管道的需求将加速提升。FDA 2026年健康设备更新将明确健身追踪器与医疗设备之间的边界,进一步完善监管环境。
2028〜2030年:多模态生物信号分析(ECG+EDA+PPG+RSP+EEG同步处理)将与AI基础模型深度融合,实现对个人健康状态的实时连续监测。数字生物标志物将作为FDA批准的伴随诊断被纳入药物研发管线,临床试验的数字终点也将实现标准化。
2030年以后:生物信号元数据将如同视频字幕和时间码一样,成为数字内容的标准附属数据。NeuroKit2的112项复杂性指标和124项HRV指标将直接集成到可穿戴设备的固件中,在边缘设备上实现实时计算。生物信号处理将从"专项专业技术"蜕变为"标准基础设施"。
正如Hugging Face CEO Clement Delangue所言"本地AI的时代已经到来",生物信号处理同样正在从云端向个人设备迁移。NeuroKit2是支撑这一迁移的基础之一,"两行代码实现临床研究级信号处理"的设计理念,正是这一领域民主化的象征。
对行业的影响
第一,NeuroKit2正在确立其作为生物信号处理领域"jQuery"的地位——即一个将复杂底层处理抽象化、使所有人都能轻松使用的标准库。每月93,500次下载量、590余篇学术引用,以及杜克大学、华盛顿大学、奥克兰大学等全球顶尖高校的采用,均印证了这一点。
第二,可穿戴健康设备市场的高速增长(2025年1,030亿美元→2034年5,053亿美元,CAGR 20%)从结构层面推动了对生物信号处理库的需求。Apple Watch逾2亿用户、Oura Ring、WHOOP、Ultrahuman所产生的PPG、加速度及心率数据的分析需求,若无NeuroKit2此类开源工具则无从满足。
第三,风险投资正集中涌入数字健康领域。a16z Bio + Health 7亿美元配置、Beacon Biosignals B轮8,600万美元融资、TechDoctor B轮120亿日元,均表明巨额资金正流向生物信号×AI的交叉地带。作为生物信号处理标准工具的提供者,NeuroKit2在这一生态系统中的基础设施地位日益凸显。
第四,针对日本超老龄社会的医疗挑战——医疗费用急剧攀升、地区分布不均、护理人才短缺——数字生物标志物与远程患者监测提供了结构性解决方案。2025年医疗法修订将在线诊疗纳入法律框架,从制度层面为这一方向提供了支撑。
第五,开源生物信号处理工具保障了研究的可重复性与透明度。商业黑盒工具无法实现的"算法公开与验证",通过NeuroKit2的GitHub仓库与MIT许可证得以实现。这从科学方法论的角度而言,亦是一项重要贡献。
参考信息:Makowski, D. et al.《NeuroKit2: A Python toolbox for neurophysiological signal processing》(Behavior Research Methods, 2021, DOI: 10.3758/s13428-020-01516-y),GitHub: neuropsychology/NeuroKit(2,200+ stars,MIT License),PyPI Stats: neurokit2(约93,500次月下载),Semantic Scholar: 约590次引用,Dominique Makowski(苏塞克斯大学,Reality Bending Lab),NeuroKit2 ECG R波检测精度0.9761(UoG数据库),NeuroKit2 HRV 124项指标,NeuroKit2复杂度112项指数,Makowski et al.《The Structure of Chaos》(MDPI Entropy, 2022),BioSPPy(GitHub: PIA-Group/BioSPPy),MNE-Python(mne.tools,BSD-3),HeartPy(paulvangentcom/heartrate_analysis_python),WFDB Python(PhysioNet),BrainFlow(brainflow-dev/brainflow),pyEDA(HealthSciTech/pyEDA,WESAD数据集压力检测准确率97%),Kubios HRV(商业黄金标准),Apple Watch 200M+用户 / ECG / 血氧 / 睡眠呼吸暂停 / 高血压 FDA认证(2025年9月),Oura Ring Gen 4 HRV精度,WHOOP 26 Hz心率,Ultrahuman Ring + Blood Vision,Beacon Biosignals 8,600万美元B轮(Innoviva、Google Ventures、武田药品,2025年11月),TechDoctor 120亿日元B轮(JAFCO、NVCC,2025年5月),a16z Bio + Health 7亿美元,a16z + 礼来5亿美元基金,美国数字健康142亿美元(2025年,+35%),生物信号采集市场28亿→52亿美元(2033年,CAGR 7.1%),可穿戴医疗设备1,030亿→5,050亿美元(2034年,CAGR 20%),运动伪影导致18.7%心电信号损失(Nature Reviews Bioengineering, 2024),FDA 2026年健康设备更新,CMS RPM最低要求从16天降至2-15天(2026年1月),EpiWatch FDA 510(k)认证(约翰斯·霍普金斯大学),中外制药数字生物标志物,日立数字生物标志物,TechDoctor SelfBase / IQVIA日本合作,2025年医疗法修订在线诊疗法制化,科研费数字生物标志物衰弱评估(2024-2029年),东京大学AI心电图心功能下降检测,日本可穿戴医疗设备22亿→86亿美元(2034年),日本数字疗法1.5亿→11.3亿美元(CAGR 23.6%)