电子鼻信号分析关键算法研究(清华大学优秀博士学位论文丛书)-预付365_综合福利消费平台
0 购物车
商品详情
首页 > 图书> 电子与通信> 基础与理论 > 电子鼻信号分析关键算法研究(清华大学优秀博士学位论文丛书)
电子鼻信号分析关键算法研究(清华大学优秀博士学位论文丛书)
商品价格: ¥52.10 [定价  ¥69.00]
商品编号: 12626148
服      务: 图书 负责发货并提供售后服务
商品运费: 全站满99包邮,不满收10元,实际运费以支付页面金额为准。
温馨提示: 不支持7天无理由退货
购买数量: - +
365商城不参加品牌方的满减优惠及赠品活动
商品介绍
规格与包装
  • 商品名称:电子鼻信号分析关键算法研究(清华大学优秀博士学位论文丛书)
  • 商品编号:12626148
产品特色

导师序言





传统中医主要采用四诊合参诊察患者的健康生理状况,通过“望、闻、问、切”四个角度了解患者信息。其中,闻就是指听患者的说话、咳嗽、喘息,并嗅其口中或身上是否有异味。欧洲中世纪也有通过气味来诊断疾病的记录。这些传统方法其实是有科学依据的: 细胞新陈代谢的产物通过血液运输到肺部,其中挥发性成分会通过呼吸排出。而其中某些成分的浓度与特定疾病相关,因此通过呼气分析人的身体状况是可行的。现代医学研究已经证明,包括糖尿病、慢性肾病、肺癌在内的多种疾病都会造成呼气中的成分异常。相比血检、医学影像等检查手段,呼气检查的主要优点在于无创、样本易采集。在人们越来越关心自己身体状况的今天,这样一种辅助诊断手段是非常有前景的。我们希望患者能够像伸出胳膊测血压那样简单地对一台仪器吹一口气,片刻之后就能得到一些疾病的风险指标,从而决定是否到医院进行进一步详细的检查。

要实现这一点,我们首先要解决的问题是: 如何方便快速地测量呼气中的标志物?当代传感器技术的发展为这个问题提供了很好的解答。气相色谱、质谱分析等传统手段,虽然精确,但较为繁琐,成本也较高。而近年来兴起的气敏传感器则给出了另一种思路: 通过敏感材料与气体分子的反应,将气体浓度信息转化为电信号。这种方法简单、快速、成本也较低。人们把利用气敏传感器测量气体浓度的仪器形象地称为电子鼻。事实上,电子鼻已经被广泛地应用于检测空气污染物、工厂中的易燃易爆气体等,当然最普及的应用还是酒驾的检测。不过检测酒驾和检测疾病的难度不在一个数量级上: 疾病标志物的浓度要远低于饮酒后呼气中酒精的浓度,前者的浓度只有百万分之一左右。因此我们一方面需要更精确的传感器,另一方面需要用更好的算法对传感器信号进行分析。

信号分析算法是本书的主题,为了研制一套准确、实用的呼气分析系统,我们从仪器的硬件制作开始,“软硬兼施”,进行了全面的研究。现有商业传感器已经能够达到百万分之一级别的气体检测,因此我们经过反复试验,选择了最适合呼气检测的传感器阵列,设计了一台便携、易操作的呼气分析仪。没有数据就无法进行信号分析,因此我们与广东省中医院等单位合作,采集了近万例患者的呼气样本,其中辛苦自不待言,在此我们也感谢所有付出了辛劳的患者、医护朋友和实验室师生。

信号分析算法是呼气分析系统的重要一环,我们针对气敏传感器信号和呼气分析的特点,对多种模式识别、机器学习算法进行了改进和创新。首先,针对呼气成分存在的个体差异问题,我们对预测模型的建立方式进行了改进,提出了一种特征增强策略。其次,为了建立更准确的预测模型,我们从气敏传感器信号上提取了上千维特征,改进了现有特征选择算法并得到了最优的特征组合。最后,我们重点关注了其他呼气分析研究者较少涉及的一个主题,也就是电子鼻的鲁棒性问题。气敏传感器存在设备间差异和时变漂移问题,我们针对不同应用场景设计了四种漂移补偿算法,应用多任务学习、深度学习、子空间学习等前沿机器学习方法进行漂移补偿,大大提升了电子鼻的实用性。

综上所述,本书是一个多学科交叉的产物,结合了医学、传感器、电子和计算机等领域的研究成果; 同时兼顾了理论和实践,既设计了机器学习算法,也制作了呼气分析系统。在这个富有挑战性的课题上,本书的作者做出了重要的贡献,将呼气分析系统的准确性和实用性向前推进了一步。与人体相关的信号都是复杂的,未来我们需要挖掘已有数据中的信息,进一步深入分析呼气标志物与不同疾病的联系,从而得到更全面的算法模型。我们的最终目标是造福社会和患者,因此如何让呼气分析系统从实验室中走出、尽快走向实用,是未来研究者们需要努力的方向。

张大鹏清华大学电子工程系2018年6月


内容简介

电子鼻是一种利用气敏传感器阵列识别气味的设备,呼气分析是电子鼻的重要应用之一。通过检测呼出气体中与特定疾病相关的标志物,电子鼻可以辅助完成疾病筛查和监控,该方法具有无创、易操作等优点。本书侧重研究电子鼻系统的信号分析算法,在搭建电子鼻系统的基础上,针对电子鼻数据的特点研究信号分析过程中的关键算法,旨在提高电子鼻的准确性和实用性。本书内容包括三个方面: 基于电子鼻的呼气分析系统设计,针对相关特征的迭代特征删除算法,针对设备差异和时变漂移的补偿算法。本书可以作为电子鼻、生物医学工程和机器学习领域研究者的参考书籍。

目录

第1章引言


1.1研究背景


1.2电子鼻工作原理简介


1.3研究方向与意义


1.4研究内容


1.4.1基于电子鼻的呼气分析系统设计


1.4.2针对相关特征的迭代特征删除


1.4.3设备差异和时变漂移补偿


1.5结构安排


第2章基于电子鼻的呼气分析系统


2.1相关工作


2.1.1疾病与呼气标志物


2.1.2基于电子鼻的呼气分析


2.2系统设计与优化


2.2.1气敏传感器阵列


2.2.2电子鼻结构设计


2.2.3采样流程


2.2.4信号分析与特征增强


2.3糖尿病呼气数据集


2.4实验结果和讨论


2.4.1丙酮浓度预测实验


2.4.2糖尿病筛查


2.4.3血糖预测


2.4.4分析: 个体训练样本数与血糖预测误差的关系


2.5本章小结



第3章针对相关特征的迭代特征删除


3.1相关工作


3.1.1特征选择概述


3.1.2SVMRFE


3.2改进SVMRFE: 相关偏差缩减


3.2.1相关偏差


3.2.2相关偏差缩减


3.2.3特征选择的稳定性和集成策略


3.3候选特征集


3.4实验结果和讨论


3.4.1人工合成数据集


3.4.2糖尿病呼气数据集


3.4.3分析: 稳定性和集成策略


3.4.4分析: 特征选择结果


3.5本章小结


第4章基于加权正则化和多任务学习的漂移补偿


4.1相关工作


4.1.1设备差异补偿


4.1.2时变漂移补偿


4.1.3标定样本选择


4.2算法总结与面临的挑战


4.3漂移数据集


4.4基于加权正则化的漂移补偿


4.5基于多任务学习的漂移补偿


4.5.1双任务学习


4.5.2多任务学习


4.5.3动态模型策略


4.6实验结果和讨论


4.6.1阵列漂移数据集


4.6.2Corn数据集


4.6.3呼气分析数据集


4.7本章小结



第5章漂移补偿自编码器


5.1相关工作


5.1.1自编码器


5.1.2基于自编码器的迁移学习


5.2背景特征


5.3漂移补偿自编码器


5.3.1网络结构与目标函数


5.3.2处理复杂时变漂移


5.3.3训练流程


5.4实验结果和讨论


5.4.1阵列漂移数据集


5.4.2Corn数据集


5.4.3呼气分析数据集


5.4.4分析: 欠迁移与过迁移


5.4.5分析: 训练流程


5.5本章小结


第6章最大独立领域适配算法


6.1相关工作


6.1.1无监督领域适配算法


6.1.2HilbertSchmidt独立性准则


6.2最大独立领域适配算法


6.2.1无监督情况


6.2.2半监督情况


6.2.3与其他算法的联系


6.3特征增强


6.4实验结果和讨论


6.4.1人工合成数据集


6.4.2阵列漂移数据集


6.4.3Corn数据集


6.4.4呼气分析数据集


6.5本章小结


第7章总结和展望


7.1总结


7.2创新点


7.3展望


参考文献


索引


在学期间发表的学术论文


致谢


精彩书摘

第1章引言

1.1研究背景

用传感器和信号分析的手段来扩展增强人类的“五感”一直是科技工作者的研究目标。在视觉和听觉领域,传感器相对成熟,分析算法也一直是热门研究课题,相比而言,人们对嗅觉的关注似乎没有那么多。事实上,气味也是一种重要的信息媒介。通过对其进行感知和分析,我们可以了解到被测物体或周边环境中与气体、气味相关的属性,从而做出判断和决策,给生产和生活带来便利。

电子鼻(electronic nose,enose),顾名思义,是一种利用电子手段来感知和分析气味的装置。最早对电子鼻的研究可以追溯到20世纪60年代[1]。近年来,随着各种应用的涌现,电子鼻受到越来越多的关注[2]。人们最熟悉的应用当属酒驾的检测,也就是测试呼气中酒精的浓度。在工业领域,电子鼻常被用来检测空气中有毒、易燃、易爆气体的含量,以保证生产的安全和工人的健康[3]。空气质量是近几年社会关注的重点话题,电子鼻可以监控室内和室外的空气污染物浓度[46]。通过分析气味,电子鼻还可以判断农产品的成熟程度和质量[7,8]以及饮料的种类[9,10]。

医疗健康是电子鼻的另一个重要应用领域[11]。医学研究表明,多种疾病会导致呼出气体中相关标志物的浓度发生变化,例如丙酮与糖尿病和血糖值相关,氨气与肾衰竭相关,氢气与肠道疾病相关等[1115]。呼气分析就是通过分析呼出气体中的标志物的组成来进行疾病的辅助诊断和监控,该方法具有无创、样本易收集的优点。传统的化学分析设备(如气相色谱仪、质谱仪[2]等)能够精确地测定混合气体中每一组分的浓度,因此可以用来对疾病和标志物的关系进行前期调研。比起气相色谱仪、质谱仪,电子鼻的优势在于易操作、便携、快速、成本低[15],因此更适合推广到社区医疗中心和患者家庭中辅助疾病筛查和监控。除此之外,它还可以用于评价用户日常的身体状况,例如初创公司Breathometer开发了与手机连接的小型电子鼻,可以分析用户呼气中的酒精含量以及是否口臭https://www.breathometer.com/。。

1.2电子鼻工作原理简介

Gardner等人在1994年对电子鼻的综述中,认为电子鼻是“由具有部分选择性的气敏传感器阵列和适当的模式识别方法组成的、具有识别单一或复杂气味能力的装置”[1]。气敏传感器是电子鼻的核心部件,其种类很多,包括电化学传感器、半导体传感器、光离子传感器、固体电解质传感器等[16]。其中,金属氧化物半导体(metal oxide semiconductors,MOS)传感器[16]由于成本低、寿命长、灵敏度高、响应速度快和电路简单等优点,获得了广泛的应用。典型MOS传感器的外观如图1.1所示。该类传感器中的金属氧化物材料表层在200~500℃时会与特定敏感气体发生可逆的氧化还原反应,从而改变其电导率[16]。通过调整材料内部掺杂的成分,可以改变传感器的敏感特性,即敏感气体的种类和敏感度。对传感器的电阻进行测量,即可获得与被测敏感气体的种类和浓度相关的信息。



图1.1MOS传感器TGS2600(日本费加罗公司)的外观和内部示意[17]



大多数MOS传感器具有交叉敏感性,对气体的选择性较差[16],交叉敏感和选择性较差是指一个传感器会对多种气体敏感。TGS2600的敏感特性曲线如图1.2所示,其横轴为气体浓度,单位是每百万分之一体积(parts per million,ppm); 纵轴是敏感气体存在情况下的传感器电阻RS与纯净空气中电阻RO的比值。可以发现传感器的电阻与气体浓度呈负相关,且传感器对多种气体敏感,但敏感的程度不同,对氢气最为敏感(电阻下降最快)。因此,如果被测气体成分不确定,只用一个传感器往往无法准确判断气体的种类,解决这个问题的一个办法是采用传感器阵列[18]。利用多个敏感特性各不相同的气敏传感器组成阵列,将它们的响应组合成多维特征向量输入模式识别算法,就可以较准确的判断被测气体的种类和浓度。这种策略正是电子鼻的核心思想之一[1,18],利用适当选择的多个交叉敏感气敏传感器,既可以提高电子鼻预测的精度,也可以扩大其敏感气体的范围。



图1.2MOS传感器TGS2600的敏感特性曲线[17]



分析传感器阵列响应的常用步骤包括信号预处理、特征提取、分类和回归等[19]。首先需要对响应曲线进行预处理,例如基线补偿、幅值归一化[19]等,以去除简单的基线漂移和提高特征区分度。接下来需要在信号曲线上提取有利于分类或回归的特征。研究者们已经研究了多种特征,例如稳态响应、瞬态特征(曲线在各个时间点的幅值、导数等)、主成分特征、相位特征、小波特征、曲线拟合特征等[18,19]。在提取多种特征后,一个可选的步骤是利用特征选择算法选择最优的特征子集。最后,如果分析的目的是判断气味的种类或被测物质的某种离散属性值(如疾病、健康),那么可以对提取的特征进行分类,电子鼻文献中常用的分类器包括K近邻、神经网络、支持向量机、逻辑回归等; 如果分析的目的是判断气味的浓度或被测物质的某种连续属性值(如血糖值),那么可以采用回归算法,电子鼻文献中常用的算法包括最小二乘拟合、偏最小二乘回归、神经网络、支持向量回归等。

1.3研究方向与意义

由于电子鼻的疾病筛查与监控具有无创、易操作等优点,近年来逐渐受到重视。目前已有的商用和实验用电子鼻在传感器阵列的针对性和设备的实用性上还有不足,因此,我们将首先在电子鼻系统搭建方面进行研究,设计一套呼气分析系统。该系统可以用于辅助疾病筛查和监控(例如糖尿病筛查和血糖预测),具有较高的实用价值。另外,电子鼻信号的研究尚不如图像、语音等领域那样成熟,公共数据集较少。我们将利用该系统采集呼气数据集,为后续的算法研究提供测试平台。

从气敏传感器的响应曲线上可以提取多种特征。用于预测时,这些特征的有效性各不相同。通过对特征进行选择,可以在降低预测模型的时空复杂度的同时提高其准确性。更重要的是,它可以帮助我们更好地理解数据。气敏传感器信号曲线上提取的特征具有较高相关性,我们将研究用于高度相关特征的特征选择算法,并用它来对呼气数据集进行特征选择。通过分析特征选择的结果,我们可以得到关于系统软硬件的有用结论,为后人研究提供参考。

在实际应用中,信号漂移是电子鼻面临的一个重大挑战。气敏传感器大多存在鲁棒性问题[18,19],其敏感特性会受到多种干扰因素的影响,信号的可重复性较差。具体来说,同一个型号、甚至同一个批次的传感器,其敏感特性并不会完全相同,因此导致了电子鼻的设备差异(instrumental variation)。随着时间的推移,传感器会发生老化,采样环境、甚至样本本身的构成也可能会随时间变化,这些因素共同导致了电子鼻的时变漂移(timevarying drift)。其他干扰因素还包括环境的温度、湿度等。漂移问题已经成为制约电子鼻推广和实用的一大障碍[19],是电子鼻的“短板”,因此也正在被更多研究者关注。在谷歌学术搜索关键词“enose drift”,可以发现相关文献数量逐年增多,如图1.3所示。本文将对漂移补偿算法进行重点研究,利用迁移学习[20]的思想,针对不同的应用场合提出多种漂移补偿算法,缓解电子鼻实用中的难点问题: 设备差异和时变漂移。



图1.3在谷歌学术搜索“enose drift”得到的每年发表文献数量




综上所述,本文从系统搭建出发,针对电子鼻的数据特点(特征高度相关和存在漂移)研究了适合的特征选择和漂移补偿算法,提高了电子鼻的准确性和实用性。

1.4研究内容

本文主要围绕三个方面进行研究: 基于电子鼻的呼气分析系统设计和样本采集,针对相关特征的迭代特征删除算法,以及设备差异和时变漂移的补偿。这三个方面不是孤立的,它们都是电子鼻系统的关键组成部分,如图1.4所示。系统设计和样本采集为后续的算法研究提供了测试平台; 特征选择可以提高系统精度,同时帮助我们更好地理解数据; 而漂移补偿则是提高系统鲁棒性和实用性的重要步骤。本文提出的特征选择和漂移补偿算法可以用于本系统及其他电子鼻系统。



图1.4电子鼻应用中的关键步骤


标出章节的部分为本文研究内容



1.4.1基于电子鼻的呼气分析系统设计

根据现有医学文献中的呼气标志物研究结论,我们选择了针对糖尿病呼气标志物的气敏传感器阵列,并且对电子鼻中气室等结构进行了优化,设计并制作了一套呼气分析系统。利用这套系统,我们到医院采集了500余个健康人和糖尿病患者的呼气样本,进行了糖尿病筛查和血糖预测实验,取得了初步的成果,这些工作验证了呼气分析系统的有效性。我们还提出了一种特征增强策略,用以改善血糖预测中存在的个体差异问题。

1.4.2针对相关特征的迭代特征删除

为了获取最优的特征组合,我们在上面提到的糖尿病呼气数据集上提取了七种瞬态特征,利用生物信息学领域应用广泛的支持向量机迭代特征删除(support vector machine recursive feature elimination,SVMRFE)算法进行了特征排序和选择实验。然而,由于电子鼻信号的特点,候选特征之间存在较大相关性。这种情况下,SVMRFE的特征评价准则将会受到影响,相关的特征会得到过低的评价。我们研究了这种现象的原因,同时提出了一种改进方案——相关偏差缩减(correlation bias reduction,CBR)。实验表明,CBR能够提高传统SVMRFE选择得到的特征的分类准确率。最后,通过分析特征的排名结果,我们得到了关于传感器、特征提取算法和温度调制电压[18]的有效性排名结论。

1.4.3设备差异和时变漂移补偿

在影响电子鼻鲁棒性的因素中,我们主要研究影响较大也较复杂的两种因素: 设备差异和时变漂移。事实上,除了电子鼻,一些其他的传感器或测量设备也面临相似的鲁棒性问题,例如光谱仪[21]。时变漂移的信号是与气敏传感器类似的一维曲线,因此电子鼻和光谱学领域的漂移补偿算法往往可以通用。

从机器学习和迁移学习[20]的角度来看,设备差异和时变漂移本质上都是样本的边缘分布P(X)和条件分布P(Y|X)在训练样本和测试样本中存在差异,导致从训练样本得到的预测模型在测试样本上准确率下降。借用迁移学习的术语,我们可以假设无漂移的样本来自源领域DS(source domain),有漂移的样本来自目标领域DT(target domain),两者的边缘分布或/和条件分布不同。源领域中的有标签样本通常比较充足,而目标领域中的有标签样本较少甚至没有。因此,单独为目标领域训练一个预测模型是比较困难的,需要将源领域的知识迁移到目标领域。对于设备差异来说,初始用来采集训练样本的设备对应着源领域,而每一个后来制作的新设备都对应着一个目标领域,不同领域间的分布变化是离散的; 对于时变漂移来说,初始用来采集训练样本的时间段对应着源领域,而之后的时间段对应着目标领域,但领域之间的分布变化是连续的。在本文中,为了简洁起见,有时把设备差异和时变漂移统称为“漂移”,因为它们都对应了特征空间中样本分布的移动。但在一些文献中[19],只有时变漂移补偿被称作漂移补偿(drift compensation),而设备差异补偿对应的术语是标定迁移(calibration transfer)。

对于漂移,根本的解决办法之一是制造鲁棒性更好的传感器。然而在成本受限以及现有工艺无法取得突破的条件下,利用信号分析算法进行漂移补偿就是比较合适的选择了。很多漂移补偿算法用到了标定样本[18,19,21]。所谓标定样本就是在每个领域(不同的设备或时间段)分别采集的一组辅助样本,一般是预先选定的几种标准气体。由领域之间一一对应的标定样本对可以推断出分布移动的相关信息,从而提高补偿精度。然而采集标定样本需要一定的专业知识和工作量,不太适用于非专业的电子鼻使用者。也有一些方法不需要标定样本,而是利用目标领域的有标签或无标签样本来得到漂移的信息并进行补偿。已有的漂移补偿算法在准确度和辅助样本的需求数量上还不能让人满意,尤其是在漂移比较复杂的时候。已有算法大多只能处理设备差异和时变漂移之中的一种,而在现实中,如果电子鼻被批量制造和长期使用,这两种漂移会同时存在。

为了解决以上问题,本文提出了四种漂移补偿算法。其中前三种利用了标定样本,最后一种方法基于目标领域的无标签样本进行补偿。下面分别简要介绍。

(1) 结合标准化误差的模型改进(standardizationerrorbased model improvement,SEMI)。特征标准化是一种简单的特征层面的补偿方法,该方法依据标定样本将不同领域的对应特征进行匹配,但匹配后的特征仍然可能存在差异。SEMI在已有的预测模型中加入一个加权的Tikhonov正则项,对匹配较差的特征施以较大的惩罚权重,从而使预测模型更加依赖那些匹配较好的特征。这种方法将特征标准化与预测模型训练有机结合,提高模型对漂移的鲁棒性。


(2) 基于标定样本的多任务学习(transfersamplebased multiTask learning,TMTL)。该方法直接在模型层面进行迁移,对每一个领域(设备或时间段)学习一个模型。该方法的基本假设是: 第一,不同设备的模型应当是相似的; 同一个设备在时间段t的模型应当和时间段t-1的模型相似,也就是时变漂移应当具有平缓性。第二,不同领域的标定样本在各自的模型投影下应当对齐。另外,本文还提出了一种动态模型策略用来生成任意时间点的模型。TMTL中应用了上面介绍的SEMI策略,以进一步提高漂移补偿精度。

(3) 漂移补偿自编码器(drift compensation autoencoder,DCAE)。机器学习算法中,为了获得较好的准确率,提高特征的鉴别能力十分重要。近年来,基于深度网络的特征学习算法被成功地应用在图像、语音等信号上,然而在电子鼻信号上的应用还比较少。本文对自编码器算法进行改进,在学习更有鉴别能力的特征的同时,显式地建模和补偿特征中的设备差异和时变漂移。为了达到这个目的,首先定义了“背景特征”来描述一个样本的采集设备和时间等信息,接着在自编码器的编码和解码的阶段分别显式加入和减除一组补偿项,从而保证网络隐层中学习到的特征都是去除了漂移的。为了更好地补偿非线性时变漂移,我们还设计了非线性补偿层。DCAE的目标函数使其可以同时最小化样本的重构误差、有标签样本的预测误差和标定样本的对齐误差。

(4) 最大独立领域适配(maximum independence domain adaptation,MIDA)。该方法的目标是在标定样本无法获取的情况下,利用目标领域的无标签样本进行漂移补偿。MIDA通过最大化子空间中样本与背景特征的独立性来学习领域不变子空间,同时保留数据的方差和标签信息等有用信息。我们还提出了一种特征增强策略,以使算法可以对不同领域的样本差异化投影。该方法的优点是使用灵活,求解简单。

我们利用本文研究的呼气分析系统实地采集了同时包含设备差异和时变漂移的呼气数据集,在该数据集和另外两个公开的漂移数据集上验证了上述算法的有效性。上述算法利用迁移学习的思想解决漂移问题,将多任务学习、基于自编码器的特征学习、领域不变子空间学习等算法框架应用到设备差异和时变漂移问题中,并针对存在标定样本、领域分布连续变化等情况做出了改进,拓展了前人算法的适用范围。

1.5结构安排

本文章节组织安排如下。

第1章为引言,总体介绍电子鼻的应用场合和工作原理,引出本文研究内容和意义。

第2章介绍基于电子鼻的呼气分析系统的设计,首先调研一些典型疾病与呼气标志物的关系以及现有呼气分析系统; 然后介绍本文系统的传感器阵列、硬件设计和采样流程,以及糖尿病筛查和血糖预测实验的算法、数据集和结果。

第3章研究针对相关特征的迭代特征删除算法,指出已有的SVMRFE算法存在的相关偏差问题,研究改进方案,并且进行实验和讨论。

第4章至第6章致力于解决电子鼻的设备差异和时变漂移问题。

第4章讨论基于多任务学习和加权正则项的漂移补偿,首先总体调研现有的漂移补偿算法,并对它们进行分析和总结; 然后描述本文采用的漂移数据集; 接着提出两个模型层面的算法: 结合标准化误差的模型改进、基于标定样本的多任务学习; 最后进行实验和对比。

第5章提出漂移补偿自编码器,首先回顾已有的基于自编码器的迁移学习算法; 然后提出背景特征,描述本文算法的网络结构和目标函数; 最后进行实验和讨论。

第6章探讨最大独立领域适配算法,首先调研典型的特征层面的无监督领域适配方法; 然后提出本文算法的优化目标和特征增强策略; 最后在人工合成数据集和漂移数据集上验证算法的有效性。

第7章总结全文,列举了几种漂移补偿算法的异同点和全文的创新点,并且展望了未来可能的研究方向。




第2章基于电子鼻的呼气分析系统

在电子鼻相关的研究中,研究者通常针对要分析的气体选择适合的气敏传感器组成阵列,然后制作成电子鼻。在本章中,我们重点关注利用呼气分析辅助糖尿病筛查和血糖预测,为此调研了相关文献,之后进行了硬件和软件系统的设计与优化、样本采集,以及分类与回归实验。

2.1相关工作

2.1.1疾病与呼气标志物



人体呼出的气体中,绝大部分是氮气、氧气、二氧化碳、水蒸气和惰性气体[22],剩余的不到100 ppm(parts per million,每百万分之一体积)的部分是超过500种成分组成的混合物,其中浓度在ppm级别的主要有丙酮、一氧化碳、甲烷、氢气等[22]。已经有大量文献对特定疾病与气体的对应关系进行了研究[12,15, 2236]。表2.1总结了部分疾病或医学指标与呼气标志物的对应关系。



表2.1部分疾病或医学指标与呼气标志物对应关系




疾病或指标

呼气标志物

糖尿病,血糖,糖化血红蛋白

丙酮,乙醇,一氧化碳,硝酸甲酯等[2230]

肾衰竭,血尿素氮

氨气[31,32]

心脏病

戊烷[33]

肺癌

丁烷等多种有机化合物[34]

乳腺癌

壬烷等多种有机化合物[35]

功能性肠病

氢气[36]


以糖尿病为例,其呼气中升高的丙酮浓度是由新陈代谢产生的[28]。糖尿病患者由于胰岛素分泌不足或自身无法有效利用胰岛素,葡萄糖难以进入身体细胞,导致血液中葡萄糖含量升高。同时由于身体细胞缺少能量来源,肝脏增加脂肪分解,产生酮体。血液经过肺时,酮体中的丙酮随呼气挥


  • 著者闫轲
  • 出版社清华大学出版社
  • ISBN9787302523697
  • 版次1
  • 包装平装
  • 出版时间2019-05-01
  • 用纸胶版纸
  • 页数118

温馨提示

由于部分商品包装更换较为频繁,因此您收到的货品有可能与图片不完全一致,请您以收到的商品实物为准,同时我们会尽量做到及时更新,由此给您带来不便多多谅解,谢谢!