WithCommunication.com
联系方式

工作机会

Home page mail
卫咨康讯研究报告
“中国焦虑障碍状态 / 治疗现状调查” 多因素关联分析

中国焦虑障碍状态 / 治疗现状调查 课题背景

课题背景: 在中国焦虑障碍研究协作组(CACG)指导下,并携手北京卫咨康讯咨询公司具体实施,希望为中国焦虑障碍治疗提供客观的有关医学信息和数据,进行医师临床行为的客观调查分析,了解中国焦虑障碍 / 状态的治疗现状,以及不同地区间的差异,包括临床医师对焦虑障碍的认知及其实际诊治情况,调查抗抑郁药在治疗焦虑障碍中的特点等。以下挖掘主题是根据该项目问卷回答情况制定,是在获得一般性描述统计数据后的更深层次的数据挖掘与分析。

多因素关联分析概述和实践意义

关联分析简介
关联分析是指在数据中找出不同事物的相关性,并借此从各种复杂的诸多模糊因素中找到最具易感性的若干主导因素,并在此基础上对项目进行精细化管理流程设计、实施和监控。关联分析的研究是人工智能、机器学习、知识发现和统计学习技术的研究热点,现在已经有相对成熟的过程设计和方法实践。
关联性分析,尤其是灰色关联系统,已经相对成熟地运用在工程学、医学统计学、循证医学、计量和技术经济学、精细化管理、市场决策系统等各个领域和方向。

关联分析的方法和工具
关联分析的通用办法是:对数据集采用机器学习、知识发现和统计学习技术的原理和方法,对数据聚类、分类、关联和相关性分析,发现数据之间的相互关系和相互作用现象,并从实践的角度对数据现象进行解释和分析,服务实践。

关联分析的实践意义

  • 增加数据使用率 :关联因素分析可以在以往分析的基础上更进一步,让数据的使用率提高,并可以对相关调查的数据通过时序、比对、交叉分析,让各种调查贯通,从更高的角度发现数据的潜在价值。
  • 从调查数据中发现各因素之间的潜在联系 :关联分析通过对数据的加工、分析和整理,寻找事物之间的潜在关联信息:
    1. 从多种因素中发现主导某一现象的几种或十几种易感关联组合,这种组合尊重事物之间的相互作用关系,因为,往往是若干因素相互作用的共同结果才能主导一种现象。(e.g. 可以从调查数据中发现:主导医生选择药物的因素组合,医生对疾病亚型的诊断不清晰的若干主导原因等)
    2. 发现因素组和现象组的关联性和差异性,从数据组而不是单一数据的角度发现差异性。(e.g. 医生担心副反应组和患者表现副反应组之间的差异性,以及影响这种差异的因素分析)
  • 从调查数据中对某现象进行预测: 关联分析的一个运用就是将数据置于动态的响应系统中,通过监测主导这一现象的若干因素表达网络的变化,及时预测现象的变化趋势。(e.g. 从监控主导医生药物选择的若干因素组合的每一因素,预测因素网络的变化趋势,进而预测医生药物选择变化趋势)
  • 通过时序分析观测现象的变化趋势,分析影响趋势的若干因素: e.g. 从监控主导医生药物选择的变化,分析影响这种变化的若干因素)
  • 通过对相关调查的分析,增强新项目的可控性,做更具针对性的调查,让项目间的衔接更有效。

以焦虑调查为例阐述关联分析的实践意义

“中国焦虑障碍 / 状态治疗现状调查”问题涉及的内容丰富,可以确定很多挖掘主题,以以下三个主题为例,具体阐述关联分析的实践意义

  • 通过分析医生药物选择和医生背景以及临床体会的关联性,挖掘出医生选择药物的主导因素,并在此基础上分析主导因素的表达网络,确定选择特定药物医生的特点等信息。
  • 通过分析患者担心副作用和药物选择、医生治疗方案的相互关系,确定医生对副作用的考虑、治疗方案的确定和药物副作用相互影响因素,结合医生背景分析,寻找药物副作用和药物选择、治疗方案的关系。
  • 将本次调查与相关调查结合,分析各种因素的时序和环境变化对医生认知、药物选择的影响。

“中国焦虑障碍 / 状态治疗现状调查”结果预估

  • 医生药物选择的主导因素分析
  • 从医生背景和临床认识的各种数据中获得影响医生药物选择的若干因素组合
  • 分析这些因素主导下的医生药物选择情况,寻找医生药物选择的一般规律
  • 绘制医生选择药物主导因素的因果关系图(相互作用图)
  • 病人依从性的主导因素分析
  • 从影响病人依从性的若干因素中,确定较为易感的几种因素组合
  • 分析各种易感数据,分析依从性分布规律
  • 绘制患者依从性主导因素相互作用图
  • 焦虑症各亚型、共病的用药差异、治疗方法主导因素分析
  • 将焦虑亚型和共病用药按照亚型分为不同类别,综合考察每份问卷的填写结果,找到影响差异的影响主导因素
  • 绘制不同影响组的相关表达图谱
  • 患者用药考虑的主导因素分析
  • 患者用药考虑主导因素的筛查
  • 主导因素分类和评估
  • 药物安全性、副作用及其相关文献证据研究
  • 医生药物选择时副作用、安全性考虑的具体关联因素分析
  • 医生药物选择顺序及其影响因素研究
  • 主导因素分析
  • 相关文献相关证据研究

医生临床体会对药物选择的影响多因素分析

挖掘主题 :医生临床体会对药物选择的影响多因素分析

挖掘工具

  • 统计软件 ----STATA
  • 数据挖掘工具 ----I-Miner , SVM-Light

挖掘问题回顾

  • 因变量: 2-1 ,最近 3 个月的药物选择
  • 自变量:
  • 诊断标准是否明确
  • 焦虑症亚型诊断标准是否明确
  • 是否诊断亚型
  • 是否会诊断抑郁症和焦虑障碍共病
  • 诊断焦虑症一般需要病程
  • 治疗焦虑症最常采用的治疗方法
  • 焦虑症的治疗主张
  • 焦虑症如果不治疗,会引发的不良情况
  • 抗焦虑药长期使用的担心
  • 焦虑症的预防主张
  • 焦虑急性发作阶段治疗时间
  • 选择抗抑郁药治疗焦虑障碍时,是否参照国家标准

挖掘过程

1相对独立性检验 ----- 滤除多重贡献率(kandell & Spearman 检验)

这部分工作的目的是让自变量间相对独立,便于关联分析,经过这步发现: 12 种关联分析两两相互独立

2将 12 个自变量作为研究对象,分别计算单独贡献率(直接回归)

从结果中可以看出:

6 、9自变量对医生最近三个月的药物选择的影响较大(治疗办法的选择、副作用的担忧),但是,这种影响是相对独立的。

3综合考虑 12 个自变量的累计贡献效率,计算联合贡献率(累计回归、聚类、分类)

在这部分中,综合考虑相对独立的自变量累计对因变量造成的影响。在分析过程中,我们综合使用前向、后向回归,并不断改变因变量顺序,得到了较优的结果。在处理过程中, p 值严格控制在不超过 0.1 的范围。整理后得到下表:


即: 9 , 6 , 3 , 10 , 5 五个自变量累计相关以后对因变量的影响是很大的。其中因素 5 与因变量负相关。(9 ,副作用的担心; 6 ,治疗方法的选择; 3 ,诊断病程; 10 ,焦虑预防的主张; 5 ,病程)

4 综合考虑 12 个自变量的网络贡献效率,计算网络贡献率(贝叶斯网络、决策树模型、 Information Gain )
经 I-Miner 分析以后得到以下结论:

5从以上可以看出 9 , 6 , 3 , 10 , 5 五个自变量构成的网络贡献率对因变量的影响很大

  • 对以上得到的 5 个自变量采用 SVM-light 做多维聚类回归,可以得到:
  • 选择 9B (抗焦虑药长期使用担心副作用), 6A (治疗焦虑症主张药物治疗) , 3A (能对焦虑亚型明确诊断) , 10A (预防焦虑主张自我调节) , 5D (需要诊断病程 6 月) 的医生选用 SSRI 的概率为 47.3% , BZDs 的概率为 21.4%
  • 选择 9A (抗焦虑药长期使用担心成瘾), 6B (治疗焦虑症主张心理治疗), 3A (能对焦虑亚型明确诊断), 10A (预防焦虑主张自我调节), 5E (需要诊断病程 12 月)的医生选用 SNRI 的可能性最大为 39% ,其次是 BZDs 为 26%
  • ……

6从医生选择药物角度出发,观察医生分布规律
选用 SSRI 的 261 位医生 9 , 6 , 3 , 10 , 5 选项的分布如下:

从以上表格中可以发现:选用不同药物的医生,在五种主导自变量的选择上存在明显的差异性。

 


联系电话:010-58612008/58612009
© WithCommunication.com/Pharmbase.com,All Rights Reserved.
北京卫咨康讯咨询服务有限公司 版权所有
备案序号:京ICP备07007562号