睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

基于功能导向-算法集成的西洋参双功能保健食品设计研究

时间:2022-08-04来源:晴栀渝菀歌浏览数:103

基于候选保健食品原料药味,结合分析所得药味关联情况及药对组合情况,提供“有助于增强免疫力”且“对化学性肝损伤有辅助保护功能”的备选组方。并进一步在Matlab R2021a中,运用TOPSIS综合评价法计算各备选组方得分并排位,对所设计保健食品组方进行综合评价分析,完成西洋参双功能中药保健食品组方设计。

中药保健食品作为我国保健食品行业不可或缺的重要组成部分,是中医药传统养生保健理念与实践相结合的产物。此类产品所用原料拥有“保健食品原料”和“中药材”的双重身份,具有明确的保健功能与临床应用基础,独具我国保健食品特色。然而,中药保健食品在研发时却极易陷入忽略或弱化“中药材”属性的困境,无法充分彰显其中医药背景优势,难以确立其在大健康产业中的独特定位。究其原因,一是保健食品功能与中药功效主治存在不对等关系,较难构建有效结合,导致功能无法有效引领中药保健食品;二是在组方设计过程中未能充分体现中药的配伍应用,存在缺乏中医药理论指导、忽视单味药功效及其在组方配伍中作用的区别、尚未充分利用中药在疾病治疗及预防中的临床应用经验等现象。如何在融合中医药背景的同时凸显保健食品特色,在研发过程中兼顾其作为中药的特点,是中药保健食品的破局之题。基于以上问题,本研究以组方设计为切入点,围绕中药保健食品原料收集保健食品批文与临床应用数据,选用大数据分析平台BDP(business data platform,https://me.bdp.cn/home.html)、自然语言处理与信息检索(natural language processing & information retrieval sharing platform,NLPIR)共享平台(http://www.nlpir.org/wordpress/)作为大体量数据及文本型数据的处理途径,通过关键语句提取与数据挖掘分析完成信息处理工作,综合分析西洋参具有潜在开发价值的保健食品功能。以西洋参应用基础广泛、研究基础扎实的保健食品功能“有助于增强免疫力”,以及从西洋参配伍和临床应用角度考量、大数据分析处理结果指向的“对化学性肝损伤有辅助保护功能”为导向,开展后续双功能组方设计。围绕所选保健食品功能,收集保健食品、中成药、方剂的组方信息。通过Apriori关联规则算法、层次分析法(analytic hierarchy process,AHP)- 熵权-自组织特征映射(self-organizing maps,SOM)联用的赋权聚类算法、逼近理想解排序(technique for order preference by similarity to an ideal solution,TOPSIS)综合评价法等机器学习算法提取样本数据特征并分析总结其内在规律,设计并优选组方。并在团队前期单一主观赋权算法的基础上,开展主观与客观赋权算法联用的方法提升,进一步增强筛选结果的可信度。本研究将中药保健食品功能方向的筛选、确定,以及在指明功能方向的前提下进行组方设计称为“功能导向”;将针对中药保健食品的中医药背景,融合多种算法总结分析规律性、经验性较强的组方配伍规律,并实现组方设计的全过程称为“算法集成”。由此,二者相结合,以特定保健食品功能为导向,融合多种机器学习算法,实现保健食品组方规律挖掘与组方设计。西洋参Panacis Quinquefolii Radix作为典型的外来中药,首载于清代《补图本草备要》,在保健食品开发中应用广泛。西洋参较其他中药保健食品原料药味而言,在中医药理论指导下的传统应用历史相对不足,但其临床应用研究较为丰富。本研究选择广泛用于保健食品开发且临床研究基础扎实的中药保健食品代表性原料“西洋参”作为研究对象,依据功能导向-算法集成,开展中药保健食品组方设计研究,或可为中药保健食品组方设计的功能导向化、组方计算化提供新的研发思路。

1方法

1.1 功能数据收集及处理分析

围绕保健食品与临床应用2个方面,统计整理西洋参应用概况。保健食品数据来源于国家市场监督管理总局特殊食品安全监督管理司(http://www. samr.gov.cn/tssps/)中含西洋参的保健食品批文;临床应用数据来源于中国知网,以“西洋参”和“临床观察”为关键词进行检索(2021年8月31日前收录文献)。数据统计及结果可视化处理依托大数据分析平台和CytoScape 3.9.0实现,分析平台包括BDP平台和NLPIR自然语言处理与信息检索共享平台中的分词标注、实体抽取、词频统计、词向量分析模块。

1.2 组方信息收集

依据分析所得保健食品功能方向,从保健食品、中成药、方剂3个方面,开展含西洋参保健食品的组方信息收集工作。保健食品信息来源于国家市场监督管理总局,中成药信息来源于《中国药典》2020年版及药智数据(https://db.yaozh.com/),方剂信息来源于中国知网、万方数据库、维普数据库和药智数据(均为2021年8月31日前收录)。对于保健食品信息,筛选具有“有助于增强免疫力”或“对化学性肝损伤有辅助保护功能”的含西洋参保健食品批文,完成组方信息收集。借助Microsoft Excel 2019实现组方信息录入与建库。

1.3 药味筛选

1.3.1 保健食品原料范围锁定

根据组方数据库,使用Microsoft Excel 2019,分别整理统计保健食品、中成药、方剂各组方药味种类及频次,并进一步在规范药味名称的基础上(将同物异名者、同种中药但规格相异者、仅经提取等特殊处理但功效未改变者统一规范为《中国药典》名称),依照卫生部《既是食品又是药品的物品名单》《可用于保健食品的物品名单》和《保健食品禁用物品名单》将非保健食品原料剔除,筛选得到可作为保健食品原料的药味。

1.3.2 各药味频次统计分析

运用中药系统药理学分析平台(http://tcmspw.com/tcmsp.php)的中药数据库,结合《中国药典》2020年版、《临床中药学》(第2版)的相关记载,将各药味依照功效主治归类,确定其所属类别。分别统计各药味及各类别在含西洋参保健食品、中成药、方剂组方中的应用频次,筛选得到高频保健食品原料药味及类别。

1.3.3 药味间的关联分析及赋权聚类

通过SPSS Modeler 18.0中的Apriori关联规则算法,对高频药味在组方中的应用信息进行网络图可视化处理,呈现药味关联情况及药对组合情况。借助Matlab R2021a,采用AHP-熵权-SOM联用算法,完成高频药味的赋权与聚类。采用主观与客观赋权算法相结合的分析方法(AHP-熵权法),对2级指标(药味类别)开展基于评分的主观权重分析,对3级指标(药味)分别进行主观和客观权重分析。在赋权的基础上,进一步运用SOM聚类算法,得到主观和客观聚类结果,关注二者结果中的最优选药味,取共有者,作为后续组方配伍的候选保健食品原料药味。

1.4 组方配伍

基于候选保健食品原料药味,结合分析所得药味关联情况及药对组合情况,提供“有助于增强免疫力”且“对化学性肝损伤有辅助保护功能”的备选组方。并进一步在Matlab R2021a中,运用TOPSIS综合评价法计算各备选组方得分并排位,对所设计保健食品组方进行综合评价分析,完成西洋参双功能中药保健食品组方设计。本研究技术路线如图1所示。

2结果

2.1 双功能选定

2.1.1 西洋参保健食品功能分布 “有助于增强免疫力”居首位

共收集972条含西洋参保健食品批文,所涉及保健食品功能种类、频次及分布如图2所示(功能名称已参照《保健功能释义(2022年版)》进行规范)。所涉及功能种类丰富、覆盖范围广,包括有助于增强免疫力、缓解体力疲劳、有助于抗氧化、有助于维持血糖健康水平、耐缺氧、有助于润肠通便、有助于改善黄褐斑、对化学性肝损伤有辅助保护功能、有助于维持血脂健康水平、清咽润喉等共20项功能。功能分布较为集中,以“有助于增强免疫力”居多,占比达37%。

2.1.2 西洋参临床应用与“肝”关系密切

提取并梳理1089项西洋参临床应用研究中的疾病及证型,输入NLPIR自然语言处理与信息检索共享平台处理框,处理流程及结果如图3所示。使用分词标注模块,依据《计算所汉语词性标记集Version 3.0》识别并区分名词、动词、形容词、前后缀、时间词、状态词等词性。在此基础上,通过实体抽取模块的完美双数组Trie树算法抽提得到“气阴两虚”“糖尿病”“乙型肝炎”“心脏病”“脓毒症”共5个关键词。进一步借助词频统计模块,聚焦名词统计排名前10位的词语,可得西洋参临床应用频率较高的病症为“糖尿病”,且多用于与心、肺、肝、肾等器官相关的疾病或证型。利用词向量分析模块,采用基于CBOW(continuous bag-of-words model)方法的Word2vector改进模型,综合词性、词的分布特点,提取本体关联关系,借助CytoScape 3.9.0实现分析结果的可视化。结果显示,西洋参临床应用的疾病及证型中心词为“乙型肝炎”,而与之相关联的2层、3层关键词多围绕“真菌”“肝炎”等展开。2.2 组方数据库构建

以“有助于增强免疫力”“对化学性肝损伤有辅助保护功能”双功能为导向,构建西洋参组方信息库,共收集信息441条,包括“有助于增强免疫力”西洋参保健食品364条、“对化学性肝损伤有辅助保护功能”西洋参保健食品25条、中成药33条以及方剂19条。

2.3 候选保健食品原料药味确定

2.3.1 高频保健食品原料药味筛选

规范西洋参组方数据库中各保健食品原料药味名称,经初步筛选得到可作为保健食品原料的药味共155个。按照功效主治归类,药味分属于18个类别,以补虚药、清热药、理气药居多(3者占比超过半数)。进一步筛选得到在保健食品、中成药、方剂中应用的高频保健食品原料药味及类别,结果如图4所示。2.3.2 药味关联分析及药对组合情况

采用Apriori关联规则算法描绘高频保健食品原料药味在保健食品、中成药、方剂中应用的关联情况及药对组合情况,为后续组方的药味配伍提供参考依据,如图5和表1所示(图5呈现各药味间的关联关系网络;表1展示支持度大于10%,置信度大于40%的药对组合结果)。保健食品、中成药、方剂的分析结果具有一定差异。在西洋参保健食品中,“有助于增强免疫力”形成以枸杞子为中心的关联网络,其分别与黄芪、黄精、灵芝、茯苓、蜂蜜组成关联性较强的药对关系;“对化学性肝损伤有辅助保护功能”表现为葛根、灵芝、红景天关联强,葛根-五味子、五味子-三七具有一定关联的网络关系。中成药和方剂的药味关联具有一定相似性,主要药味均包含甘草、麦冬、生地黄,但又分别展现出五味子-陈皮-肉桂和茯苓-泽泻-白芍的关联关系。

2.3.3 赋权与聚类分析

运用AHP-熵权-SOM联用算法,对高频保健食品原料药味进行赋权与聚类。参考文献中的各级指标设置方法,设定“类别”为2级指标,共包含15个类别;“保健食品原料药味”为3级指标,共包含64个药味,各级指标采用不同算法进行处理。对于2级指标,采用AHP法,选择以频次为依据的最优打分赋值方式对各类别及各类别项下药味进行权重计算。最优打分赋值方式是以“有助于增强免疫力”保健食品、“对化学性肝损伤有辅助保护功能”保健食品、中成药、方剂及以上4者综合统计所得频次为依据的5种打分赋值方式中一致性指标(consistency index,CI)和一致性比例(consistency ratio,CR)绝对值较小的方式。结果如表2所示,最优方式为“4者综合”。对于3级指标,考虑到其包含的药味数量较多,仅选择AHP法进行主观打分赋值并开展权重计算可能存在一定的不合理性。采用主观与客观相结合的赋权算法可提高筛选结果的可信度,故分别采用AHP法与熵权法进行计算。在考虑“有助于增强免疫力”保健食品、“对化学性肝损伤有辅助保护功能”保健食品、中成药、方剂及以上4者综合统计所得频次的基础上,计算得到各药味在2种算法下的权重赋值。依据2级指标及2种算法下3级指标的加权结果,采用SOM聚类分析为各高频保健食品原料药味赋予分值,得到主观和客观2种赋权聚类结果,图6依次展示了每种分类结果的聚类关联图(图中灰色正六边形表示神经元节点,正六边形间的色块颜色越偏向于黑色则表示节点间的聚类关联越弱)和神经元分布情况图。根据各药味分值进行分类,分值接近者聚为一类,每10分为一类,共7类。药味得分低于10分者属于第1类,即最优选类别。取二者最优选类别的共有药味作为候选保健食品原料药味,结果如图6所示(共有药味以红色框标识,0分表示未存在于最优选类别中)。候选保健食品原料药味为黄芪、麦冬、茯苓、五味子、枸杞子、三七、葛根、甘草共8味药材。

2.4 组方评分及优选

基于传统中医药理论和现代研究,针对8味候选保健食品原料药味,参考关联分析及药对组合情况的分析结果,生成10个备选组方。运用TOPSIS综合评价法,以各药味权重(2级指标及2种算法下3级指标权重加和)为依据,为各组方评分并排位,结果如表3所示。结果表明,排名前4位的组方评分较高,最优选的西洋参“有助于增强免疫力”和“对化学性肝损伤有辅助保护功能”双功能中药保健食品组方由三七、西洋参、葛根、五味子、枸杞子组成。

3讨论

3.1 西洋参双功能保健食品功能选定

“有助于增强免疫力”是西洋参应用最为广泛的保健食品功能,同时也是受现有保健食品市场青睐的“热门”功能,有较为扎实的研究基础。参考《保健功能释义(2022年版)》,“免疫力”包括机体对外防御和对内环境维持稳定2个方面。在一定程度上,2个方面可分别与传统中医理论中的“祛邪”与“扶正”相联系,即在扶助正气、调补脏腑、增强体质的同时通过利水祛湿、清热解毒等方法达到抵御病邪及清除病理产物的效果。西洋参作为补虚药,长于补气益阴、清热生津,在传统中医药理论的指导下常与其他药味配伍以达到“扶正祛邪”的目的。同时,NLPIR平台分析结果中的“气阴两虚”“脓毒症”等关键词均与“免疫”关系密切。由此可得,西洋参与“有助于增强免疫力”这一保健功能的关联性较强。“对化学性肝损伤有辅助保护功能”在功能频次统计中位列第8,但由于西洋参保健食品功能的分布较为集中,故相较而言,西洋参用于“对化学性肝损伤有辅助保护功能”保健食品的研发背景略显不足。然而,在NLPIR平台的临床应用数据分析中,词向量分析结果以“乙型肝炎”为中心词进行展开(词向量分析可依据生语料进行训练产生专业领域的本体关联关系,更适于呈现词语间的指向性与关联性),且实体抽取与词频分析均显示其临床研究与肝脏呈现较强的相关性。因此,西洋参用于肝脏疾病的相关临床研究具有大数据分析背景作为支撑。此外,“化学性肝损伤”在中医视角下的关键诱因为湿、热、毒、痰、瘀等互结,致使肝失疏泄、脾失健运、肾阴亏虚,其基本治则符合“扶正祛邪”理论,即扶固正气,补虚养阴,去除湿、热、毒、痰、瘀等病邪,这与西洋参的补阴功效相合。加之,考虑到西洋参的“中药”属性,中药通常以药物配伍的方式进行应用,除西洋参自身功效的考量外,西洋参可与其他药味配伍组合,作为中药方剂中的臣药或佐使药,针对具体应用情况,辅佐君药,在其单味药的应用基础上扩大应用范围,达到不同的治疗效果,这也在一定程度上为西洋参单味药的传统功效与基于大数据平台的临床应用分析结果存在差异供了合理解释。西洋参单味药的功效看似与“对化学性肝损伤有辅助保护功能”缺少直接联系,但其通过与其他药味的配伍组合,可用于与肝脏相关疾病的临床治疗。因此,后续的组方配伍设计研究也可进一步为西洋参“对化学性肝损伤有辅助保护功能”保健食品的研发增加可能性。基于此,从“保健食品原料”及“中药材”2方面考虑,选择应用最为广泛且研究基础扎实的“有助于增强免疫力”保健食品功能,以及与大数据分析处理平台的临床应用分析结果相关的“对化学性肝损伤有辅助保护功能”进行西洋参双功能中药保健食品开发,具有一定可行性。故进一步以此双功能为导向,在此基础上开展组方设计研究。

3.2 AHP-熵权-SOM赋权聚类算法联用机器学习是挖掘海量组方信息、提取内在配伍规律的有力抓手。在赋权聚类中,本研究最初采用AHP法对高频保健食品原料药味进行赋权。然而,由于本研究3级指标所包含样本数较多,仅凭AHP主观赋权算法进行赋值打分并依据其权重计算结果开展聚类分析会略有偏颇。现有赋权算法可分为主观与客观2类,结合主观判断与客观指标之间的变异系数或相关关系分别确定权重结果,算法联用,互为补充,可提高筛选结果的可信度。由此,本研究采用AHP-熵权法-SOM联合的赋权聚类方法,结合主观(AHP法)与客观(熵权法)赋权算法,依据二者的赋权结果,分别进行SOM聚类分析,选择最优类别中的共同者,作为候选保健食品原料药味,开展后续组方配伍研究。

3.3 优选组方分析

优选所得西洋参“有助于增强免疫力”和“对化学性肝损伤有辅助保护功能”双功能中药保健食品组方由三七、西洋参、葛根、五味子、枸杞子组成。在传统中医药理论中,免疫功能属于中医“正气”范畴;而肝损伤则与正虚不御邪,毒邪伤正,耗损肝肾阴精气血关系密切。本组方中三七为补血第一要药,补血活血而不留瘀;西洋参补气养阴、清热生津;葛根解肌退热升阳、生津;五味子益气生津、补肾宁心;枸杞子补益肝肾、益精。5者配伍组合可益气补血、养阴生津、补肾宁心,补气血、益精血、祛瘀生新,同时清热、利水、消肿、散瘀以驱除邪气,发挥保健食品双功能。此外,现代研究表明,本组方中三七和西洋参含有的皂苷类成分、葛根含有的葛根素、五味子含有的五味子醇甲以及枸杞子含有的多糖类成分或在保健食品双功能中发挥主要作用。三七总皂苷能降低促炎因子(肿瘤坏死因子-α、白细胞介素-6)的表达,升高抑炎因子表达从而减缓炎症反应的发生,与免疫力密切相关。西洋参皂苷类成分可通过增加中性粒细胞数量、改善巨噬细胞吞噬功能及促进体内γ-干扰素的分泌来实现对机体免疫功能的调控作用。西洋参皂苷类成分对D-半乳糖胺/脂多糖所致急性肝损伤具有一定的保护作用。其中,含量最高的人参皂苷(人参皂苷Rb1)可通过抑制肝实质中性粒细胞浸润,以及下调核因子-κB通路相关促炎因子,缓解肝脏炎症。葛根素、五味子醇甲可调节肝细胞白细胞介素-1β、环氧合酶-2、前列腺素E2等炎症因子的蛋白表达,减轻肝脏炎性反应,减少肝细胞死亡,恢复肝功能,发挥保护肝脏的作用。枸杞糖肽作为具有免疫活性的糖蛋白,可调节外周和中枢炎症,改善多脏器功能,枸杞子含有的多糖类成分可有效缓解肝功能损伤,并在多种肝脏疾病治疗中发挥积极作用。综上所述,本研究围绕中药保健食品原料西洋参的“双重身份”,依托大数据平台,分析挖掘具有潜在开发价值的保健食品功能,以“有助于增强免疫力”“对化学性肝损伤有辅助保护功能”双功能为导向,收集保健食品、中成药、方剂组方信息,联合多种算法完成药味关联分析、赋权聚类、组方配伍及评价,实现功能导向-算法集成西洋参双功能保健食品组方设计。后续拟在此研究思路的基础上,进一步开展在保健食品领域应用广泛且在中医药理论指导下传统应用历史悠久的中药保健食品原料(如枸杞子)的组方设计研究。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询