- 中英对照中医药术语数据集基于人民卫生出版社(PMPH)制定的《中医英语术语(内部草案)》、世界卫生组织(WHO)制定的《WHO International Standard Terminologies on Traditional Medicine in the Western Pacific Region》和世界中医药学会联合会(WFCMS)制定的《International Standard Chinese-English Basic Nomenclature of Chinese Medicine》3个权威术语标准整合而成,旨在促进中医药术语标准化和中医药国际交流。本数据集通过Python pandas包及OCR技术将数据进行采集、清洗、整理、合并,最终分为56类,共整理数据16 189条,经合并为8975条。本数据集促进了中医术语的规范化,方便了学术交流和中医的继承发扬,同时有助于中医药信息化建设。
- 查询
- 10.11922/sciencedb.j00001.00213
- 舌诊是中医特色的诊察方法之一,也是中医诊断病证的重要依据,主要包括舌质和舌苔两方面内容。其中舌苔主要包括苔质和苔色,尤其苔色是辨别疾病性质的重要指标。临床上舌苔易被药物、食物染色,产生颜色假象,极易引起误诊。本数据集记录了中医染苔与非染苔两种舌象,平均每个类别的舌苔图像约1000 余张。其中染苔数据包含不同人群健康状态下进食染色食物后 5 分钟、10 分钟、30 分钟的舌苔颜色变化图像,其颜色主要分为白、黄、灰黑 3 种,以黄色居多。非染苔数据包含不同患者的病理性舌苔图像,分为白苔、黄苔和灰黑苔 3 种。本数据集可为舌诊方向研究提供可靠的分类依据,有效解决染苔假象问题,也在一定程度上为开发更智能的舌诊仪提供数据支持。
- 分类
- 10.57760/sciencedb.j00001.00822
- Background. Continuous wavelet transform (CWT) based scalogram can be used for photoplethysmography (PPG) signal transformation to classify blood pressure (BP) with deep learning. We aimed to investigate the determinants that can improve the accuracy of BP classification based on PPG and deep learning and establish a better algorithm for the prediction. Methods. The dataset from PhysioNet was accessed to extract raw PPG signals for testing and its corresponding BPs as category labels. The BP category of normal or abnormal followed the criteria of the 2017 American College of Cardiology/American Heart Association (ACC/AHA) Hypertension Guidelines. The PPG signals were transformed into 224 ∗ 224 ∗ 3-pixel scalogram via different CWTs and segment units. All of them are fed into different convolutional neural networks (CNN) for training and validation. The receiver-operating characteristic and loss and accuracy curves were used to evaluate and compare the performance of different methods. Results. Both wavelet type and segment length could affect the accuracy, and Cgau1 wavelet and segment-300 revealed the best performance (accuracy 90%) without obvious overfitting. This method performed better than previously reported MATLAB Morse wavelet transformed scalogram on both of our proposed CNN and CNN-GoogLeNet. Conclusions. We have established a new algorithm with high accuracy to predict BP classification from PPG via matching of CWT type and segment length, which is a promising solution for rapid prediction of BP classification from real-time processing of PPG signal on a wearable device.
- 分类
- doi.org/10.1155/2021/9938584
- 中医药是一个拥有数千年临床经验的整体医疗体系,在全球医疗保健中发挥着至关重要的作用,尤其是在东亚地区。然而,中医的隐含推理、多种文本形式和缺乏标准化给计算建模和评估带来了重大挑战。大型语言模型在处理包括普通医学在内的不同领域的自然语言方面表现出了巨大的潜力。然而,他们在中医药领域的系统评价仍然不发达。现有的基准要么狭隘地关注事实问题的回答,要么缺乏特定领域的任务和临床现实主义。为了填补这一空白,我们引入了MTCMB-一个多任务基准,用于评估中医知识、推理和安全方面的LLM。MTCMB由12个子数据集组成,涵盖五大类:知识质量保证、语言理解、诊断推理、处方生成和安全性评估。该基准整合了真实世界的病例记录、国家执照考试和经典文本,为具有中医药能力的模型提供了一个真实而全面的测试平台。初步结果表明,目前的LLM在基础知识方面表现良好,但在临床推理、处方计划和安全合规性方面存在不足。这些发现强调了迫切需要像MTCMB这样的与领域一致的基准来指导更称职、更值得信赖的医疗人工智能系统的开发。
- 大语言模型
- doi.org/10.48550/arXiv.2506.01252
- 疫情催化下,人工智能正在持续助力中医药传承创新加速发展,其中中医用药知识体系沉淀挖掘是一个基础工作。随着自然语言处理技术的不断发展,问题自动生成(Question Generation)作为一个重要的研究课题已经在很多实际应用场景中有落地,通过机器主动提问可以用来高效构建或者补充知识库,扩大数据集规模。问题生成技术已经应用到诸多实际应用场景中,如在医药领域,可以应用到自动问诊、辅助诊疗等场景。本次标注数据源来自中医药领域文本,包括【黄帝内经翻译版】、【名医百科中医篇】、【中成药用药卷】、【慢性病养生保健科普知识】四个主要来源。
- 大语言模型