当前以ChatGPT为代表的人工智能技术正逐步渗透现代医学场景,但这类通用大模型的优化逻辑是适配语言生成模式,本身并不以“可信医学数据库”为设计目标。考虑到神经外科领域的知识体系复杂度高、临床决策容错率极低,GPT类模型调用信源的可信度、输出零误差的硬性要求,都让通用模型难以直接匹配神经外科场景需求。针对上述痛点,INC Rutka教授团队在通用ChatGPT及其他GPT类模型的基础上做了针对性迭代,推出专为神经外科临床需求定制的改良版本——AtlasGPT。该模型基于经同行评审的神经外科专属数据源搭建,通过定制化训练流程开发,可对神经外科医生的临床提问、手术规划类提示输出高精度答复。
特殊、关键的检索步骤
AtlasGPT采用业内前沿的检索增强生成(RAG)技术压降输出风险,保障答复符合神经外科临床的高标准要求。这类模型采用双流程架构,将大语言模型(LLM)的生成能力与外部数据检索机制做耦合,可把外部信源的最新关联信息整合进最终答复,既提升了输出内容的准确率与相关性,也补上了传统大模型的核心短板。RAG架构在初始查询环节就嵌入了关键的过滤、排序动作,即检索环节:收到用户提示后,模型会先启动定向搜索,召回训练阶段预先圈定的可信信源内的关联数据;从预设的大型神经外科语料库中捞取到对应文章、段落或片段后,模型会把这些内容与用户原始提示做拼接整合,给后续生成环节喂足上下文,最终输出真实无偏差的答案。
个性化、前沿的回答
输出内容的详略程度、表述语气可按用户身份或受众的医学知识储备灵活调整,目前支持面向患者、医学生、住院医师、执业神经外科医生四类群体的差异化表达风格。整套架构的扩展性、集成性较强,目前已基于表述性状态转移(REST)架构风格的应用编程接口(API)完成了两项定制化集成,配套的自动数据摄取管道也已上线,可保证AtlasGPT的知识库持续更新,始终匹配临床最新需求。
海量、专业的神经外科文献
AtlasGPT对检索环节的精度要求极高,训练语料广泛复用预训练的神经外科专业文献,覆盖《Journal of Neurosurgery(神经外科学杂志)》、《Neurosurgical Atlas(神经外科图谱)》及各类经同行评审的神经外科出版物等权威信源。截至2023年12月,AtlasGPT已完成25万页同行评审神经外科文献的训练量,目标是简化输出链路、保障生成内容可靠,符合全球顶尖神经外科期刊的严苛质控标准。后续AtlasGPT还将拓展图像识别、计算机视觉类应用场景,知识库的覆盖维度也会持续扩容。