Chapter 1 简介

Mstata 医学统计机器人是新一代的人工智能医学统计软件,专为临床研究设计而生。只需上传数据,机器人会根据研究类型和设计智能选择合适的统计分析方法,一键生成统计表和图形,自动匹配杂志格式要求,导出符合投稿要求的 Word 版统计报告,甚至自动生成一篇3000-5000字的论文草稿。

1.1 背景

当前,临床科研发展的痛点之一是统计学知识匮乏,专业统计师与临床医生的配比极低。高校统计师的咨询费用已经达到 1800 元/小时。临床医生学习统计学的时间成本极高。最大难点并不是如何实现统计分析,而是如何用统计学思维设计研究,决定何种研究类型选择何种统计方法。

传统统计软件的菜单界面复杂,进入后需要选择各种统计方法如 T 检验、卡方检验、方差分析、回归、机器学习等,与临床研究设计不沾边,不懂统计学根本无法入门。我们需要的是一款智能引导研究者选择适宜统计方法的工具。

广大临床研究工作者需要的其实是一款能够根据疗效比较、安全性比较、影响因素分析或预测研究等具体研究需求进行智能引导的软件。Mstata 正是为此而生,从研究设计类型入手,通过引导菜单帮助用户选择正确的研究设计类型,并智能选择统计方法。

1.2 特点

特点 描述
用户友好的 Web 界面 无需编程,全程鼠标操作,让非专业统计人员也能轻松上手。
临床研究导向 从临床医生的视角出发,根据研究设计类型引导用户,降低操作难度。
高效的人工智能支持 自动识别研究设计,智能决定统计方法,节省时间,提高准确性。
自然语言处理(NLP)技术 生成易读的统计报告,甚至可自动生成论文草稿。
专为临床研究定制 菜单从选择研究设计类型开始,全程使用引导性的临床语言,降低学习成本。
发表导向 所有输出的统计表格和图形均符合医学类 SCI 杂志的发表规范,无需再加工,提高投稿成功率。

1.3 优势

优势 描述
无需编程 相较于 SAS、R 等需要编程的统计软件,MSTATA 采用简单的鼠标操作,让广大医师轻松上手。
面向临床医生 SPSS 等统计软件学习成本高,不懂统计难以操作。MSTATA 则以临床研究为导向,使用更为直观。
知识贯彻 在分析过程中,MSTATA 潜移默化地向研究者传递研究设计思维,提升研究者的科研水平。

1.4 软件界面

1.4.1 菜单栏

顶部为菜单栏,为各项功能的入口,先点击“数据准备”菜单,导入数据后方可开始。导入数据后, 再点击其他功能菜单,进入统计分析或者论文生成的模块。

1.4.2 软件功能检索和 AI 客服

软件中部有一个“软件功能检索”入口,此处有 AI 人工客服,因为统计软件的菜单比较复杂,您可能不了解您要做的分析方法在菜单什么位置,也不知道本软件目前有没有支持该方法。因此,您可以在其中的对话框中,通过关键词检索您要做的统计方法,例如您可以输入:

“基线人口学特征表功能在哪里?” “单因素多因素分析怎么做” “广义相加模型在什么地方?”

她就会告诉您答案。

如果您不知道用什么统计方法,可以描述您的研究设计,她会告诉您到哪个菜单进行分析,例如:

“我现在有一个数据库,里面有性别,年龄,肿瘤特征,实验室检查指标,我想分析这些指标对患者总生存的影响,应该怎么做?”

她会根据您的研究设计,推荐您到本软件的哪个菜单下面查找哪个模块进行分析。

1.5 软件模块

1.5.1 数据准备

先点击“数据准备”菜单,将数据导入,定义字段、进行数据治理、因子排序 之后,再点击分析模块进行分析;数据导入定义字段这两步骤是必需的,否则无法下一步 进行统计分析。

1.5.2 临床医学智能分析模块

上传数据并定义好字段之后,如果是进行临床医学论文的统计分析,可以点击“描述统计”,“疗效分析”, “因果推断”,“预测研究”等等模块,进行人工智能一站式统计分析,此类模块以研究类型分类,按照医学研究设计步骤,产生论文中需要的一系列图表,并生成图表的描述性文字, 形成一整篇研究报告。

1.5.3 按统计学分类模块

按照统计学分类,例如T检验、方差分析、生存分析、广义线性模型、混合效应模型等等,供有一定 统计学基础的研究者使用,灵活运用统计模块自由设计分析策略。

1.5.4 论文生成模块

将临床医学中的 SCI 论文套路做成八股文步骤,按照既定的模版进行分析,自动产生图表,并 自动进行撰写,可以用自己的数据,在 5 分钟内生成一篇 3000-6000 字的论文全文。例如 Logistic nomogram 的临床预测研究等等。适合没有太多自己思路的学者使用。

1.5.5 chatR.online 人工智能自动统计分析模块

chatR.online 聊天式自动统计分析平台(MSTATA 补充):作为 MSTATA 的补充模块,面向临床与科研用户,支持以自然语言零代码驱动 R 的完整工作流,覆盖 R 软件支持的所有统计包与统计模型(预装 10,000+ R 包),实现基础统计、回归、混合效应、生存分析、机器学习、贝叶斯、作图与数据治理/数据生成等;实时生成发表级图表(含热图、火山图等)及基线/回归三线表、森林图,并智能匹配中英论文级结果描述;支持多轮对话迭代纠错与优化,一键导出 Word 三线表与 PDF 高清图,帮助统计新手与专业研究者高效完成从分析到写作的全流程。 此模块适合有一定统计学基础的同学使用,当遇到 Mstata 还未上线的统计模型时,可以用 chatR.online 替代完成。