Author 作者 编译|陈亭玮人工智慧小型AI模型LLM在人工智慧(artificial intelligence, AI)技术快速发展的今天,大型语言模型(large language models, LLMs)已经成为许多科学研究工作者的得力助手。然而,最新趋势显示,科学家正转向在自己的笔记型电脑上安装小型AI模型,而非依赖网路版的ChatGPT等服务。这种转变不仅带来便利性,更为科研工作提供新的可能性。
近年来,多家科技巨头和研究机构纷纷推出小型且开放的AI模型。例如Google DeepMind、Meta和Allen Institute for Artificial Intelligence等单位都发布了各自的小型AI模型。虽然被称为「小型」,不过这些模型的参数量仍有300亿之多,相较早期模型已经相当庞大。微软(Microsoft)在这一领域更是表现突出,於去(2023)年和今(2024)年陆续推出了Phi系列模型,其中部分版本还具备图像处理能力。值得注意的是,即使是最小的Phi模型,在某些测试中的表现也优於去年的OpenAI GPT-3.5 Turbo。
小型AI模型的优势主要有几个方面。首先,对於需要处理敏感资料的研究人员来说,使用直接安装於电脑的AI模型,相较於连网的大型LLM来说资讯安全性更高,可以避免使用者在无意中违反个资保护的相关法规。例如医生根据开放软体开发AI系统,用於转录和总结患者的访谈内容,以确保患者的隐私不被泄露。其次,与订阅商业AI服务相比,使用直接安装於电脑的AI模型可以大幅降低成本,这对於长期进行大量AI辅助工作的研究人员来说尤为重要。
此外,研究人员可以根据特定需求,对下载进电脑中的模型进行微调。例如生物医学科学家可以利用开放模型,微调设置为专门用於自身科学研究领域的新模型。与不断更新的商业模型不同,这些装设在电脑中的AI模型在不更新的情况下,仍可以保持稳定不变的运作逻辑,对於需要使用同一种方法分析结果的科学研究至关重要。最後,在网路连接不稳定的地方,安装在电脑中的AI模型可以确保研究工作不受影响,这对於在野外工作的科学家有很大的帮助。
在实际应用中,小型AI模型已经展现出巨大潜力。像是医生利用此AI模型从医学报告中找出诊断资讯,并生成训练数据,以开发能够预测心脏病诊断的AI系统。还有研究人员使用特定模型设计新的蛋白质序列,以进行主要组织相容性复合体(major histocompatibility complex, MHC)分子分析的演算法研究。韩国一家制药公司开发的系统则利用可离线的LLMs分析细胞类型聚类,甚至可将细胞的基因表达等特徵总结为一句话。
现阶段已有多种不须联网的LLMs可供选择。例如开源软体Ollama支援Mac、Windows和Linux系统,可下载并透过命令行使用多种开放模型;GPT4 All是一款跨平台应用程式,提供图形操作界面;Llamafile则可将LLMs转换为单个文件,在多种操作系统上运行。随着LLM的选择变得多样化,选择适合自己的软体是一大关键。也因为技术不断进步,不须连网的AI助手将在未来的科学研究中扮演愈来愈重要的角色。
新闻来源
Hutson, M. (16 September 2024). Forget ChatGPT: why researchers now run small AIs on their laptops. Nature. https://www.nature.com/articles/d41586-024-02998-y