香港科技大学首席副校长,英国皇家工程院院士,欧洲科学院院士,香港工程科学院院士,英国帝国理工学院数据科学研究所所长、清华大学人工智能国际治理研究院学术委员会委员

《财政预算案》宣布成立香港人工智能研发院,财赤之下仍为此预留 10 亿元,足见对人工智能发展的重视。预算案公布前夕,由政府资助的 InnoHK 香港生成式人工智能研发中心 (HKGAI) 发布首个香港研发的 AI 大语言模型 HKGAI V1,是基于 DeepSeek
671B 全参数微调,并持续训练而成。记者邀请科大首席副校长、HKGAI 主任郭毅可受访,介绍 V1 大模型的研发过程,也谈谈对香港人工智能发展的展望。

2023 年 ChatGPT 引起全球关注,却不对香港地区开放。香港政府与香港的专家、科研团队经过讨论,决定建立本地的生成式人工智能研发平台,即是后来于同年 10 月成立的 HKGAI。不到一年,HKGAI 便开发出第一个大语言模型的版本 “港文通” (生成式人工智能文书帮助应用程序),去年年中率先于政府部门试用。
郭毅可认为,相较其他地方,香港暂时缺少技术能力、财力和人才,去做很多大模型彼此竞争,倒不如像现在集中精力,做一个非常好的模型。“我觉得香港政府是很聪明的,中国有一句话叫 “因地制宜”,
所以我们已经知道自己的长 (处) 和弱 (点)。” 他阐述香港的研发方式,是先由政府内部试用,并面向世界上最好的技术,最后才一步到位。HKGAI 团队早于 DeepSeek - V2 去年中推出时,便开始追踪其发展;与此同时,团队持续培养自身系统的微调能力、价值观对齐能力,花了很大精力去准备数据。这些训练数据报括政府的公开数据库、图书馆数据,以及特定领域的专业知识等等。
DeepSeek - R1 今年 1 月 20 日对外发布,以低研发成本及高效能震惊全球。HKGAI 团队 5 天后开会决定就 DeepSeek 模型进行全参数微调。短短一个月后,HKGAI V1 大模型已经上线,研发速度的确很快。郭毅可称,这是由于 HKGAI 本来已有一个本地大模型,加上有很强的技术团队进行微调。
香港市民可免费注册使用 DeepSeek 模型,系统亦支持广东话对话。在此背景下,为何香港仍有需要研发自己的 AI 大模型?郭毅可尝试以通俗说法解释, DeepSeek 就像是大脑,神经元的连接经过训练形成特定模式,组织成我们的思考。可是当这个 “大脑” 来到香港,会遇到不一样的思考、表达方法,香港有自己的价值观、风土文化,郭举例自己作为上海人,“我就要重新学习,读香港的书,听香港的话,看香港的电影。” HKGAI V1 基于 DeepSeek 671B 进行全参数微调,也就是把系统本地化,使其响应更贴近香港的文化、价值。
郭毅可形容现在像是 “站在巨人肩上”,以高水平的 DeepSeek 模型作为基线,在研发路上继续前进。DeepSeek 采用开源模式,把 “脑袋” (参数) 交给全球的研发人员,而后者仍然要研究 “学习方法”,使 “脑袋” 学习新东西的同时,持续不遗忘过去好的记忆,这正是难度所在。“如果我们学会了持续学习,也就学会了 DeepSeek 的学习方法 。这些方法如果看到它效率不高, 我们就可以再做改进。” 郭毅可提醒,人类永远会进步,“DeepSeek 只是刚开始,不是结束”。
不过早商业化
HKGAI V1 发 布会上,团队示范与聊天机械人对答,问旺角哪里有 “平靓正” 的烧味档,它推荐了数间餐厅并附上简介;又展示以王菲新歌 《世界赠予我的》歌词重新作曲,效果不俗。模型有计划开放予公众以至企业使用,不过郭毅可强调先要确保模型稳定,举例不同答案要有一致性,不能今天说某某是对,明天说是错。此外,模型要有足够的承载力,以应付大量用户同时使用。“在没有做出非常稳定、
非常被社会接受的系统, 我们也不谈过早的商业化”,郭毅可认为这样可以保证研究水平,“研究不急,我们等得起;时机到,我们也做得非常快”。

郭毅可 2014 年创办伦敦帝国学院数据科学研究所,做的就是人工智能开发。那段时间正是这波人工智能发展浪潮的开端,有关深度学习的研究已经开始,由 DeepMind 研发的人工智能 AlphaGo 更在 2015 年击败欧洲围棋冠军,一鸣惊人。从那以后,人工智能发展飞快,郭毅可感叹:“我们 (现在) 一天的成就,可能是过去 70 年的成就。” 因此他说 “干人工智能 (行业) 很苦”,领先世界的时间大概只有数小时,可能很快又会被超越。
身为人工智能领域的国际权威学者,郭毅可一直也在研究逻辑、推理。不过被问到是否需要教导年轻一代使用 AI,他却说他们随时反过来教你,举例从医的儿子每天都要使用 AI 系统,“所以他是我的产品经理,我得问他怎么弄”。俗语有云名师出高徒,郭毅可说人工智能行业是 “高徒出名师”,要向身边学生学习。HKGAI 团队接近 200 人,超过一半是 90 后、00 后。“你想它 (人工智能) 发展这么快, 年轻人当然是主力。”
HKGAI 除了研发模型,也同步培养人才。中心主任郭毅可直言:“那么大规模的一支团队,在香港是可贵的,原来是没有的
。” 团队成员大多从内地或其他国家来港,也有一些香港本地人才,但不太多。人才是流动的,他认为香港作为国际城市且网络畅通,有助吸引内地和国际人才。有了 HKGAI 这个基础大模型,他预期香港一至两年内会冒出 20 多间公司。“水往低处流,人往高处走。系统越来越好,人才便越来越多。”
香港算力不足但效率高
望研发院连结 “产学研”
人才以外,算力是人工智能算法运行和数据处理的根基。郭毅可指出,HKGAI V1的开发过程中,数码港也提供了算力支持,“如果没有他们的算力支持,我们也比较苦
,没那么快”。由政府支持、于数码港设立的人工智能 (AI) 超算中心去年启用,首阶段提供 1300PFLOPS (每秒浮点运算 1300 千万亿次) 算力,今年逐步提升至 3000PFLOPS。郭毅可指出,若有足够的算力,大模型迭代 (进化) 的时间也可缩短。以炒菜作比喻,一般煤气炉要炒 10 分钟,爱文森大牌档用大火快炒,“两分钟就完了,炒得还好吃”。他认为香港现在算力并不足够,但不足也非坏事,说明使用效率很高;盲目增加算力也是浪费,应按研发团队、企业的发展适时调整,以免耽误其应用。
预算案宣布成立香港人工智能研发院,创新科技及工业局长孙东指,未来会考虑将 HKGAI 与研发院的发展整合,以推动 AI 在社会应用及产业发展。郭毅可个人认为,研发院可望成为连结 “产学研” 的胶水,也可负责研究优化提供算力的组织结构、促进国际合作等工作。
HKGAI 受创科局委托,参与制订生成式人工智能的应用指引,创科局指将于不日公布。郭毅可提及,HKGAI 是同步进行开发和撰写指南,使指南得以与技术结合。自 AI 工具越来越普及,各地对于其治理存有分歧,譬如欧盟率先通过规范 AI 应用的 《人工智能法》,美国总统特朗普则大力推动 AI 发展。到底应如何规管 AI,又不会窒碍科研?
郭毅可认为:“治理的人要懂技术,懂技术的人要懂治理,两者不可分。” 譬如当有人说不能让机器有意识,他觉得这种讨论从科学角度来说是缺乏深度,“什么叫意识?” 如果结合技术层面一起思考,便不会如此笼统提出问题。无可否认的是,存在深度伪造等对 AI 的误用,郭毅可也认同需要治理,“所以我觉得一定是要平衡,当矛出来的时候,就要有精确的盾”。法律规管可结合测假工具,互相补足。
创新科技及工业局长孙东出席 HKGAI V1 大模型的发布会,表示在这波以人工智能为代表的科技浪潮中,香港没有缺席。郭毅可认同其说法,而且香港在中国 AI 发展过程中浓墨重彩,人工智能企业商汤科技、无人机制造商大疆创新均与香港有关连。
只谈生成式 AI 发展,郭毅可也评价香港的步伐稳健,方向正确。“我们现在 (研发) 的道路比较清晰,不会去走弯路了,争取不走弯路。但是走的道路清晰是好的,跑的也要快啊,这也是一个挑战。” 有了 HKGAI V1 大模型,接下来要逐步建立生态,除了像 HKGAI 的技术开发者,还要有服务提供商 (现在暂时只有政府)、算力机构和宽带网络等参与。
有意见认为,香港在 AI 发展方面步伐落后,但郭毅可没有这感觉。当然凡事只有更好,没有最好,他认为香港在算力增长、数据标准、人才培养等方面可做得更好。“落后不落后
,最后看这个社会对它的接受程度”,他有信心,香港完全有可能成为中国 AI 程度最高的城市。此外,香港以至全中国的 AI 研究,同样面临原始创新的挑战。郭毅可称,DeepSeek 给了大家很好的鼓励,可以做得好的,“而且我觉得现在这批 90 后是非常出色的,他们有一种平视世界的心态”。
撰文:朱令筠
清华大学人工智能国际治理研究院(Institute for AI International Governance, Tsinghua University,THU I-AIIG)是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势,研究院面向人工智能国际治理重大理论问题及政策需求开展研究,致力于提升清华在该领域的全球学术影响力和政策引领作用,为中国积极参与人工智能国际治理提供智力支撑。
新浪微博:@清华大学人工智能国际治理研究院
微信视频号:THU-AIIG
Bilibili:清华大学AIIG
来源 | 本文转载自“明报 ”,点击“阅读原文”获取更多内容
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢