公司新闻

四建集团AI研究室发布行业首个百亿字符知识增强“ChatGPT”

日期:2023-11-10


由四建集团建筑人工智能研究室自主研发的建筑行业首个百亿字符知识增强对话大模型Construction-GPT(Beta版),在10月16日正式上线,预计今年年内开放建筑专业词嵌入、非结构化文件解析等相关API接口供行业使用。Construction-GPT包含规范标准智能问答与查新、工程图集详图智能搜索、内控技术文件智能查询、私有知识库智能构建4项主要功能,实现了5000多本规范标准、1000多份工程图集、150多份企业内部技术文件的智能解析,技术人员通过对话问答方式,只需5~10秒就能够检索到需要的建筑工程技术资料。

建筑行业作为正处于数字化转型起步时期的传统行业,在技术资料检索工作中,长期被3个问题困扰:即建筑行业所涉及的规范标准数量庞大,更新速度快,难以全面检索;工程图集规模庞大,对于某一节点详图、构造做法的具体描述位置,难以快速检索;项目技术资料内容繁杂,而且同一个文件往往存在多个版本,难以准确检索。为此,四建集团建筑人工智能研究室自主研发了建筑行业首个百亿字符知识增强对话大模型Construction-GPT(Beta版),为项目技术人员提供了便捷的建筑工程技术资料智能检索工具。

Construction-GPT具有五个特点:一是知识检索,问答查询。研发团队利用自主研发的建筑专业词嵌入模型、半监督微调、大模型价值对齐3项关键技术,实现了5000余本规范标准、1000余份工程图集、150余份公司内部技术文件的智能解析。技术人员可通过对话问答方式,快速、全面了解最新规范标准、工程图集、内部技术文件中的详细规定与要求。二是高效推理,答案溯源。AIDAC数据吞吐加速技术的加入有效提高了Construction-GPT的推理速度,在无网络延迟测试下,回答仅需5~10秒。此外,Construction-GPT打破了以往通用大模型的“谣言机制”,为每个回答提供准确出处信息与索引资料来源,可一键打开索引资料链接进行深度查询与检索。三是知识解析,私家助手。技术人员可根据个人存储资料开展相关检索,通过研发团队自主研发的多模态数据解析算法,仅需一键上传文件,Construction-GPT便可自动解析常见的文档、图纸、音频格式文件(目前支持24种),打造个人专属智能知识检索系统。四是一键查新,辅助办公。研发团队还建立了规范标准动态数据库,利用近似字符串最优匹配算法,开发了规范标准智能查新功能模块,解决了技术人员难以了解规范标准最新修编情况的难题,技术人员仅需一键复制粘贴,便可快速更新规范版本。五是双端同步,随叫随到。除平台网页端外,为了方便技术人员能够随时随地开展技术资料检索,研发团队同步开发了Construction-GPT小程序端。在同一账号下,小程序端与平台网页端可实时同步历史问答对话内容,并支持语音输入,方便在现场的技术人员使用。

未来,四建集团建筑人工智能研究室将基于RLHF技术,根据用户使用反馈结果开展强化学习,进一步优化Construction-GPT模型性能,扩展Construction-GPT产品功能,为一线技术人员的项目管理工作提供有力支撑,推动四建集团乃至行业的数字化转型升级。