信息网络安全 ›› 2025, Vol. 25 ›› Issue (7): 1163-1171.doi: 10.3969/j.issn.1671-1122.2025.07.014
收稿日期:2025-03-03
出版日期:2025-07-10
发布日期:2025-08-07
通讯作者:
肖文名
E-mail:xiaowm@cma.gov.cn
作者简介:酆薇(1970—),女,湖南,高级工程师,硕士,主要研究方向为网络安全、数据安全、人工智能|肖文名(1967—),男,江西,正高级工程师,硕士,主要研究方向为人工智能、气象大数据、气象数字基础设施、气象信息安全|田征(1984—),女,北京,高级工程师,硕士,主要研究方向为网络安全、安全运营、人工智能|梁中军(1983—),男,新疆,正高级工程师,博士,主要研究方向为气象大数据、数据安全|姜滨(1971—),男,北京,高级工程师,本科,主要研究方向为通信安全、气象大数据
基金资助:
FENG Wei, XIAO Wenming(
), TIAN Zheng, LIANG Zhongjun, JIANG Bin
Received:2025-03-03
Online:2025-07-10
Published:2025-08-07
Contact:
XIAO Wenming
E-mail:xiaowm@cma.gov.cn
摘要:
气象数据作为典型的时空大数据,在赋能经济社会发展的同时面临严峻的数据安全挑战。针对当前气象数据安全监测中存在的语义理解不足、数据特征识别准确率低和泛化能力差等问题,文章提出一种基于大语言模型的气象数据语义智能识别算法。该算法通过构建高质量的训练数据集和领域知识库,融合检索增强生成(RAG)与低秩适应(LoRA)轻量化模型技术,应用思维链(CoT)进行微调,选择近端策略优化(PPO)算法作为强化学习算法,持续优化气象数据识别大模型的识别性能。实验结果表明,文章所提算法能有效提高气象数据特征识别的准确率。
中图分类号:
酆薇, 肖文名, 田征, 梁中军, 姜滨. 基于大语言模型的气象数据语义智能识别算法研究[J]. 信息网络安全, 2025, 25(7): 1163-1171.
FENG Wei, XIAO Wenming, TIAN Zheng, LIANG Zhongjun, JIANG Bin. Research on Semantic Intelligent Recognition Algorithms for Meteorological Data Based on Large Language Models[J]. Netinfo Security, 2025, 25(7): 1163-1171.
| [1] | GB/T 40153-2021 Classification and Coding of Meteorological Data[S]. Beijing: Standards Press of China, 2021. |
| GB/T 40153-2021 气象资料分类与编码[S]. 北京: 中国标准出版社, 2021. | |
| [2] | XIAO Wenming. Intelligent Processing and Application of Meteorological Data[J]. Big Data Time, 2025(2): 6-8. |
| 肖文名. 气象数据的智能化处理与应用[J]. 大数据时代, 2025(2):6-8. | |
| [3] | ZHANG Qiang, YANG Heping, ZHANG Zhiqiang, et al. Management and Research on Scientific & Technological Achievements[J]. Research and Application of National Meteorological Science Data Sharing Service Platform, 2023, 18(10): 74-75. |
| 张强, 杨和平, 张志强, 等. 国家气象科学数据共享服务平台研发与应用[J]. 科技成果管理与研究, 2023, 18(10):74-75. | |
| [4] | XIAN Di, XU Zhe, LI Xue, et al. Meteorological Satellite Data Sharing Service and Application Platform[J]. Satellite Application, 2021(7): 39-46. |
| 咸迪, 徐喆, 李雪, 等. 气象卫星数据共享服务及其应用平台[J]. 卫星应用, 2021(7):39-46. | |
| [5] | ZHONG Lei, ZHANG Binwu, HE Henghong. Research and Application of Terminal Security Management System in CMA Network[J]. Computer Technology and Development, 2020, 30(1): 206-210. |
| 钟磊, 张斌武, 何恒宏. 终端安全管理系统在气象网络中的研究与应用[J]. 计算机技术与发展, 2020, 30(1):206-210. | |
| [6] | ZHONG Lei, TIAN Zheng, GUO Yuqing. Design and Realization of Terminal Network Access Control System in Meteorological Industry[J]. Computer Technology and Development, 2024, 34(1): 99-105. |
| 钟磊, 田征, 郭宇清. 气象部门终端入网控制系统的设计与实现[J]. 计算机技术与发展, 2024, 34(1):99-105. | |
| [7] | DENG Xin, TIAN Zheng, LI Nan, et al. Brief Analysis of the Practice and Application of Cybersecurity Situation Awareness Technology in Meteorological Networks[J]. Network Security Technology and Application, 2020(5): 139-140. |
| 邓鑫, 田征, 李楠, 等. 浅析网络安全态势感知技术在气象网络中的实践与应用[J]. 网络安全技术与应用, 2020(5):139-140. | |
| [8] | JIANG Shuyang, WU Ruitao, BAO Leilei. Research on Security Issues and Protection Strategies of Meteorological Data under Big Data[J]. Network Security Technology and Application, 2023(12): 109-111. |
| 姜淑杨, 吴锐涛, 鲍磊磊. 基于大数据下的气象数据安全问题及防护策略研究[J]. 网络安全技术与应用, 2023(12):109-111. | |
| [9] | PU Xiaohu, HE Qi, ZHONG Mei. Exploration and Practice of Meteorological Data Security Protection System Construction[J]. Cyber Security and Data Governance, 2025, 44(3): 59-62. |
| 蒲晓虎, 何奇, 钟美. 气象数据安全防护体系建设探索与实践[J]. 网络安全与数据治理, 2025, 44(3):59-62. | |
| [10] | WANG Jiye, ZHANG Shaobo, YE Runze, et al. Research on Automatic Classification Method of Transportation Industry Data Based on Deep Learning[J]. Applied Science and Technology, 2024, 51(2): 145-150. |
| 王继晔, 张少博, 叶润泽, 等. 基于深度学习的交通运输行业数据自动分级方法研究[J]. 应用科技, 2024, 51(2):145-150. | |
| [11] |
ZHANG Yingyi, ZHANG Chengzhi, ZHOU Yi, et al. ChatGPT-Based Scientific Paper Entity Recognition: Performance Measurement and Availability Research[J]. Data Analysis and Knowledge Discovery, 2023, 7(9): 12-24.
doi: 10.11925/infotech.2096-3467.2023.0474 |
|
张颖怡, 章成志, 周毅, 等. 基于ChatGPT的多视角学术论文实体识别:性能测评与可用性研究[J]. 数据分析与知识发现, 2023, 7(9):12-24.
doi: 10.11925/infotech.2096-3467.2023.0474 |
|
| [12] | SUN Weiwei, PAN Xianzhang, LIU Jie, et al. Comparative Study of Different Natural Language Processing Methods in the Information Extraction from Soil Environment Investigation Reports[J]. Research of Environmental Sciences, 2024, 37(3): 607-615. |
| 孙维维, 潘贤章, 刘杰, 等. 不同自然语言处理方法在土壤环境污染调查报告文本信息抽取中的对比研究[J]. 环境科学研究, 2024, 37(3):607-615. | |
| [13] | LAN Tianhong, CHEN Danfei, ZHENG Yuan, et al. Design of Chinese Semantic Recognition Algorithm Based on BERT Pre-Training and Hybrid Neural Network[J]. Electronic Design Engineering, 2024, 32(12): 91-95. |
| 蓝天虹, 陈丹霏, 郑源, 等. 基于BERT预训练与混合神经网络的中文语义识别算法设计[J]. 电子设计工程, 2024, 32(12):91-95. | |
| [14] | YAO Yuanjie, GONG Yiguang, LIU Jia, et al. Meteorological Knowledge Named Entity Recognition Based on Multi-Granularity Information Fusion[J]. Computer and Digital Engineering, 2023, 51(1): 186-193. |
| 姚元杰, 龚毅光, 刘佳, 等. 基于多粒度信息融合的气象知识命名实体识别[J]. 计算机与数字工程, 2023, 51(1):186-193. | |
| [15] | CUI Mengmeng, HUANG Ruibin, HU Zhichen, et al. Semantic Rule-Based Information Extraction for Meteor-Ological Reports[J]. International Journal of Machine Learning and Cybernetics, 2024, 15(1): 177-188. |
| [16] | ZHANG Yan, CUI Fang, XUE Zhi, et al. Research on Anomaly Detection Method for Meteorological Data Based on LSTM-TCN Neural Network[C]// IEEE. 2024 5th International Conference on Big Data & Artificial Intelligence & Software Engineering(ICBASE). New York: IEEE, 2024: 661-667. |
| [17] | QX/T 427-2018 Data Format for Surface Meteorological Observationgs- BUFR[S]. Beijing: China Meteorological Administration, 2018. |
| QX/T 427-2018 地面气象观测数据格式BUFR编码[S]. 北京: 中国气象局, 2018. | |
| [18] | QX/T 129-2011 File Naming for Meteorological Data Transmission[S]. Beijing: China Meteorological Administration, 2011. |
| QX/T 129-2011 气象数据传输文件命名[S]. 北京: 中国气象局, 2011. | |
| [19] | HU E J, SHEN Yelong, WALLIS P, et al. LoRA: Low-Rank Adaptation of Large Language Models[EB/OL]. (2021-06-17) [2025-03-01]. https://arxiv.org/abs/2106.09685. |
| [1] | 陈平, 骆明宇. 云边端内核竞态漏洞大模型分析方法研究[J]. 信息网络安全, 2025, 25(7): 1007-1020. |
| [2] | 张学旺, 卢荟, 谢昊飞. 基于节点中心性和大模型的漏洞检测数据增强方法[J]. 信息网络安全, 2025, 25(4): 550-563. |
| [3] | 顾欢欢, 李千目, 刘臻, 王方圆, 姜宇. 基于虚假演示的隐藏后门提示攻击方法研究[J]. 信息网络安全, 2025, 25(4): 619-629. |
| [4] | 解梦飞, 傅建明, 姚人懿. 基于LLM的多媒体原生库模糊测试研究[J]. 信息网络安全, 2025, 25(3): 403-414. |
| [5] | 秦中元, 王田田, 刘伟强, 张群芳. 大语言模型水印技术研究进展[J]. 信息网络安全, 2025, 25(2): 177-193. |
| [6] | 焦诗琴, 张贵杨, 李国旗. 一种聚焦于提示的大语言模型隐私评估和混淆方法[J]. 信息网络安全, 2024, 24(9): 1396-1408. |
| [7] | 陈昊然, 刘宇, 陈平. 基于大语言模型的内生安全异构体生成方法[J]. 信息网络安全, 2024, 24(8): 1231-1240. |
| [8] | 项慧, 薛鋆豪, 郝玲昕. 基于语言特征集成学习的大语言模型生成文本检测[J]. 信息网络安全, 2024, 24(7): 1098-1109. |
| [9] | 郭祥鑫, 林璟锵, 贾世杰, 李光正. 针对大语言模型生成的密码应用代码安全性分析[J]. 信息网络安全, 2024, 24(6): 917-925. |
| [10] | 张长琳, 仝鑫, 佟晖, 杨莹. 面向网络安全领域的大语言模型技术综述[J]. 信息网络安全, 2024, 24(5): 778-793. |
| [11] | 秦振凯, 徐铭朝, 蒋萍. 基于提示学习的案件知识图谱构建方法及应用研究[J]. 信息网络安全, 2024, 24(11): 1773-1782. |
| [12] | 李娇, 张玉清, 吴亚飚. 面向网络安全关系抽取的大语言模型数据增强方法[J]. 信息网络安全, 2024, 24(10): 1477-1483. |
| [13] | 王亚欣, 张健. 基于少样本命名实体识别技术的电子病历指纹特征提取[J]. 信息网络安全, 2024, 24(10): 1537-1543. |
| [14] | 马敏, 付钰, 黄凯. 云环境下基于秘密共享的安全外包主成分分析方案[J]. 信息网络安全, 2023, 23(4): 61-71. |
| [15] | 许盛伟, 邓烨, 刘昌赫, 谭莉. 一种基于国密算法的音视频选择性加密方案[J]. 信息网络安全, 2023, 23(11): 48-57. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||