相关文章
论文阅读:2023 ICLR Safe RLHF: Safe Reinforcement Learning from Human Feedback
总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328
Safe RLHF: Safe Reinforcement Learning from Human Feedback 安全 RLHF:通过人类反馈进行安全强化学习
https://arxiv.org/pdf/2310.12773
https://github.com/PKU-Alignment/safe…
编程日记
2025/5/5 1:05:19
[密码学基础]国密算法深度解析:中国密码标准的自主化之路
国密算法深度解析:中国密码标准的自主化之路
国密算法(SM系列算法)是中国自主研发的密码技术标准体系,旨在打破国际密码技术垄断,保障国家信息安全。本文将从技术原理、应用场景和生态发展三个维度,全面解…
编程日记
2025/5/5 5:16:24
2025妈妈杯数学建模C题完整分析论文(共36页)(含模型建立、可运行代码、数据)
2025 年第十五届 MathorCup 数学建模C题完整分析论文
目录
摘 要
一、问题分析
二、问题重述
三、模型假设
四、 模型建立与求解
4.1问题1
4.1.1问题1思路分析
4.1.2问题1模型建立
4.1.3问题1代码(仅供参考)
4.1.4问题1求解结果(仅…
编程日记
2025/4/30 3:49:24
Transformer 架构 - 编码器 (Transformer Architecture - Encoder)
1.Transformer 编码器整体结构
Transformer 编码器的结构相对直观:它由 N 个完全相同的编码器层 (Encoder Layer) 堆叠而成。
图1: Transformer 编码器整体结构示意图 (简化)
输入序列(例如,通过 embedding 层转换后的词向量)首先会加上位置编码,然后传入第一个编码器层…
编程日记
2025/4/29 4:39:41
华为openEuler操作系统全解析:起源、特性与生态对比
华为openEuler操作系统全解析:起源、特性与生态对比 一、起源与发展历程
openEuler(欧拉操作系统)是华为于2019年开源的Linux发行版,其前身为华为内部研发的服务器操作系统EulerOS。EulerOS自2010年起逐步发展,支持华…
编程日记
2025/5/2 12:14:52
qwen 14B模型配置文件,层名称weight_map. 28GB
qwen 14B模型配置文件,层名称weight_map. 28GB 目录 qwen 14B模型配置文件,层名称weight_map. 28GBmetadata(元数据)weight_map(权重映射)lm_head.weightmodel.layersmlp.{proj_type}.weightpost_attention_layernormself_attn.{proj_type}.{bias_or_weight}model.norm.w…
编程日记
2025/5/5 0:45:56
PHP Zip 文件处理指南
PHP Zip 文件处理指南
引言
ZIP 文件格式是一种流行的数据压缩和归档格式,它允许用户将多个文件和文件夹压缩成一个单一的文件,便于存储和传输。PHP 作为一种广泛使用的服务器端脚本语言,提供了强大的ZIP文件处理功能。本文将详细介绍PHP中…
编程日记
2025/5/2 17:51:22
视频联网平台与AI识别技术在电力行业的创新应用
一、电力行业智能化转型的迫切需求
在能源革命与数字化转型的双重推动下,电力行业正面临着前所未有的智能化升级需求。随着特高压电网的大规模建设和新能源占比的不断提高,传统的电力运维管理模式已经难以满足现代电网安全、高效运行的要求。据统计&…
编程日记
2025/5/5 4:15:01