相关文章
【字节跳动】数据挖掘面试题0013:怎么做男女二分类问题, 从抖音 app 提供的内容中。
文章大纲 🔍 一、问题定义与数据基础数据源及预处理:⚙️ 二、特征工程方案1. 文本特征2. 视觉特征3. 音频与行为特征4. 上下文特征🤖 三、模型选型与训练1. 基础模型对比2. 多模态融合模型3. 训练技巧📊 四、评估与优化策略1. 评估指标2. 典型问题优化3. 算法偏差控制�…
编程日记
2025/8/30 4:40:16
大模型的开发应用(十八):大模型量化:GPTQ 与 AWQ
大模型量化:GPTQ与AWQ0 前言1 GPTQ 的基础1.1 海森矩阵定义核心性质1.2 OBD(Optimal Brain Damage)算法原理1.3 OBS(Optimal Brain Surgeon)算法原理(1)基本原理与首次剪枝(2&#x…
编程日记
2025/8/17 7:44:18
「日拱一码」022 机器学习——数据划分
目录
基于单次随机划分的方法
普通单次随机划分(train_test_split)
分层单次随机划分(使用 train_test_split 的 stratify 参数)
基于多次随机划分的方法
普通多次随机划分(ShuffleSplit)
分层多次随机划分(StratifiedShuffleSplit…
编程日记
2025/8/30 8:51:57
【ARM嵌入式汇编基础】- 操作系统基础(二)
操作系统基础(二) 文章目录 操作系统基础(二)6、线程7、进程内存管理8、内存页9、内存保护10、匿名内存和内存映射内存11、内存映射文件和模块6、线程
程序首次启动时,会创建一个新进程,并为该程序分配一个线程。该初始线程负责初始化进程并最终调用程序中的主函数。多线…
编程日记
2025/8/30 4:43:41
Docker 高级管理 -- 容器通信技术与数据持久化
容器通信技术Docker容器的网络模式当项目大规模使用 Docker 时,容器通信的问题也就产生了。要解决容器通信问题,必须先了解很多关于网络的知识。Docker 的网络模式非常丰富,可以满足不同容器的通信要求,下表列出了这些网络模式的主…
编程日记
2025/8/30 8:54:30
【fitz+PIL】PDF图片文字颜色加深
文章目录0 引言1 解决思路及流程1.1 思路1.2 代码实现2 完整代码与效果3 总结0 引言
没错,这是连续剧。女友对上一篇【fitzOpenCV】去除PDF图片中的水印得到的去水印效果很满意,于是问我可不可以再帮她处理一下另一个PDF文件,我二话不说答应…
编程日记
2025/8/30 8:53:12
维基艺术图片: python + scrapy 爬取图片
1. 画图链接,请随意修改。
2. 项目地址:https://github.com/buxuele/wiki_art
一、 缘起:从一次“心动”到一场“革命”
这一切,都始于一次在社交媒体上的偶然邂逅。一张画,具体是什么已经不重要了,重要…
编程日记
2025/8/30 8:53:12
XSS(跨站脚本攻击)
基本概念XSS是一种将恶意脚本注入到其他用户浏览的网页中的攻击方式分类反射型非持久化攻击典型场景恶意URL:http://example.com/search?q<script>alert(1)</script>
当用户点击该链接时,服务器返回的页面中包含未转义的搜索词,…
编程日记
2025/8/30 8:53:12