在多年前的某次任务中,看到了别人使用提升树等算法,取得了比较好的效果。今日眼馋,特来学习提升方法,并记录于此。提升方法是一种统计学习方法。在分类问题中,通过改变训练样本的权重,学习多个分类器,将多个分类器进行线性组合,以提升分类的性能。
核密度聚类
发表于
更新于
本文字数: 4.8k 阅读时长 ≈ 4 分钟
本文字数: 4.8k 阅读时长 ≈ 4 分钟
当问题需要自动地确定聚类数目时,传统的KMeans等聚类方法不在适用。因此,使用“核概率密度估计”的思路自行设计了两种聚类方法。本文收录:
- 核是什么
- 核密度估计
- 基于核密度估计的两种聚类方法
- 代码实现
大学毕业的前夕
发表于
更新于
本文字数: 4.5k 阅读时长 ≈ 4 分钟
本文字数: 4.5k 阅读时长 ≈ 4 分钟
想来也快要大学毕业了,2016年唐县一中毕业,2020年某不太行大学毕业,四年了。
爬虫系列(三)——多进程爬虫
发表于
更新于
本文字数: 8k 阅读时长 ≈ 7 分钟
本文字数: 8k 阅读时长 ≈ 7 分钟
承接上文,实现多任务的方法一般有三种,今日来实现其中的一种:多进程爬虫。而剩余的多线程并发和协程暂时没时间搞了,一方面是要先学习下Python的yield和send如何使用,其次要准备毕设的中期答辩和被老师安排了去读源代码,日后会补上的。但仅仅是多进程,就将IO密集的任务从1153秒提升到了105秒,且极高的提升了资源利用率。
还有一点,本文的代码可能只适用于Next主题,但方法思路是通解,只要改改参数适应你的主题,代码同样能用。结果展示:本站热门
操作系统『一』:进程与线程
发表于
更新于
本文字数: 3.5k 阅读时长 ≈ 3 分钟
本文字数: 3.5k 阅读时长 ≈ 3 分钟
作为一个程序员,我发现我不会写多进程和多线程的程序,实在羞愧,在赶完毕业设计后准备开一个多线程编程的坑。本文是我这种小白从无到有的学习收获,内容较多,还请耐心观看。因疫情原因没在学校,手头没有一本靠谱的《操作系统》的书籍,大多东西为网上搜刮而来后整理,可能不严谨。今天有空了回来填坑。
修复双系统切换导致V2Ray无法使用的问题
发表于
更新于
本文字数: 877 阅读时长 ≈ 1 分钟
本文字数: 877 阅读时长 ≈ 1 分钟
在给系统安装Linux
后,也配置了V2Ray
。但发现了一个问题:
- 之前
windows
使用V2Ray
是没有任何问题的; Linux
使用V2Ray
也是没有任何问题的;- 但是,从
Linux
切换回windows
,windows
的V2Ray
就不能用了,得关机、重启、过一段时间才能用。
本文给出此类问题的修复方法。
一些不常见的进阶博客优化
发表于
更新于
本文字数: 2.6k 阅读时长 ≈ 2 分钟
本文字数: 2.6k 阅读时长 ≈ 2 分钟
首先,如果你是想来搭建博客的小白,那么这篇文章不适合你,这篇文章写的优化博客是一些进阶操作。常见的:文章字体、打赏按钮、图片加载、数学公式、音乐链接、不蒜子统计等等等等,网上一搜一大把的我都认为是常规设置,本文在详细描述。而本文收录的进阶优化有:
- 降低网页功耗
- 快速加载博客
此外,本次优化仅针对next
主题,但其他主题也可参考借鉴优化思路,只是操作方法不敢保证完全一致。