0%

一直使用ZoC做阿里云ECS管理,方便好用。不过经常会License过期。
收集几个备用,之后过期可以来这里拿:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Part A: 55834/01027/59600
Part B: 43010

Part A: 11370/01027/29134
Part B: 51686

Part A: 61298/01028/48550
Part B: 00985

Part A: 51698/01027/34713
Part B: 00937

Part A: 50866/01027/47775
Part B: 57341

Part A: 53866/01028/18861
Part B: 45757

Part A: 03754/01029/23239
Part B: 50179

从长假回公司已经有一个月了,慢慢也进入到工作状态。
这次回来,还是有蛮多感触。看到晚几年进公司的同事,一步步承担更重的任务。深觉须时时努力,不断进步。方能担负得起自己所承担的任务。
今年运气欠佳,也希望努力可以带来更好的运气。

一直希望使用Markdown来写博客,无奈Wordpress对Markdown的原生支持太差。而且受不了Wordpress程序执行的龟速。

因此趁着国庆把博客程序作了更换成了Hexo,托管网站也换成了Github。

简单说明一下转移作了哪些事情:

  • 申请Github Pages 并绑定域名
  • 安装Hexo,并下载相应所需插件。没想到有Wordpress转Hexo插件,真是帮了大忙
  • 把之前上传在网站空间的图片,全部下载并转存到七牛云存储上(这里有点小技巧,用Notepad++的正则表达式查找替换,节省时间,事半功倍)
  • 使用NeXT主题,自带很多需要的功能,包括可以显示属性公式的Mathjax,原Wordpress博客的数学公式,也并没有受到影响(当然也要做一些非常简单的文本替换,同样Notepad++搞定)
  • 因为博客是使用Hexo生成静态页面上传到Github Pages。特意申请了一个Github私有项目保存保存源码,方便多机编辑(这也是Hexo唯一的不方便,每个机子都要重新建环境)
  • 另外一些原博客需要的一些小修改,不表。
Read more »

回顾下操作系统概念:现代计算机往往都是“同时”运行多个任务。系统若只有一个处理器,那么给定时刻只可能有一个任务在执行。而操作系统通过进程管理和调度,切换正在执行的任务,是用户在感官上认为计算机是并行执行多个任务。当然,若是多处理器系统,真正同时执行的任务可以达到处理器的数目。

内核进行进程管理的主要解决的问题:

Read more »

刚刚给Mac更新了系统,发现多了一项功能,即修改屏幕主题色。有浅色和深色两种选择。深色的还蛮酷的。修改方法:

系统偏好设置->通用->外观

选择你喜欢的主题色即可

内存管理是Linux内核最为复杂且最为重要的部分,本文从原理及代码角度对Linux内存管理机制进行分析。

内存的划分

Linux将内存从大到小依次划分为Node(节点)->Zone(内存域)->Page(页):

  • 节点:在大型结算及系统中,内存有不同的簇,依据对处理器距离的不同,访问这些簇有不同的代价。而这些簇就可以成为节点。例:在PC系统中可以理解为实际挂载的物理内存;在嵌入式系统中,有两块内存芯片A和B,分别代表一个节点。
  • 内存域:内存域并不是物理存在的概念,是Linux系统对每个内存节点进行管理的单位,每个节点的内存域表示的是对该节点不同地址范围的划分。一般内存域有三种,分别为Normal、DMA和HighMem。
  • 页:在每个内存域中,内存被划分为大小固定的块(32位系统一般为4K大小),为内核进行内存分配的基本单位(当然内核内存管理机制其实更为复杂,“基本单位”不代表每次分配内存最小就要分到4K。后边可以看到,当需要获取小于4K大小的内存时,内核有Slab分配器来满足要求)
Read more »

为什么需要MTD子系统

嵌入式系统使用Flash作为存储设备,Flash类别有Nand、Nor等。Flash的上层是文件系统。直觉上,系统中使用这些Flash时,我们需要为每种Flash编写驱动。同时在调用Flash的文件系统做接口对接。这样,每使用一种新的Flash类型甚至型号,都得修改文件系统的编码来做适配。显然,这会造成代码的爆炸,同时也不方便大家各司其职(例如:厂商A做Flash,添加一个新的Flash需要厂商A的驱动开发人员去改写所有文件系统的接口,这显然不现实)。

Read more »

本文继续上一章对爬到的数据按照文章标题进行分析。

首先使用结巴分词对爬到的标题进行分词,得到分词过后的带空格的标题

1
2
3
4
5
6
7
8
9
10
11
import jieba
import jieba.analyse
import jieba.posseg as pseg #引入词性标注接口
import codecs,sys
items['split_title'} = ''

def split_titles(df):
strs = ' '.join(jieba.cut(df['lit_title'},cut_all=False))
return strs

items['split_title'} = items.apply(lambda r: split_titles(r), axis=1)
Read more »

词嵌入可以算是无监督机器学习最成功的应用之一。它不要求对数据标注,就可以从未标注预料里产生标注。单词嵌入可以从输入的字符产生量更小的向量标签,可以使得被使用到后续的其他学习任务中。

词嵌入的概念

简言之,词嵌入是指将文本转化为数字表示的方法。为什么需要词嵌入呢?

众所周知,许多机器学习算法,甚至几乎所有的深度学习算法,是无法直接处理字符串或者纯文本形式的输入。相反,他们需要数字作为各种任务的输入(例如分类、回归等)。不过,通常任务(例,网站评论中的情感分析)中大量的数据字段都是文本格式的,因此在需要学习前必须从这些文本输入中提取出数字表示的信息。因此,我们可以给词嵌入一个正式的定义:

Read more »