购入VIA嵌入式主板一块

今天去了一趟五道口,购入了一块VIA的Mini-ITX主板。这一次CPU我选了带风扇的Nano,据说速度比C7大有提升,功耗小有提升。芯片组采用CN896,集成显卡和千兆以太网卡,支持DX9和MPEG解码加速。

早在几年前就曾经选择过无风扇的VIA C7作为个人服务器解决方案。同时启动了网关、VPN、FTP和HTTP服务。能在学校里作为上网的跳板,想用宿舍的网通宽带,另外PHP开发测试环境也不需要在自己电脑上专门部署了。可惜后来那块板子在一次电力故障中挂了,否则现在依然可以好好用着。

还没想好新买的这个板子该做何使用,现下考虑还是部署一套PHP环境,作为开发用服务器,另外的用途依然考虑让他作为文件服务器工作。但主系统应该是安装Windows XP的吧,毕竟如果在此机器上安装Ubuntu,就很难作为桌面系统使用了。

使用230上的配置方案也是一个思路:在虚拟机中安装Linux系统,然后根据需要选择,作为服务器使用的时候就启动Linux的虚拟机;作为桌面Internet Box用的时候,就关闭虚拟机。虚拟机软件也需要好好选择一下,VMWare是庞大而迅速的;Qemu不错,够小巧,但是似乎最近维护升级不多;VirtualBox倒是不错的选择,但是似乎速度不够理想。

咳,具体的情况还是等电源适配器买回来在考虑吧。

Continue Reading

中文分词太难

最近在做自动标签生成功能模块,需要统计文章中各个实词的出现频度,以自动筛选出合适的标签。这就需要中文分词技术支持了,毕竟中文语句不像英文,有空格做单词的分隔符。上网搜了一堆讲中文分词算法的文章,发现这个东西做起来确实十分复杂,要有效地解决这个问题,差不多可以写出10篇研究生论文。

中文分词有三大难题。第一是需要足够大的词库进行词语匹配,无法自动应对语言的发展;第二是中文句子断句方法众多,需要根据上下文语义选择消除歧义;第三是中文分词算法多半依赖中文词库,很难做出适合Javascript浏览器使用的实现。

Continue Reading

Rek.tw Search Helper

很多人喜欢百度搜索结果页上面那排导航链接,单击就可以用同一关键词搜索其他频道内容。但是百度之外就很难这么使用了。同事做了一个工具,把导航变成了百度、Google、维基都有的一排。发布在Rek.tw的首页上,大家可以试试看。

Continue Reading

自己写了一个PHP的ftp同步上传工具

以前使用Dreamweaver的自动站点同步功能很舒服,但是Dreamweaver对PHP的支持太差,只能高亮,不能自动完成,括号匹配和语法分析也很次。换编辑工具么,从zend studio用到NetBeans,居然没有一个拥有Dreamweaver那样强大的FTP上传功能。于是自己写了一个PHP脚本,完成FTP同步上传操作。此脚本支持单个文件上传、增量站点上传和全站点同步上传,可以和Editplus、KomodoEdit或者EmEditor之类支持外部命令工具的编辑器结合起来使用。

将此脚本共享给大家,GPLv3发布,大家可以自由修改传播,但须保留GPLv3协议。

简单介绍一下命令的各个选项

命令格式:ftpsync [选项参数] [标记] [文件]

选项后面直接跟着该选项的参数,具体说明:

-u, --user              指定FTP登录用户名,如果没有指定,使用匿名帐号
-h, --host 要连接的FTP主机名,如果没有指定,使用localhost
-o, --port FTP端口号,默认为21
-p, --pass FTP登录密码,如果没有指定,默认为abc@example.com
-c, --chdir 远程初始目录,登陆后同步前转入的目录,默认为/
-r, --root 本地初始目录,默认为当前工作目录
-f, --sync-file 指定单个文件名称(可以包含路径)

标记不带参数,具体说明:


-t, --active 使用主动模式
-i, --sync-incremental 增量同步模式(根据本地上传记录)
-a, --sync-whole-site 全站点同步模式

使用举例:

php -f ftpsync.php — -u testuser -p mypass1 -h 192.168.0.2 -c /wwwroot -f ~/index.php

猛击这里下载此脚本

Continue Reading

朝鲜放卫星

朝鲜声称卫星发射成功了,日、美、韩则坚持说朝鲜的导弹坠海。对于这种高科技,咱老百姓也说不上孰是孰非,只能等着各个新闻社出消息,然后看看。刚刚看到视频,朝鲜已经组织了10万群众庆祝卫星发射成功,朝鲜的新闻报道也以其特有的铿锵有力的语调谴责了日本。

Continue Reading