全局压缩-革命性的数据库技术

作者: rockeet 发表日期: 2017年03月08日分类: 未分类评论: 8 条阅读次数: 19,333 次

全局压缩-革命性的数据库技术

背景

作为数据库，在系统资源(cpu, 内存, ssd, 磁盘 …) 一定的前提下，我们希望：

存储的数据更多：采用压缩，这个世界上有各种各样的压缩算法……
访问的速度更快：更快的压缩(写)/解压(读) 算法，更大的缓存……

继续阅读 →

禁止窗口自动最大化

作者: rockeet 发表日期: 2016年07月10日分类: 未分类评论: 0 条阅读次数: 6,926 次

windows 和 linux 都不约而同地加入了 自动最大化 的功能：在拖动整个窗口或拖动resize 窗口到屏幕边缘时，会自动最大化。

我一向非常反感这种自作聪明越俎代庖把用户当傻逼的傻逼产品经理/程序员的傻逼行为。

所以，我要禁止这种傻逼功能：

windows10

设置 >> 系统 >> 多任务 >> 靠贴: 把选择框打叉

linux

gconftool-2 –set /apps/compiz-1/plugins/grid/screen0/options/top_edge_action –type int 0

MongoDB 的 terichdb schema

作者: rockeet 发表日期: 2015年12月15日分类: 未分类评论: 0 条阅读次数: 7,973 次

Mongodb 虽然是 schemaless (不需要 schema) 的文档数据库，但是，同一个表中的数据一般都有相同的结构，我们需要将这样的结构抽象出来，用以提高数据库的性能

terichdb 的数据有以下类型：继续阅读 →

在 Ubuntu 中禁止自动隐藏程序菜单

作者: rockeet 发表日期: 2015年12月09日分类: 未分类, 杂谈评论: 0 条阅读次数: 7,104 次

找了很多地方，最终的解决方案：继续阅读 →

自动机解压中的非递归算法

作者: rockeet 发表日期: 2015年02月14日分类: 未分类评论: 0 条阅读次数: 7,542 次

之前，自动机词典仅用来存储自然语言处理的语料、url、query 等单条数据很小的数据集，为了简单，解压算法用的是递归实现。前段时间对自动机进行了一个改进，可以压缩存储单条数据很大的数据集。于是，该发生的事情终于发生了：堆栈溢出，也叫爆栈！继续阅读 →

奇简软件名字的故事

作者: rockeet 发表日期: 2014年12月13日分类: 未分类评论: 0 条阅读次数: 7,214 次

奇简软件，“奇”字本身有“奇妙”、“奇特”，还有“非常”的意思，“简”字有“简单”、“简洁”，另外，还有“竹简”，也就是“书”、“知识”的意思，放在一起，有多重含义。

另外，“奇简”谐音“旗舰”，“那艘最顶级的船”就是圣经中的“诺亚方舟”了，英文名: Noah’s Ark ，可以简称 nark。继续阅读 →

奇简软件名字的故事

作者: rockeet 发表日期: 2014年11月23日分类: 未分类评论: 0 条阅读次数: 4,179 次

奇简软件，“奇简”谐音“旗舰”，“那艘最顶级的船”就是圣经中的“诺亚方舟”了，英文名: Noah’s Ark ，可以简称 nark。继续阅读 →

发现 gcc bug: error: non-static data member declared ‘auto’

作者: rockeet 发表日期: 2014年08月26日分类: 未分类评论: 0 条阅读次数: 7,037 次

在使用 C++14 的新特性改进 febird dataio 序列化库时(参见: febird 序列化与 C++14 的新特性)，发现了一个 gcc 的 bug，可以抽象出精简代码如下：继续阅读 →

C++ 实现容器时，写 iterator 很烦

作者: rockeet 发表日期: 2014年07月24日分类: 未分类评论: 0 条阅读次数: 5,300 次

实现一个 C++ 容器时，都要提供 iterator, const_iterator, 一般情况下 iterator 和 const_iterator 几乎完全一样，不一样的地方仅在于：继续阅读 →

使用自动机解决拼音输入法中的多音字组合爆炸

作者: rockeet 发表日期: 2014年03月30日分类: 未分类评论: 0 条阅读次数: 4,999 次

背景

为了保证输入效率，我们需要有一个从 词条拼音 到 词条汉字 的映射表，比如，拼音序列 ZiDongJi 对应的词条是 自动机 ， 自冻鸡 ；从而，逻辑上讲，这是一个 map<string,list<string> >。继续阅读 →