sse4.2 的字符串操作指令

阅读更多关于《sse4.2 的字符串操作指令》

前段时间实现了基于 Succinct Data Structure 的自动机,这种自动机(内存)存储方式将状态转移的 label 单独存储起来,从而,查找 label 就是一个在 byte 数组中查找 byte 的操作,并且,绝大多数情况下,需要查找的这个 byte 数组都非常短(状态的平均转移(label)数一般情况下大约是 2 )。 继续阅读

wordpress 速度很慢的问题解决了

阅读更多关于《wordpress 速度很慢的问题解决了》

因为 googleapis.com 被墙奸了,把 wordpress 目录下面所有文件中的 googleapi 全部替换成 useso 就 OK 了

cygwin 中 dll 路径

阅读更多关于《cygwin 中 dll 路径》

cygwin 中 dll 路径不是用 LD_LIBRARY_PATH 指定,而是 PATH,坑爹!
更坑爹的是, cygwin 中的 ldd 如果找不到某个 dll,竟然不报错,直接不显示那个 dll 文件!cygcheck 找不到依赖的 dll 时倒是会报错。

使用 自动机 解决 拼音输入法 中的 多音字 组合爆炸

阅读更多关于《使用 自动机 解决 拼音输入法 中的 多音字 组合爆炸》

背景

为了保证输入效率,我们需要有一个从 词条拼音 到 词条汉字 的映射表,比如,拼音序列 ZiDongJi 对应的词条是 自动机 , 自冻鸡 ;从而,逻辑上讲,这是一个 map<string,list<string> >继续阅读

Koening Lookup

阅读更多关于《Koening Lookup》

也就是 C++ 函数名字的两阶段查找,模板实例化之前和实例化之后

C++每个类对象都有一个名字空间,而非类对象,比如 int, char, long, char*….,没有关联的名字空间。 继续阅读

搜索引擎关键字智能提示的一种实现(原网页的备份)

阅读更多关于《搜索引擎关键字智能提示的一种实现(原网页的备份)》

美团原网页:

http://tech.meituan.com/pinyin-suggest.html

对比我们的纠错算法,美团的这个算法正好是一个反面教材,它集中展现了互联网时代糙快猛的核心价值观,以下是它的原文备份:


问题背景

搜索关键字智能提示是一个搜索应用的标配,主要作用是避免用户输入错误的搜索词,并将用户引导到相应的关键词上,以提升用户搜索体验。 继续阅读

一个变态C/C++面试题的变态解法

阅读更多关于《一个变态C/C++面试题的变态解法》

这是源自某论坛的一个问题,原帖如下(#########分隔) 继续阅读

服务器超时管理问题

阅读更多关于《服务器超时管理问题》
  1. 有一个最多能处理N个客户连接的服务器,活跃的连接总是少数;
  2. 为了能够处理更多的连接,需要对每个连接都增加一个超时机制,当总连接数达到N时,某个连接一旦超时,有新的连接请求时,就把超时的关掉,并处理新连接; 继续阅读

使用 std::map 查找 IP 范围

阅读更多关于《使用 std::map 查找 IP 范围》

给定这样一个问题:

有一组从IP范围到地理位置信息的数据,不同地点的IP范围没有重叠,实现从单个IP地址查到相应的地理位置。 继续阅读

对数复杂度的聚集算法

阅读更多关于《对数复杂度的聚集算法》

SQL 有5个标准聚集函数:SUM, AVG, MIN, MAX, COUNT, 一般情况下,这几个函数的时间复杂度至少都是O(n), n是结果集的尺寸。然而,给定表:

继续阅读