7月 | Terark & Topling 创始人雷鹏

管道的境界

作者: rockeet 发表日期: 2009年07月28日分类: shell, 操作系统评论: 0 条阅读次数: 3,549 次

一直在想：如何在 Hadoop.MapReduce 中，插入一个 C 写的 HashFunction，既要高效，又要接口简洁。通过命令行实现调用显然是不行的。刚刚终于想出了：使用管道！

一个非常简单的程序，从stdin读入，写到stdout。多简单！至于效率，管道嘛，本质上就是异步的，自然是buffered&asynchronous 模式。

hash 程序

#include <stdio.h>
int hash(const char* key)
{
   int h = 234234;
   for (; *key; ++key)
      h = h << 3 ^ *key;
   return h;
}
int main(int argc, char*[] argv)
{
    char buf[256];
    while (fgets(buf, sizeof(buf), stdin) != EOF)
    {
        printf("%d/n", hash(buf));
    }
    return 0;
}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

#include <stdio.h>

int hash(const char* key)

{

int h = 234234;

for (; *key; ++key)

h = h << 3 ^ *key;

return h;

}

int main(int argc, char*[] argv)

{

char buf[256];

while (fgets(buf, sizeof(buf), stdin) != EOF)

{

printf("%d/n", hash(buf));

}

return 0;

}

框架可以一边不断往管道写key，一边从中读取结果，这两个工作完全可以是异步的。对hash程序来说，如果stdin/stdout是全缓冲的，就几乎没有io的开销，因为几百几千次 fgets/printf 才会导致一次系统调用。

对frame程序也是一样的。

在 hadoop.streaming 中，hash 函数目前还必须由 java 类指定，如果使用这种方式，那就更 unix 了。

fuck淘宝，fuck原叶绿茶

作者: rockeet 发表日期: 2009年07月13日分类: 杂谈评论: 1 条阅读次数: 3,585 次

昨天，渴了，买了瓶原叶绿茶，准备扣上盖子扔瓶子时，发现上面说：

N2KOKC5ND9L 十元淘宝券兑奖09/11/30止口

跑到淘宝上看，找不着哪兑奖，后来终于发现：

http://pro.taobao.com/yuanye/yuanye_index.htm

输入号码，点击“适用10元抵价券商品区”结果是一大堆给我都不要的东西。

我不殚以最坏的恶意来揣摩这些fuckee，可是，这些fuckee却如此侮辱我的智商。而且还是如此公开、如此明目张胆的侮辱。

侮辱了大家的智商，还要浪费大家的时间，浪费大家的精力。如果买了它的东西，在你被侮辱的同时，人家还说：傻逼真乖，把钱给爷！

很基本也很诡异的fread

作者: rockeet 发表日期: 2009年07月03日分类: C++ 评论: 0 条阅读次数: 2,655 次

管道的境界

fuck淘宝，fuck原叶绿茶

很基本也很诡异的fread

近期文章

近期评论

文章归档

分类目录

功能