百家姓128进制的权重和编码

当使用百家姓表达一个128进制的数据时,一个128进制的数字(值在0~127之间)需要用两个字节来表达,在128个百家姓中每个姓氏有GBK编码和UNI编码两种。
各姓氏的权重和编码如下:
权重    姓氏    GBK编码    UNI编码

127    赵    0xD5D4    0x758D
126    钱    0xC7AE    0xB194
125    孙    0xCBEF    0x595B
124    李    0xC0EE    0x4E67
123    周    0xD6DC    0x6854
122    吴    0xCEE2    0x3454
121    郑    0xD6A3    0xD190
120    王    0xCDF5    0x8B73
119    冯    0xB7EB    0xAF51
118    陈    0xB3C2    0x4896
117    褚    0xF1D2    0x1A89
116    卫    0xCEC0    0x6B53
115    蒋    0xBDAF    0x8B84
114    沈    0xC9F2    0x886C
113    韩    0xBAAB    0xE997
112    杨    0xD1EE    0x6867
111    朱    0xD6EC    0x3167
110    秦    0xC7D8    0xE679
109    尤    0xD3C8    0x245C
108    许    0xD0ED    0xB88B
107    何    0xBACE    0x554F
106    吕    0xC2C0    0x1554
105    施    0xCAA9    0xBD65
104    张    0xD5C5    0x205F
103    孔    0xBFD7    0x545B
102    曹    0xB2DC    0xF966
101    严    0xD1CF    0x254E
100    华    0xBBAA    0x4E53
099    金    0xBDF0    0xD191
098    魏    0xCEBA    0x4F9B
097    陶    0xCCD5    0x7696
096    姜    0xBDAA    0xDC59
095    戚    0xC6DD    0x1A62
094    谢    0xD0BB    0x228C
093    邹    0xD7DE    0xB990
092    喻    0xD3F7    0xBB55
091    柏    0xB0D8    0xCF67
090    水    0xCBAE    0x346C
089    窦    0xF1BC    0xA67A
088    章    0xD5C2    0xE07A
087    云    0xD4C6    0x914E
086    苏    0xCBD5    0xCF82
085    潘    0xC5CB    0x586F
084    葛    0xB8F0    0x5B84
083    奚    0xDEC9    0x5A59
082    范    0xB7B6    0x0383
081    彭    0xC5ED    0x6D5F
080    郎    0xC0C9    0xCE90
079    鲁    0xC2B3    0x819C
078    韦    0xCEA4    0xE697
077    昌    0xB2FD    0x0C66
076    马    0xC2ED    0x6C9A
075    苗    0xC3E7    0xD782
074    凤    0xB7EF    0xE451
073    花    0xBBA8    0xB182
072    方    0xB7BD    0xB965
071    俞    0xD3E1    0xDE4F
070    任    0xC8CE    0xFB4E
069    袁    0xD4AC    0x8188
068    柳    0xC1F8    0xF367
067    酆    0xDBBA    0x4691
066    鲍    0xB1AB    0x8D9C
065    史    0xCAB7    0xF253
064    唐    0xCCC6    0x1055
063    费    0xB7D1    0x398D
062    廉    0xC1AE    0xC95E
061    岑    0xE1AF    0x915C
060    薛    0xD1A6    0x9B85
059    雷    0xC0D7    0xF796
058    贺    0xBAD8    0x3A8D
057    倪    0xC4DF    0x2A50
056    汤    0xCCC0    0x646C
055    滕    0xEBF8    0xD56E
054    殷    0xD2F3    0xB76B
053    罗    0xC2DE    0x577F
052    毕    0xB1CF    0xD56B
051    郝    0xBAC2    0xDD90
050    邬    0xDAF9    0xAC90
049    安    0xB0B2    0x895B
048    常    0xB3A3    0x385E
047    乐    0xC0D6    0x504E
046    于    0xD3DA    0x8E4E
045    时    0xCAB1    0xF665
044    傅    0xB8B5    0x8550
043    皮    0xC6A4    0xAE76
042    卞    0xB1E5    0x5E53
041    齐    0xC6EB    0x509F
040    康    0xBFB5    0xB75E
039    伍    0xCEE9    0x0D4F
038    余    0xD3E0    0x594F
037    元    0xD4AA    0x4351
036    卜    0xB2B7    0x5C53
035    顾    0xB9CB    0x7E98
034    孟    0xC3CF    0x5F5B
033    平    0xC6BD    0x735E
032    黄    0xBBC6    0xC49E
031    和    0xBACD    0x8C54
030    穆    0xC4C2    0x467A
029    萧    0xCFF4    0x2784
028    尹    0xD2FC    0x395C
027    姚    0xD2A6    0xDA59
026    邵    0xC9DB    0xB590
025    堪    0xBFB0    0x2A58
024    汪    0xCDF4    0x6A6C
023    祁    0xC6EE    0x4179
022    毛    0xC3AB    0xDB6B
021    禹    0xD3ED    0xB979
020    狄    0xB5D2    0xC472
019    米    0xC3D7    0x737C
018    贝    0xB1B4    0x1D8D
017    明    0xC3F7    0x0E66
016    臧    0xEAB0    0xE781
015    计    0xBCC6    0xA18B
014    伏    0xB7FC    0x0F4F
013    成    0xB3C9    0x1062
012    戴    0xB4F7    0x3462
011    谈    0xCCB8    0x088C
010    宋    0xCBCE    0x8B5B
009    茅    0xC3A9    0x0583
008    庞    0xC5D3    0x9E5E
007    熊    0xD0DC    0x8A71
006    纪    0xBCCD    0xAA7E
005    舒    0xCAE6    0x1282
004    屈    0xC7FC    0x485C
003    项    0xCFEE    0x7998
002    祝    0xD7A3    0x5D79
001    董    0xB6AD    0x6384
000    梁    0xC1BA    0x8168

建议采用GBK编码,其编码更集中在某个范围内,容易检查其合法性。

ViKi:字幕组无国界

当中国的字幕组们还是靠着“单集400元,网站上挂广告”的方式来继续支撑时,ViKi已经开始让自己变成“字幕组+视频网站”了。

Viki:字幕版的维基百科

ViKi公司CEO称其模式“独一无二”

文|CBN记者 邹曈 实习记者 施钰涵 特约撰稿 赵轶佳

这家网站页面上写着:“我们的社区提供超过157种语言版本的1.25亿部影视剧字幕,包括克林贡语。”

恐怕只有Sheldon会把克林贡语作为“追剧”的首选,但此外的156种语言却让这家“字幕组”网站一下子拥有了85%的市场—至少这是可能的。

“视频或者电影播放的巨大市场,的确有85%的市场不在好莱坞,也不是英语。”ViKi的联合创始人及CEO 拉兹米格·霍瓦吉米安(Razmig Hovaghimian)对《第一财经周刊》说:“抓住这个机遇的关键就是突破语言的障碍。”

10月20日,这家网站获得2000万美元风投。这是该公司的第二轮融资。除现有投资者外,新投资方包括英国BBC Worldwide和韩国的SK Planet。发布会上BBC数字领域执行副总裁Danial Heaf称,合作后将有包括《星级酒店》、《雾都孤儿》等30多个黄金时段电视剧的视频在ViKi上免费播放。

这并没有什么大不了的。这世界上的视频网站太多了,它们不光有风投,还都IPO了。

“风投看重我们的是这个商业模式,这是一种对于观众和内容提供商是双赢的模式。”拉兹米格说,“未来会改变视频播放的渠道。其实这个是内容提供商最在意的。我们ViKi证明了他们可以帮助提供商开拓市场,并真正盈利。”

ViKi的创意来自另一位创始人,36岁的韩国人文智元(Moon Ji-won)。当她在哈佛大学读研究生的时候,曾经通过为韩国电影翻译英文字幕来提高英语水平,在这个过程中产生了ViKi的构想。2007年,她和在斯坦福大学读MBA的丈夫胡昌城(Ho Chang-seong)以及拉兹米格一起,创办ViKi项目。

网站于2008年上线,最初名为ViiKii。后来改为字由Video和Wiki合成的词“ViKi”。

ViKi的模式是,先购入视频节目的版权,放置在网站上供用户翻译出各种语言的字幕—翻译者懂什么语言,就尽可翻译成什么语言。和传统的网络字幕组制作方式不同,ViKi开发了一套系统,让用户可以在网站上傻瓜式地对号入座填写字幕。在管理这部剧集的频道管理人锁定之前,他们可以随时观看视频,同时翻译,哪怕只是一两个单词。

这是一种协作式翻译制度,也大大提升了多种字幕语言之间的转换速度。ViKi上最热门的韩剧《恶作剧之吻》,被翻译成40种语言,其中一半是在视频上线后24个小时内完成。

“最初,我们投入了全部的积蓄,还借了外债。”拉兹米格说。2009年,他从NBC环球辞职,投入ViKi的工作,“去年10月第一轮投资,是我们自己找的。”

起初他们先找了三个:Joi Ito、Reid Hoffman(LinkedIn创建者)和Netscape的创始人Marc Andreessen。“我们找的不仅仅是会投资的人,更重要的是自己创建过公司的人。”创业初期,拉兹米格希望得到建议,“Joi Ito就给了我们很多指导。”那时候ViKi只有三个人:文智元,胡昌城和拉兹米格。

就在这段时间里,Neoteny Labs科技创投公司投资经理James Chan听说了ViKi。另外一家美国风投USV把ViKi介绍给了他—前者不熟悉亚洲的投资。

“根本没有谁说服谁,我们一开始就觉得其未来发展会很好,在内容提供和渠道上,ViKi都可以继续开拓。”James对《第一财经周刊》说,“在视频网站领域,ViKi还没有对手。”

那一次,ViKi就获得430万美元融资。除了James之外,还包括诸如Greylock Partners和Andreessen Horowitz等(两者都曾投资Facebook和Groupon)。James同样也参与今年10月的第二轮投资。ViKi告诉它们BBC和SK计划投资,作为现有持股者它们可以选择继续投资,“所以我们就投了”。“因为这3年ViKi的发展比较好,所以大家投得更多了。”James说。

这也正是BBC Worldwide插上一脚的缘由。本身是内容提供商的BBC希望借助ViKi这一打破语言障碍的平台,将自己的内容通过翻译,以不同的语言版本输送到更广泛的市场。

SK Planet是今年10月刚刚从韩国SK集团分离出的平台公司。同BBC一样,它希望全世界的人都能接受韩国电视剧。“我们非常渴望和ViKi合作,打造一个世界级的娱乐平台,”其执行副总裁Greg Park说,“对观众和内容提供商而言,ViKi是一个双赢的平台。”

从字幕的种类上来说,这还真是世界级的。

现在的ViKi社区有超过5万个小时的视频、1.5亿文字被制作并翻译成超过150种语言。一般1集有500位志愿者在同时翻译,每个词平均会被编辑5次。目前,中国比较大的字幕组“伊甸园”总共拥有差不多100个志愿者,1周7天翻译当天的4至5集美剧,差不多35至50部,覆盖美剧8成以上。一部剧加字幕、校对、时间轴大概5个人左右。

“志愿者有大学生、有教授、也有祖母辈的人……他们都是自发组织、自我激励的。志愿者会和‘知识共享’组织签订协议,确保字幕不被非法利用。他们不需要报酬,They are doing it just for fun。”拉兹米格说。

在ViKi的网站上,西班牙语、土耳其语、阿拉伯语……的《Startling By Each Step》,近期在新加坡视频网站ViKi上排名第3。是的,就是穿越迷们迷恋的那部《步步惊心》。长期位居点击量第1的是韩剧《花样男子》—有40多种语言版本,甚至还有波斯语版字幕。

韩剧《恶作剧之吻》就因为在ViKi上完成了40多种语言字幕的翻译,并通过在ViKi和Hulu上的播出,赢得了一大批来自欧美国家的新拥趸。“我们已经和ViKi合作过很多次了,”《恶作剧之吻》制作方Group 8的总裁Song Byung Joon说,“我很高兴看到通过此平台,我们的新老剧集在新市场为我们带来可观的新收入。”

ViKi为这些牢骚满腹的内容提供商们打开的是“另一扇窗”—开辟一个可以用本国语言收看视频的新市场,这是与现有观众并不冲突的受众群。“我觉得可以推广到所有的视频,不论长短,就是以后视频的渠道可以到达各个国家。”拉兹米格说。

但他似乎有点乐观得太早了。

这家拥有如此广泛志愿者的字幕组,目前的盈利模式却并不新鲜:和内容提供商分成新市场上的新收入;与此同时,通过与内容分销伙伴Hulu、Netflix的合作,ViKi还能从中抽成;最后,当然了,还有广告收入。

在《恶作剧之吻》热播之时,YouTube专门为此设立了一个连载频道,由ViKi在2天之内提供10种语言的字幕版本,形成一个由YouTube、ViKi和内容提供商Group 8组成的三方合作。但到目前为止,YouTube和ViKi还没有任何盈利上的分成。而且,对于ViKi而言,吸引广告商却并不那么容易。据专业流量统计网站Alexa的统计,截至11月14日,ViKi一周的平均流量排名仅为第4468位,而YouTube的排名是第3位。

“合作是技术上的合作。观众可以点击到源链接,增加了很多用户。”拉兹米格说,“我们会继续寻找内容提供商。明年开始会建设广告基础设施吸引广告商,比如技术支持、网页建设等。”

和其他所有视频网站一样。现在,ViKi已经拥有了自己的在苹果商店里的App,也正在和三星商讨在安卓系统平板电脑的应用。“未来我们的应用平台会更多,包括智能电视。”

目前与ViKi达成内容授权的媒体包括NBC环球、香港TVB电视台、韩国SBS电视台、日本富士电视台、俄罗斯Amedia频道。在中国,ViKi的全球内容合作伙伴是湖南卫视,《步步惊心》、《单身公主相亲记》正在赢得更多使用不同语言的新粉丝。

但是,这种“字幕组+视频网站”的模式将来如何更好地运作,对于拉兹米格来说,才是一个真正的问题—毕竟字幕组才是它真正拥有的啊!