python获取中文拼音首字母以进行检索

主要的原理是GBK汉字是按拼音顺序编码的。

源代码如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
#!/usr/bin/env python
# -*- encoding: utf-8 -*-

def multi_get_letter(str_input):
    if isinstance(str_input, unicode):
        unicode_str = str_input
    else:
        try:
            unicode_str = str_input.decode('utf8')
        except:
            try:
                unicode_str = str_input.decode('gbk')
            except:
                print 'unknown coding'
                return

    return_list = []
    for one_unicode in unicode_str:
        #print single_get_first(one_unicode)
        return_list.append(single_get_first(one_unicode))
    return "".join(return_list)    

def single_get_first(unicode1):
    str1 = unicode1.encode('gbk')
    try:        
        ord(str1)
        return str1
    except:
        asc = ord(str1[0]) * 256 + ord(str1[1]) - 65536
        if asc >= -20319 and asc <= -20284:
            return 'a'
        if asc >= -20283 and asc <= -19776:
            return 'b'
        if asc >= -19775 and asc <= -19219:
            return 'c'
        if asc >= -19218 and asc <= -18711:
            return 'd'
        if asc >= -18710 and asc <= -18527:
            return 'e'
        if asc >= -18526 and asc <= -18240:
            return 'f'
        if asc >= -18239 and asc <= -17923:
            return 'g'
        if asc >= -17922 and asc <= -17418:
            return 'h'
        if asc >= -17417 and asc <= -16475:
            return 'j'
        if asc >= -16474 and asc <= -16213:
            return 'k'
        if asc >= -16212 and asc <= -15641:
            return 'l'
        if asc >= -15640 and asc <= -15166:
            return 'm'
        if asc >= -15165 and asc <= -14923:
            return 'n'
        if asc >= -14922 and asc <= -14915:
            return 'o'
        if asc >= -14914 and asc <= -14631:
            return 'p'
        if asc >= -14630 and asc <= -14150:
            return 'q'
        if asc >= -14149 and asc <= -14091:
            return 'r'
        if asc >= -14090 and asc <= -13119:
            return 's'
        if asc >= -13118 and asc <= -12839:
            return 't'
        if asc >= -12838 and asc <= -12557:
            return 'w'
        if asc >= -12556 and asc <= -11848:
            return 'x'
        if asc >= -11847 and asc <= -11056:
            return 'y'
        if asc >= -11055 and asc <= -10247:
            return 'z'
        return ''

def printresult(str):
    print('中文: "%s" --> 首字母拼音: "%s"' % (str, multi_get_letter(str)))
    
if __name__ == '__main__':
    printresult('木哈哈')
    printresult('小李')
    printresult('大王')
    printresult('大d王m')

我的修改版本:

pygments.rb on heroku

如何在heroku中使用pygments.rb呢?在plugin/pygments_code.rb中添加:

1
2
require 'rubypython'
RubyPython.start(:python_exe => "python2.6")

xiami自动签到

有的时候需要在虾米上面下点音乐,但是积分经常不够- -||。虾米提供了签到的方式来获取红包

对于虾米自动签到,目前有两种方式:

  1. 虾米自动签到(喂食)系统, 该网站建立在GAE上,不用设置直接提交就可以帮你自动签到,但是每天只能满足1400个人(不知道现在有多少人使用该系统),对于该系统的介绍和限制,参见其blog
  2. 另外一种是通过python脚本加cron的方式来达到,但是需要python的Linux/Unix服务器,参见HuXuan

我将自动该自动签到脚本放到了dotcloud上面,以下是我的配置:

  1. ssh到dotcloud上:
1
dotcloud ssh