Flashnux

GNU/Linux man pages

Livre :
Expressions régulières,
Syntaxe et mise en oeuvre :

ISBN : 978-2-7460-9712-4
EAN : 9782746097124
(Editions ENI)

GNU/Linux

CentOS 5.2

perlcn(1)


PERLCN

PERLCN

NAME
DESCRIPTION
SEE ALSO
AUTHORS

NAME

perlcn − ç®ä½ä¸æ Perl æå

DESCRIPTION

欢è¿æ¥å° Perl ç天å°!

ä» 5.8.0 çå¼å§, Perl å·å¤äºå®åç Unicode (ç»ä¸ç ) æ¯æ´, ä¹è¿å¸¦æ¯æ´äºè®¸å¤æä¸è¯- 系以å¤çç¼ç æ¹å¼; CJK (ä¸æ¥é©) 便æ¯å¶ä¸çä¸é¨ä»½. Unicode æ¯å½éæ§çæ å, è¯å¾æ¶µçä¸çä¸ææçå符: 西æ¹ä¸ç, ä¸æ¹ä¸ç, 以å两èé´çä¸å (å¸èæ, åå©äºæ, äºæ伯æ, å¸ä¼¯æ¥æ, å°åº¦æ, å°å°å®æ, çç). å®ä¹å®¹çº³äºå¤ç§ä½ä¸ç³»ç»ä¸å¹³å° (å¦ PC å麦éå¡).

Perl æ¬èº«ä»¥ Unicode è¿è¡æä½. è¿è¡¨ç¤º Perl åé¨çå- 符串æ°æ®å¯ç¨ Unicode 表示; Perl çå½å¼ä¸ç®ç¬¦ (ä¾å¦æ- £è§è¡¨ç¤ºå¼æ¯å¯¹) ä¹è½å¯¹ Unicode è¿è¡æä½. å¨è¾å¥åè¾åºæ¶, 为äºå¤ç以 Unicode ä¹åçç¼ç æ¹å¼åæ¾çæ°æ®, Perl æä¾äº Encode è¿ä¸ªæ¨¡å, å¯ä»¥è®©ä½ è½»æå°è¯»åååå¥æ§æçç¼ç æ°æ®.

Encode 延伸模åæ¯æ´ä¸åç®ä½ä¸æçç¼ç æ¹å¼ (’gb2312’ 表示 ’euc−cn’):

    euc-cn      Unix 延伸å符é, ä¹å°±æ¯ä¿ç§°çå½æ ç 
    gb2312-raw  æªç»å¤çç (ä½æ¯ç¹) GB2312 å符表
    gb12345     æªç»å¤ççä¸å½ç¨ç¹ä½ä¸æç¼ç 
    iso-ir-165  GB2312 + GB6345 + GB8565 + æ°å¢å符
    cp936       åç é¡µ 936, ä¹å¯ä»¥ç¨ ’GBK’ (æ©åå½æ ç ) ææ
    hz          7 æ¯ç¹é¸åºå¼ GB2312 ç¼ç 

举ä¾æ¥è¯´, å° EUC-CN ç¼ç çæ¡£æ¡è½¬æ Unicode, ç¥éé®å¥ä¸åæ令:

    perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8

Perl ä¹å&eacute;äº "piconv", ä¸æ¯å®å¨ä»¥ Perl åæ&ccedil;å- &ccedil;¬¦&egrave;½¬æ¢å·¥å·&ccedil;¨åº, &ccedil;¨æ³å¦ä¸:

    piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
    piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn

å¦å¤, å©&ccedil;¨ encoding 模å, ä½ å¯ä»¥&egrave;½»æååºä»¥å- &ccedil;¬¦ä¸ºåä½&ccedil;&ccedil;¨åº&ccedil; , å¦ä¸æ&ccedil;¤º:

    #!/usr/bin/env perl
    # å¯å¨ euc-cn å串&egrave;§£æ; æ å&egrave;¾åºå¥åæ å&eacute;&egrave;¯¯&eacute;½&egrave;®¾ä¸º euc-cn &ccedil;¼&ccedil; 
    use encoding ’euc-cn’, STDIN => ’euc-cn’, STDOUT => ’euc-cn’;
    print length("&eacute;ª&eacute;©¼");          #  2 (åå¼å·&egrave;¡¨&ccedil;¤ºå&ccedil;¬¦)
    print length(’&eacute;ª&eacute;©¼’);          #  4 (åå¼å·&egrave;¡¨&ccedil;¤ºå&egrave;)
    print index("&egrave;°&egrave;°æ&egrave;¯²", "&egrave;å¤"); # -1 (ä¸åå«æ¤åå&ccedil;¬¦ä¸²)
    print index(’&egrave;°&egrave;°æ&egrave;¯²’, ’&egrave;夒); #  1 (ä»&ccedil;¬¬äºä¸ªå&egrave;å¼å§)

å¨æåä¸åä¾å&eacute;, "&egrave;°" &ccedil;&ccedil;¬¬äºä¸ªå&egrave;ä¸ "&egrave;°" &ccedil;&ccedil;¬¬ä¸ä¸ªå&egrave;&ccedil;»åæ EUC-CN &ccedil; &ccedil; "&egrave;"; "&egrave;°" &ccedil;&ccedil;¬¬äºä¸ªå- &egrave;åä¸ "æ" &ccedil;&ccedil;¬¬ä¸ä¸ªå&egrave;&ccedil;»åæ "å¤". &egrave;¿&egrave;§£å³äºä»¥å EUC-CN &ccedil; æ¯å¯¹å¤&ccedil;ä¸å¸¸&egrave;§&ccedil;&eacute;®&eacute;¢.

&eacute;¢å¤&ccedil;ä¸æ&ccedil;¼&ccedil; 

å¦æ&eacute;&egrave;¦æ´å¤&ccedil;ä¸æ&ccedil;¼&ccedil; , å¯ä»¥ä» CPAN (<http://www.cpan.org/>) ä¸&egrave;½½ Encode::HanExtra 模å. å®&ccedil;®åæä¾ä¸å&ccedil;¼&ccedil; æ¹å¼:

    gb18030     æ©å&egrave;¿&ccedil;å½æ &ccedil; , åå«&ccedil;¹ä½ä¸æ

å¦å¤, Encode::HanConvert 模ååæä¾äº&ccedil;®&ccedil;¹&egrave;½¬æ¢&ccedil;¨&ccedil;两&ccedil;§&ccedil;¼&ccedil; :

    big5-simp   Big5 &ccedil;¹ä½ä¸æä¸ Unicode &ccedil;®ä½ä¸æäº&egrave;½¬
    gbk-trad    GBK &ccedil;®ä½ä¸æä¸ Unicode &ccedil;¹ä½ä¸æäº&egrave;½¬

&egrave;¥æ³å¨ GBK ä¸ Big5 ä¹&eacute;´äº&egrave;½¬, &egrave;¯·å&egrave;&egrave;¯¥æ¨¡åå&eacute;&ccedil; b2g.pl ä¸ g2b.pl 两æ¯&ccedil;¨åº, æå¨&ccedil;¨åºå使&ccedil;¨ä¸ååæ³:

    use Encode::HanConvert;
    $euc_cn = big5_to_gb($big5); # ä» Big5 &egrave;½¬ä¸º GBK
    $big5 = gb_to_big5($euc_cn); # ä» GBK &egrave;½¬ä¸º Big5

&egrave;¿ä¸æ¥&ccedil;ä¿¡æ¯

&egrave;¯·å&egrave; Perl å&eacute;&ccedil;大&eacute;&egrave;¯´ææ件 (ä¸å¹¸å¨æ¯&ccedil;¨&egrave;±æå&ccedil;), æ¥å¦ä¹ æ´å¤å³äº Perl &ccedil;&ccedil;¥&egrave;¯, 以å Unicode &ccedil;使&ccedil;¨æ¹å¼. ä¸&egrave;¿, å¤&eacute;¨&ccedil;&egrave;µæº&ccedil;¸å½ä¸°å¯:

æä¾ Perl &egrave;µæº&ccedil;&ccedil;½å
<http://www.perl.com/>

Perl &ccedil;&eacute;¦&eacute;¡µ (&ccedil;±æ¬§&egrave;±&ccedil;¤¼å¬å¸&ccedil;»´æ¤)

<http://www.cpan.org/>

Perl &ccedil;»¼åå¸&egrave;&ccedil;½ (Comprehensive Perl Archive Network)

<http://lists.perl.org/>

Perl &eacute;®&eacute;&egrave;®ºåä¸&egrave;§

å¦ä¹  Perl &ccedil;&ccedil;½å
<http://www.oreilly.com.cn/html/perl.html>

&ccedil;®ä½ä¸æ&ccedil;&ccedil;欧&egrave;±&ccedil;¤¼ Perl 书&egrave;

Perl 使&ccedil;¨&egrave;&eacute;ä¼
<http://www.pm.org/groups/asia.shtml#China>

ä¸å½ Perl æ¨å¹¿&ccedil;»ä¸&egrave;§

Unicode &ccedil;¸å³&ccedil;½å
<http://www.unicode.org/>

Unicode å¦æ¯å¦ä¼ (Unicode æ å&ccedil;å¶å®&egrave;)

<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>

Unix/Linux ä¸&ccedil; UTF−8 å Unicode &ccedil;客&eacute;®

SEE ALSO

Encode, Encode::CN, encoding, perluniintro, perlunicode

AUTHORS

Jarkko Hietaniemi <jhi@iki.fi>

Autrijus Tang (åå®æ±) <autrijus@autrijus.org>



perlcn(1)