GNU/Linux |
CentOS 5.2 |
|
![]() |
perlko(1) |
![]() |
perlko − Perlê³¼ íêµì´ ì¸ì½ë©
Perlì ì¸ê³ì ì¤ì ê²ì íìí©ëë¤ !
Perlì 5.8.0íë¶í° ì ëì½ë/ISO 10646ì ëí ê´ë²ìí ì§ìì í©ëë¤. ì ëì½ë ì§ìì ì¼íì¼ë¡ íì¤ì¼ì ë¹ë¡¯í ì¸ê³ ê°êµìì ì ëì½ë ì´ì ì ì°ê³ ììê³ ì§ê¸ë ë리 ì°ì´ê³ ìë ìë§ì ì¸ì½ë©ì ì§ìí©ëë¤. ì ëì½ëë ì ì¸ê³ìì ì°ì´ë 모ë ì¸ì´ë¥¼ ìí í기 ì²´ê³ − ì ë½ì ë¼í´ ìíë²³, í¤ë¦´ ìíë²³, ê·¸ë¦¬ì¤ ìíë²³, ì¸ëì ëë¨ ìììì ë¸ë¼ë¯¸ ê³ì´ ì¤í¬ë¦½í¸, ìë 문ì, íë¸ë¦¬ 문ì, íì¤ì¼ì íì, íêµì´ì íê¸, ì¼ë³¸ì´ì ê°ë, ë¶ë¯¸ ì¸ëìì í기 ì²´ê³ ë±−를 ìì©íë ê²ì 목íë¡ íê³ ì기 ë문ì 기존ì ì°ì´ë ê° ì¸ì´ ë° êµê° ê·¸ë¦¬ê³ ì´ì ì²´ê³ì ê³ ì í 문ì ì§í©ê³¼ ì¸ì½ë©ì ì¸ ì ìë 모ë ê¸ìë ë¬¼ë¡ ì´ê³ 기존 문ì ì§í©ìì ì§ìíê³ ìì§ ìë ì주 ë§ì ê¸ì를 í¬í¨íê³ ììµëë¤.
Perlì ë´ë¶ì ì¼ë¡ ì ëì½ë를 문ì ííì ìí´ ì¬ì©í©ëë¤. ë³´ë¤ êµ¬ì²´ì ì¼ë¡ ë§íë©´ Perl ì¤í¬ë¦½í¸ ììì UTF−8 문ìì´ì ì¸ ì ìê³ , ê°ì¢ í¨ìì ì°ì°ì(ì를 ë¤ì´, ì ê·ì, index, substr)ê° ë°ì´í¸ ë¨ì ëì ì ëì½ë ê¸ì ë¨ìë¡ ëìí©ëë¤. (ë ìì¸í ê²ì perlunicode 매ë´ì¼ì ì°¸ê³ íììì¤.) ì ëì½ëê° ë리 ë³´ê¸ë기 ì ì ë리 ì°ì´ê³ ììê³ , ì¬ì í ë리 ì°ì´ê³ ìë ê°êµ/ê° ì¸ì´ë³ ì¸ì½ë©ì¼ë¡ ìì¶ë ¥ì íê³ ì´ë¤ ì¸ì½ë©ì¼ë¡ ë ë°ì´í°ì 문ì를 ë¤ë£¨ë ê²ì ë기 ìí´ ’Encode’ê° ì°ììµëë¤. 무ìë³´ë¤ ’Encode’를 ì¨ì ìë§ì ì¸ì½ë© ì¬ì´ì ë³íì ì½ê² í ì ììµëë¤.
’Encode’ë
ë¤ìê³¼
ê°ì
íêµì´
ì¸ì½ë©ì
ì§ìí©ëë¤.
euc-kr
US-ASCIIì KS X 1001ì ê°ì´ ì°ë ë©í°ë°ì´í¸ ì¸ì½ë© (íí ìì±íì´ë¼ê³ ë¶ë¦¼.) KS X 2901ê³¼ RFC 1557 ì°¸ê³ .
cp949
MS-Windows 9x/MEìì ì°ì´ë íì¥ ìì±í. euc-krì 8,822ìì íê¸ ìì ì ëí ê²ì. aliasë uhc, windows-949, x-windows-949, ks_c_5601-1987. 맨 ë§ì§ë§ ì´ë¦ì ì ì íì§ ìì ì´ë¦ì´ì§ë§, Microsoft ì íìì CP949ì ìë¯¸ë¡ ì°ì´ê³ ìì.
johab
KS X 1001:1998 ë¶ë¡ 3ìì ê·ì í ì¡°í©í. 문ì ë í¼í 리ë cp949ì ë§ì°¬ê°ì§ë¡ US-ASCIIì KS X 1001ì 8,822ìì íê¸ ìì ì ëí ê²ì. ì¸ì½ë© ë°©ìì ì í ë¤ë¦.
iso−2022−kr
RFC 1557ìì ê·ì í íêµì´ ì¸í°ë· ë©ì¼ êµíì© ì¸ì½ë©ì¼ë¡ US-ASCIIì KS X 1001ì ë í¼í ë¦¬ë¡ íë ì ìì euc-krê³¼ ê°ì§ë§ ì¸ì½ë© ë°©ìì´ ë¤ë¦. 1997-8ë ê²½ê¹ì§ ì°ìì¼ë ë ì´ì ë©ì¼ êµíì ì°ì´ì§ ìì.
ksc5601−raw
KS X 1001(KS C 5601)ì GL(ì¦, MSB를 0ì¼ë¡ í ê²½ì°) ì ëìì ëì ì¸ì½ë©. US-ASCIIì ê²°í©íì§ ìê³ ë¨ëì¼ë¡ ì°ì´ë ì¼ì X11 ë±ìì ê¸ê¼´ ì¸ì½ë© (ksc5601.1987-0. ’0’ì GLì ì미í¨.)ì¼ë¡ ì°ì´ë ê²ì ì ì¸íê³ ë ê±°ì ìì. KS C 5601ì 1997ë KS X 1001ë¡ ì´ë¦ì ë°ê¾¸ìì. 1998ëìë ë ê¸ì (ì ë¡í ë¶í¸ì ë±ë¡ ìí ë¶í¸)ê° ëí´ì¡ì.
ëª ê°ì§ ì¬ì© ìì 를 ìëì ë³´ìëë¤.
ì를 ë¤ì´, euc-kr ì¸ì½ë©ì¼ë¡ ë íì¼ì UTF−8ë¡ ë³ííë ¤ë©´ ë¤ìê³¼ ê°ì´ íë©´ ë©ëë¤.
perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8
ìë³íì ë¤ìê³¼ ê°ì´ í ì ììµëë¤.
perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr ì´ë° ë³íì ì¢ë í¸ë¦¬íê² í ì ìëë¡ Encode 모ëì ì¨ì ììíê² Perlë¡ë§ ì°ì¸ piconvê° Perlì ë¤ì´ ììµëë¤. ê·¸ ì´ë¦ìì ì ì ìë¯ì´ piconvë Unixì ìë iconv를 모ë¸ë¡ í ê²ìëë¤. ê·¸ ì¬ì©ë²ì ìëì ê°ìµëë¤. piconv -f euc-kr -t utf8 < file.euckr > file.utf8 piconv -f utf8 -t euc-kr < file.utf8 > file.euckr ë, ’PerlIO::encoding’ 모ëì ì¨ì íêµì´ ì¸ì½ë©ì ì°ë©´ì ê¸ì ë¨ì (ë°ì´í¸ ë¨ìê° ìëë¼) ì²ë¦¬ë¥¼ ì½ê² í ì ììµëë¤. #!/path/to/perl use encoding ’euc-kr’, STDIN => ’euc-kr’, STDOUT-> ’euc-kr’, STDERR=>’euc-kr’; print length("ê°ë"); # 2 (í° ë°ì´íë ê¸ì ë¨ì ì²ë¦¬ë¥¼ ì§ì) print length(’ê°ë’); # 4 (ìì ë°ì´íë ë°ì´í¸ ë¨ì ì²ë¦¬ë¥¼ ì§ì) print index("íê°, ëëê°", "ì¼"); # -1 (’ì¼’ì´ ìì) print index(’íê°, ëëê°’, ’ì¼’); # 7 (8ë²ì§¸ì 9ë²ì§¸ ë°ì´í¸ê° ’ì¼’ì ì½ëê°ê³¼ ì¼ì¹í¨.)
ë ìì¸í ìê³ ì¶ì¼ë©´...
Perlì ì¤ì¹íë©´ ëë¨í ìì¸í 문ìê° ê°ì´ ë°ë¼ ì¤ë©°, ì´ ë¬¸ì를 íµí´ Perl ì ë° ë¿ ìëë¼ ì ëì½ë ì§ì, Encodeì ì¬ì©ë² ë±ì ë§ì ê²ì ë°°ì¸ ì ììµëë¤. ìì§ ì´ ë¬¸ìë íì¬ ëª¨ë ìì´ë¡ ì°ì¬ ììµëë¤.
Perl ê´ë ¨ ìë£
ììì
ì¸ê¸í
문ì
ì¸ìë
ë¤ìê³¼
ê°ì
ìë£ê°
ììµëë¤.
ì´
목ë¡ì
ê²°ì½
ìì í
ê²ì´
ìëê³
ì¼ë¶
ëíì ì¸
ê²ë§
모ì
ê²ìëë¤.
<http://www.perl.com/>
O’Reillyì Perl ì¹ íì´ì§
<http://www.cpan.org/>
Comprehensive Perl Archive Network
<http://lists.perl.org/>
Perl ë©ì¼ë§ 리ì¤í¸. ë§ì 리ì¤í¸ ê°ì´ë° perl-unicodeìì ’Encode’ì ëí´ ë¼ìí¨.
Perlì
ë ê¹ê²
ê³µë¶íëë°
ëìì ì¤ ì
ìë íêµì´
ê´ë ¨
ì¬ì´í¸
<http://www.perl.or.kr/>
Perl íêµ ì¬ì©ì 모ì
<news:han.comp.lang.perl/>
íêµì´ Perl ë´ì¤ 그룹
<http://seoul.pm.org/>
Perl ë§ê±°ì¤ (ìì¸)
<http://www.perlmania.or.kr/>
Home for Korean Perlmanias
<http://www.oreilly.co.kr/perl/>
O’Reillyìì ëì¨ íêµì´ Perl ìì 목ë¡
<http://www.perlschool.net/>
Perl ê¸°ì´ ê°ì¢ ë° ìì¤, ìµê·¼ ëí¥, ê´ë ¨ í´ì¸ ì¬ì´í¸ ë§í¬
<http://www.perl.co.kr>
Perlì ê´ë ¨ë CGI, DB, ì°ë ë±ì ëí ì ë³´ ë° ë´ì¤ ì ê³µ
ì ëì½ë
ë° íêµì´
ì¸ì½ë©
ê´ë ¨
ìë£
<http://www.unicode.org/>
ì ëì½ë 컨ììì.
<http://std.dkuug.dk/JTC1/SC2/WG2>
기본ì ì¼ë¡ Unicodeì ê°ì ISO íì¤ì¸ ISO/IEC 10646 UCS (Universal Character Set)ì ë§ëë ISO/IEC JTC1/SC2/WG2ì ì¹ íì´ì§.
<http://jshin.net/faq/qa8.html>
íêµì´ 문ì ì§í© ë° ì¸ì½ë©ì ëí ìë´.
<http://www.cl.cam.ac.uk/~mgk25/unicode.html>
ì ëì¤/리ëì¤ìì ì ëì½ëì UTF-8 ì¬ì©ì ëí 문ëµì§(FAQ)
<http://kldp.org/Translations/html/UTF8−Unicode−KLDP/UTF8−Unicode−KLDP.html>
ì ëì¤/리ëì¤ìì ì ëì½ëì UTF-8 ì¬ì©ì ëí 문ëµì§(FAQ)ì íêµì´ ë²ì
Encode, Encode::KR, encoding, perluniintro, perlunicode
Jarkko Hietaniemi <jhi@iki.fi> ì ì ì <jshin@mailaps.org>
![]() |
perlko(1) | ![]() |