Categories

  • Android開発
    android marketで目指せ億万長者(ウソ)
  • cocos2d
    pythonでも使えるゲームフレームワーク
  • Google
    ここには未来を開くためのAPIがたくさん用意されている。
  • GoogleAppEngine
    どこまでもスケールアウトするクラウドサービス。使いこなすのが大変
  • Hack
    様々な電子機器を本来の用途とは別の用途に使ってみる。
  • iPhone開発
    app storeで目指せ億万長者(ウソ)
  • python
    LightWeightLanguageで一番難しいがLispにも通じるところがある面白い言語。
  • TIPS
    覚えておくともしかしたら役に立つかもしれないチョットしたこと。
  • うまくいきません
    やってみたけど、うまくいかなかった失敗記事
  • ネット世界
  • 夢見るソフトウェア
    こんなのいいな、できたらいいな、いつかつくろう
  • 開発環境
    開発するまえに環境を整えた記録、次に同じことをするためめの忘備録
無料ブログはココログ
My Photo

« オレのディスクを漁るのは誰だ | Main | Iphoneシミュレーターのフォトアルバムに画像がない »

August 02, 2010

ファイルから1行づつ取り出して、正規表現でマッチングして、書式をつけて出力する

ファイルから1行づつ取り出して、正規表現でマッチングして、書式をつけて出力する要件があった。
対象のマシンにperlが入ってなかったので、perl で 30秒ぐらいで済むことをpythonで3時間かかることになるとは。 結構、日本語処理にハマる。
 文字コードを指定してファイルを開く
 fin  = codecs.open('euc.txt', 'r', 'euc_jp')
 fout = codecs.open('sjis.txt', 'w', 'shift_jis')

行末の改行が邪魔だ。chompはないのか、いや、rstripがある。
  for l in fin:
    l=l.rstrip();

正規表現でマッチングするときに文字列の前にuを付ける
 s.match(u'項目:')

先頭で文字コードを宣言して
# -*- coding: utf-8 -*-
ソースファイルはutf-8で保存する。

出力結果を画面で確認したので、ファイルにリダイレクトしようとするとエラーになる。 たぶん、自動フィルターの何かの設定がダメなんだろう。  ここでpythonの再インストールすると、今まで頑張ってきたのが無駄になるので、ファイルを開いて書き込んだ。

参考にしたページ  Pythonで日本語を使う

« オレのディスクを漁るのは誰だ | Main | Iphoneシミュレーターのフォトアルバムに画像がない »

python」カテゴリの記事

Comments

Post a comment

Comments are moderated, and will not appear on this weblog until the author has approved them.

(Not displayed with comment.)

TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/48058/49037116

Listed below are links to weblogs that reference ファイルから1行づつ取り出して、正規表現でマッチングして、書式をつけて出力する:

« オレのディスクを漁るのは誰だ | Main | Iphoneシミュレーターのフォトアルバムに画像がない »