too late amatuar programmer

[python] python2.6で使用可能なpathモジュール

2010-08-15 by ebon | Lavel: 0 comment

気軽にstat情報を走査したり、ディレクトリを走査する乗り物スクリプトのような、
findコマンドライクに扱えるものが欲しいと思い、osモジュールやwalkモジュール関連の情報を漁っていたところ、pathモジュールなるものがあるということを以下から知った.


まさに目的として、上記記事で書かれている通りなので喜んで使おうとしたがリンク切れだった..
少し探してみたが、作者による最終更新は結構前であり、オリジナルは2.4までしか対応してないようだ.( The "path" module )

めげずに探したところ、やはり別の方が2.6対応版をGitに上げていた.

古典を読むことは、語学学習に特別な効果をもたらすのか

2010-08-10 by ebon | Lavel: 0 comment

多言語話者には、古典愛好家/古典語学習者の割合が非常に多い気がしている。
たまたま私が目にした人間・話がそうだった というように、
サンプルに偏りがあるのは重々考えられる。
ただ、その関連性を目にする頻度から、以下の点、

  • 古典を読む事が語学力を養うために有効な手段なんだろうか
  • 有効だとしたらどういった性質がそうさせるの

という点が気になっていたので、例を上げつつ少し考えてみたい.

あるいは、古典を読む事というより、”古典語の学習は語学力アップに効果的なのか”
という事が実質の疑問と言えるかもしれない.

ラテン語は、ロマンス諸語の元である言語なため、
他ロマンス諸語を学ぶのに有効というのはよく言われていることだが..

ひとまず以下に古典愛好家である多言語話者の例をあげる.

[python] lxmlをインストール: ソースから/Macportから.

2010-08-07 by ebon | Lavel: 0 comment

lxmlライブラリを,[RedHatにソースからインストール ,Mac10.5にMacportでインストール]した際のメモ.

そこそこ大きなXMLファイルをパースしたり編集したりしたかったので、
柔軟性と高速なパフォーマンスを備えるlxmlを使用することにした.

基本、以下を参考にさせていただき、はまることなくインストールできた.


自分の場合は、予想に反して特にエラーもなくできたが、
何らかエラーが発生する場合、(そしてエラーは頻発する模様だ)上記記事のコメント欄等含めて参考になるかもしれない.

以下手順でインストール.

[python] (比較的)安全にファイル内の文字列を(その場で)置換する

2010-08-03 by ebon | Lavel: 0 comment

ファイル内の文字列を(その場で)置換したいことは良くある.
単純にファイルを読み込み置換するだけですむなら良いが、やはりできるだけ安全に行いたい.

perlではよく適当に -i オプションを付けて済ませてしまっていたが、
それはどうやら常軌を逸した行いのようだ.
なので少しは誠意ある振る舞いが出来るよう、
(比較的)安全にファイル内の文字列を置換する方法を考え、コードを残しておく.

ほんとに最低限の事だと思うが、安全さを以下のポイントを抑える事で担保する.

ポイント:

  • 一時ファイルに書きだし、それをコピーすることで(その場での)書き込みを行う
  • try ~ finally で元ファイルのcloseは確実に行う

これらをまとめ、以下のコード のように置換を行う関数化しておく.

# -*- coding: utf-8  -*-

import os,re,sys
import tempfile
import shutil

def pat_replace(stext,rtext,file):
    """
    porpose : ファイル内の文字列を(その場で)置換する 
    usage   : pat_replace("置換前パターン","置換後文字列",'target-file') --> replaced file
              * stext は reパターンで渡す必要がある.
    """    
    tmpfd,tmpname = tempfile.mkstemp(dir='.')
    try:
        output_file   = os.fdopen(tmpfd, 'w')
        input_file = open(file)
    except IOError:
        print '"%s" cannot be opened.' % file
    else:
        for line in input_file:
            a = stext.sub(rtext, line)
            output_file.write(a)
    finally:
        output_file.close()
        input_file.close()

    shutil.copyfile(tmpname,file)
    os.remove(tmpname)

[python]「各条件を満たす最初の要素」★以外★を抽出する方法

2010-07-24 by ebon | Lavel: 0 comment

とあるものを書いていて、

"各条件を満たす最初の要素"★以外★を抽出する

という要件が出てきた.

分解し、各動作の組み合わせで、すぐ解決できそうなものではある.
が、その過程でけっこう頭を悩ましてしまったので、解決方針の考えをまとめておく.
思ったより悩んだ要因として、以下の事がある.

  • 条件は複数ある
  • 最初の要素★以外★を抽出したい の以外の部分

これらの解決法としてどう表現するか?を試行錯誤したログのような記事だと思っていただきたい.

やはり例がないと何がしたいのかも分からないので、簡単な例を用意する.
前段階として考えていくに辺り、★以外★の部分もひとまず邪魔だ、
その部分をまず除き、単純化した要件で考えてみる.

"各条件を満たす最初の要素"を抽出する

こちらの動作で考えてみたい.この動作であれば至ってシンプルかと.
例題を用意する.

例題:
リスト:[6,1,5,3,8,10,11]から、
5より小さい要素・8より大きい要素の、それぞれ条件を満たす最初の要素を取り出せ  

つまり期待する動作としては、以下の動作だ.

f [6,1,5,3,8,10,11] -> [1,10] (3,11は対象にならない)
まずすぐに思いつく方法として、以下のfilterなどでもよくあるやり方がある.

  • 条件を満たす最初の要素をリストから抽出する関数、find()関数を用意する
  • 各条件のリスト([p1,p2,...])を用意する
  • 探索対象のリスト(L)を引数としたfind関数へ、各条件を順次適用する

[python] リストから条件を満たす最初の要素を抽出する関数

2010-07-19 by ebon | Lavel: 0 comment

pythonを書いていたら、おもむろに、以下の動作をする関数が欲しくなった.
" リストから、条件を満たす最初の要素を抽出する "
haskellでいうところの,find()にあたる関数というとイメージしやすいだろうか.

単に、" 一致する最初の要素を抽出する " という要件であれば、.index()メソッドがある.
しかし、求めているものは、完全一致する要素の抽出ではなく、
条件を与え、それを満たす最初の要素を抽出する関数だ.

条件を与えるという点で、" filter的な振る舞いをしつつ、それの真になる最初の要素 "
というイメージになるかな.

buludinメソッドの中に特になさそうだったので、高階関数関連のモジュール,itertoolsを調べてみた.

takewhile():predicateが真である限りiterableから要素を返すイテレータ
dropwhile():predicateが真である限りは要素を無視し、その後は全ての要素を返すイテレータ

というhaskellおなじみの関数はあったが、find()に対応する関数はないようだ.

# 調べ不足でどこかにあるのかもしれない..ただ、それはそれで、後に見つけたときに、
自分のアプローチのダメな点が分かりやすくなるだろうから良しとしたい..

ということで、haskellでいうfind()にあたる関数をpythonで書いてみる.
まず参考に、動かしながら挙動を確認してみようと思い、
takewhileをそのままコピペしたら、

AttributeError: 'list' object has no attribute 'next'

というエラーが出てしまった..そもそも for の中でnext()は呼ばれているはずなので、
ここで,.next()を呼んでいる理由が分からない.
ひとまず流して、、dropwhileの方を参考にする.

[python] テーブルデータを扱う方法を考える

2010-07-12 by ebon | Lavel: 0 comment

unixやlinuxで作業していると、あるコマンドで得た、テーブルデータ式の出力結果を、
管理する良い方法がないか考えるシーンがたまにだが、ある.
e.g) df や mount の出力結果を管理したい時 etc..

pythonの学習を兼ねて、テーブルデータ形式の出力結果を扱う方法を考えてみる.
簡単な例を元に考える.
ファイルや、標準出力で何らか以下のようなデーブルデータ形式のデータを得たとする.

X Y Z
a 1 2
b 3 4
c 5 6

多次元リストにして扱う という方法が通常の?やり方だと思う.
その場合、リストに対して該当列を行番号で指定する方法か、awkのように行ごと処理する
というように、欲しいデータが得られるがやり方がやや気に入らない.
やはりここは、行×列 という形式で各項目を指定することで値を得るようにしたい.

そこで,このテーブル形式のデータについて、

hogehogeのfuga

というより自然な形でアクセスできるようにしたい.


そのためには、 多次元連想配列にしておくと良さそう.
# pythonでは連想配列はディクショナリという.(ハッシュの方が呼びやすいな..辞書と呼ぶものなんだか..)

Casey ReasとBen Fry の 新しいprocessing本

2010-07-03 by ebon | Lavel: 0 comment

Getting Started with Processing
Aruduinoを始めよう と同じくMake の出版だ.
内容はごく基本的な内容のよう.

それよりも、9月に出る予定の本に、期待が持てる.
Form+Code in Design, Art, and Architecture
http://formandcode.com/

コンピューテーショナル・アートの,コード付きサンプル集というコンセプトの本?
言語は特にprocessingという訳でなく、様々な言語によるサンプル集みたい.

上記、Form+Codeのコンピューテーショナルアプローチから連想され、
関連しそうなprocessing本という事で思い出したのが、以下の本.


Algorithms for Visual Design Using the Processing Language
純粋な建築家による,processingを使ったビジュアルデザイン解説本といった内容.
本自体の評判はあまりよろしくない様子.
titleから期待されるほどvisualdesignのアルゴリズムが多く載っている訳でく、
ごく基本的なグラフィッックサンプルが例にあるのみ という事が理由である.

ビジュアルデザインのアルゴリズム知りたい人 → ただのprocessing基本解説
purocessingを学びたい人 → 別に基本を学ぶなら他にいい入門書がある

という状況になっており、中途半端とは言える..
でもこの著者が、

アルゴリズミック・アーキテクチュア

の書き手であるということで印象が変わった.
最近になって著者が建築の人間だと知った...

pythonによる関数型プログラミング:参考情報

2010-06-28 by ebon | Lavel: 0 comment

解説系


Functional Programming HOWTO

魅力的なPython: Pythonでの関数プログラミング
2回,3回まである.

Functional programming with Python
map,filter,reduce,等基本的なfunctionalスタイル関数の解説.

Higher Order Perl (Python Style) TOC
あのperlの評価の高いHOPをpythonで。awesome!。。

perl版については、見た目は荘厳なものの、以外と、
・問題が身近・実用的で読みやすい
・sample codeが段階的に肉付けしていっているため,読みやすいいじりやすい
という点がある。
ろくに書けない状態で読みはじめた私でも、読み進めることができた.
(もちろん、全て読んだわけでなく,章によっては現状理解できない。
内容を消化出来てる訳では全くない・・)
でも楽しんで読めるだけでも嬉しい。
それのpython版!!

module系


itertools — 効率的なループ実行のためのイテレータ生成関数
functools — 高階関数と呼び出し可能オブジェクトの操作
標準module.

functional
functional : foldl, foldr, flipなど関数型プログラミングで主要な関数を集めたモジュール
haskell でいうprereudにあたる関数群のモジュールのよう.
C + python で書かれているものと pure python で書かれているものがある.
module:functool, にない関数がカバーされている?
このpureの方をreadingすれば、関数型pythonの基本が身につくかも.

読み物系


Lisp プログラマのための Python 入門

LispとPythonのビミョーな関係
Paul Graham氏が絡んでいるpython関連のエッセイがまとめられている.

Pythonの"関数型"の機能の起源

[reading log] Corders at work

2010-06-26 by ebon | Lavel: 0 comment

Coders at Workを読んだ.

著名なプログラマーによる著名なプログラマーへの,
プログラミングに関するインタビュー集といった内容.
実録!天才プログラマー が面白かったので、同系統で期待できると思い、購入。

インタビューアーは実 践Common Lispの著者,
答え手は,
Guy Steele(Schemeの共同開発者),
の主要設計者),
Peter Norvig(実 用 Common Lispの著者で現在G
Simon Peyton Jones(haskellの共同開発者,GHCoogleの研究者),
Dan Ingalls(smalltalkの設計者),
Donald Knuth,
他多数..
と誉れ高い方ばかりのようで名前だけでテンションが上がる.

インタビュー形式で、以下のような質問中心に話が進む.

  • 何からプログラミングを始めた?
  • どうやってプログラミングを学んだ?
  • 公式な教育を受けることは重要?
  • いいプログラマーの条件とは?
  • どの言語は優れていて、どの言語がひどいもの?
  • プログラミングスキルを延ばすために、他に必要なスキルは何?
  • コーディングするときのアプローチはトップダウン or ボトムアップ?
  • 他のプログラマーを協業するときの良い方法は?

etc... ここに挙げたのはあくまで一例で、他にも多種多様なプログラミングに関する質問.

勿論、あらかじめ用意している同じ質問を全ての人物にしている訳ではない.
それぞれの答え手に沿って会話が進むよう,準備に大きな労力を払っていると思われる濃さだ.

哲学的な事からツールの使い方まで、
多くのプログラマーが気になるであろう質問を次々と繰り出している.
同時にインタビューアーが優れたプログラマーであるためか、
答え手も能弁、本音が素直に出ているようで、非常に刺激的な会話が続いている.

一人分が、約40ページある.結構な量だと思う.
答えてのターンが、2ページ弱に渡っていることなどもある、
なかなか見られない量であり、ただのインタビュー/回答とは違う.
どんなレベルの方が読んでも参考になるような、考え方・方法論・哲学が詰まっていると思う.