トップページ最近の動向

MPI問題

とても悲しい出来事が… まぁできたからいいか。

OSがRedhat Enterpriseの古いやつだったのでこれはちょっと古いだろうということで、CentOSにしたと。
作業機2台とノード10台構成だったので、とりあえず作業機だけ変えたらよいだろうと思うわけ。
これまで/homeが共有されていなかったのでそれは困ると、いろいろドライブを共有した。
ほー、これは快適。

次、MPICHをいれる。
コンパイルして、WRFもちゃんとコンパイルできて、さぁ走らせようとすると、
・途中で止まる。原因が不明。Logは残っているけどその意味が分からん。
・止まり方が適当。なぜここかが分からない。

にゃんだろう… と思っていたら、MPICHを投げる先のglibcのバージョンが、MPICHを作るのに使ったものと同じじゃないといけないらしい。
ということで、次はなんと、ノード10台に同じくCentOSを入れることに。
ぼちぼちやりつつ、やっとこさ終了。
rshもちゃんとできるし、もちろんデータドライブもシェアだ。
だけれども、症状は同じ…
ネットワークが切れてるのかなといろいろ試しても切れてない。
pingは通るし、NFSの書き込みテストをしてもちゃんと動いてますよ。

また調べたら、rshだとタイムアウトし、sshだとそうしないという記述を発見。やってみるも、変化なし!

仕方ないので、MPICH2をいれてやってみると… できましたよ。なんじゃそれ。
rshでも問題なし。そこそこ速い。


なんてことをしていたら、3日ぐらい経過していたのでした。いやぁしかし疲れますな。

トラックバック(0)

このブログ記事を参照しているブログ一覧: MPI問題

このブログ記事に対するトラックバックURL: http://www.so-nans.com/blog4/mt-tb.cgi/1554

コメントする

2009年2月

 1   2   3   4   5   6   7 
 
 8   9   10   11   12   13   14 
 
 15   16   17   18   19   20   21 
 
 22   23   24   25   26   27   28 
 

Norman, OK

Tokyo, Japan

アーカイブ