2006 年 12 月の日記

12/15 金、23:53 買ってあった漫画の続き

前回書いた以外にも、受験期間中に買った本が在りました。

更に、古本市場の袋 1 に入った儘なのが、

古本市場の袋 2 に入った儘なのが、

『一応確保しとこう』って意味合いのが多くありますね。

12/15 金、23:53 EUC-JP にしてみる

前回から、此の日記の紙面は EUC-JP 方式で符号化する様にしてみています。Shift_JIS よりは通信用として良いんじゃないかと云う事で。一応 ISO 2022 の定める所に収まってるんでしょ?

本当は UTF-16 にしたいけど、うちに有る版の Dreamweaver は扱えないみたいなので…。UTF-8 は日本語では重くなるから使う気無いし。

12/15 金、23:53 どんな風に文字列を符号化しようか

上で『Unicode が好い』とか書きましたけど、其れは今有る選択肢の中で選んだ場合です。Unicode は包摂基準がムチャクチャになってるみたいなので、実は余り好ましくはありません。

と云う訳で、どんな符号化方式が良いか、考えてみました。取り合えずダーラダラと書いておきます。


どんな機能が有ると良いか。

先づ、実際に使うならなるべく軽くしたくありますね。此れ迄に使われて来た方式より極端に重くなっては、個人の使用者には採用して貰えません。例えば、日本語の文書で仮名や漢字は 2 バイトを超えて欲しくありません。ラテン文字・ギリシャ文字・キリル文字などは其れ其れ 1 バイトであって欲しい物です。

処理が簡単になる様に、例えばアクセント記号付きのラテン文字には独立した符号を与えられると良いですね。でも、結合文字を使った表現と、2 種類の表現方法が在るのも困ります。

又、ユニバァサルに文字を扱える様にするなら、地球上の様々な言語の文字を幅広く収録するってだけだと足りません。様々な用途に応ぜられる様に[文字の区別の度合い]も幅広く取らないと。謂わゆる包摂基準の話ですね。用途に依って、中国の簡体字と日本の常用漢字との形を区別したい場合も在るし,しなくて宜い場合も在る。日本語の〈浅〉(横棒が 3 本)と中国語の〈浅〉(横棒が 2 本)、Unicode だと区別しないんですけど、私が此所で普通〈浅い〉って入力した時、此の横棒が 2 本である気は更々無いわけで、其れは普通の人は然うだろうて、やっぱり問題だと思います。結局使う側としては与えられた物を使うしかないんだから、『此れと此れは同じ字だからな』『此れと此れは区別するからな』とかって押し付けちゃいけないでしょう。

で、以下の様なのを考えました。


先づ、基本となるでっかい文字集合を作り、一文字当たり 24 ビットぐらいの符号を振ります。異体字として扱える文字は取り合えず全部包摂します。そして其の一文字の後ろに異体字を識別する符号を与えられる様にします。異体字を 6 万 5536 種類ぐらい取れる様にします。符号の長さはやはり 24 ビット。又、結合文字は全部分離します。濁点・半濁点も分離。

で、此の文字集合に基いて、各々の言語に最適化した符号化方式を定めます。英語用,日本語用,簡体字中国語用など、色々作ります。8 ビット単位の不定長で、符号は基本文字集合の異体字識別符号無しに対応しても宜いし,異体字識別符号付きに対応しても宜いとします。例えば、日本語の〈骨〉と云う字が、日本語用の符号化方式で[00A2 F059]であって、基本文字集合では[0000 30C2 F059]の異体字 0003 番だとすると、[00A2 F059]が[0000 30C2 F059 FFFF FFFF 0003]に対応すると定めます。異体字の関係であっても日本語で別字とされる事の多い文字は、独立した符号を与えて同じ文字の異体字に対応させられる様にもします。よく使う結合文字も個別の符号を与えて宜いでしょう。日本語なら〈が〉〈ぎ〉〈ぐ〉などは個別。〈a〉の鋭アクセント付きなども収録しても良いかも。

でも、日本語で滅多に使わないからと言って日本語版に収録されなかった文字・異体字が、全く使えないとしたら困ります。ちょっと符号は長めになっても、基本文字集合に収録された文字は一応全て使用できる様にします。為様は考えてませんけど。

以上の様にすると、日本で一般的に使われる字体が、短い符号で揺れないで示され、其れ以外の字体を使いたければ其れも使える様になります。基本文字集合が同一なので、[あっちの符号化方式だと包摂されてるけど此っちだと別扱い]と云う問題も起きません。


でも、日本語版と基本文字集合との対応を一文字づつ定めると、変換する処理が大変なので、日本語版に収録する漢字は基本文字集合の中でも一固まりにしたいですね。漢字を収録する版はみんな然うでしょう。と云う事で、次の様にして配列します。

先づ、日本・中国・台湾・韓国・北朝鮮・ベトナムなど漢字を使う国が、自分の地域の版に収録したい文字を其れ其れで選定します。既に使われてる文字集合を基にすると早くできますね。

終わったら其れを突き合わせて、[全ての地域で選ばれてる漢字],[日本以外で選ばれてる漢字],[中国以外で]…,[日本と中国以外で],[中国と台湾以外で]…,[日本のみで]、みたいに分類して行きます。例えば〈人〉は全ての地域で選ばれるでしょう。〈峠〉は日本だけかな?

で、其の分類毎に一纏めにして符号の表に配列します。然うすると、日本語版を作る際、[全ての地域で],[中国以外で],[台湾以外で]…,[中国と台湾以外で],[中国と韓国以外で]…,[中国と台湾と韓国以外で]…,[日本とベトナムで]…,[日本のみで]と云う固まり毎に対応を付けられるので、大分簡単になります。異体字識別符号は一々付けなきゃなりませんけど。

まあ此れでも結構沢山分割されちゃうので、韓国と北朝鮮は一つにしちゃって宜いかなとか、なるべく合併を考えながらやるのが良いと思います。


若しも為様を決めるならもっと厳密にやらないといけないけど、取り合えず方向性だけ。ゴチャゴチャだけど、日記だから許して。

12/17 日、+1:55 Osaka 14 px を勝手に修正

Mac OS のシステム標準書体は、伝統的に〈Osaka〉と云う名前のゴシック体です。輪郭活字の部分は謂わゆる普通の‘平成書体’ですが、画素活字が読み易く美しい事で一部で有名です。

確かに 9・10・12 px は非常に読み易くあります。が、14 px はどうも変なんですよ。仮名が。実際に下に載せます。〈ゎ〉を入れ忘れてるけど…。

只並べただけだと余り変には感じないかな。でも、小文字類が小さ過ぎるのはパッと見で判ると思います。他の字も、大きさが区々まちまちだったりで色々と変なんです。

12 px なんかは、日本語 Mac の歴史の中でちまちまと改良されて来た結果現在の綺麗な活字になったんですが、どうも 14 px は改良を経てないみたいです。前調べた時の記憶では。詰まり、初めて Osaka が開発された時の儘って事ですかね。

其んな訳で、好きな様に修正してみました。13〜16 日にちょいちょいやってみた物。

…どこが変わったのかよく判りませんな。小文字が適度に大きくなったのは判り易いけど。と云う事で、此の画像を突っつくと修正前後が切り替わる様にしました。ツンツンしてみて下さい。JavaScript 要るので宜ろしく。

でも、折角作っても、書体ファイルに埋め込んで使えないと意味無いよなぁ。と云う事で、誰か Osaka の該当部分を此れと入れ替えた書体ファイル作ってー。

あ、〈な〉は変更前のが良いわ。

12/17 日、+1:55 ヒラギノ角ゴシックも勝手に修正

ヒラギノ角ゴシックはかなり高品位のフォントで、Mac OS X に最初から入ってます。システム標準書体みたいな感じです。‘字游工房’って所が作ったんだそうな。

高品位なんです。高品位なんですけど、どうも一部の平仮名に変な癖が有って気に入らない。

〈い〉は 2 画目が下がり過ぎて、歪んで見えます。〈き〉などは尻尾が上に反り過ぎて不安定です。

と云う事で、此れも勝手に修正してみました。此れはついさっきの作業です。

ほら、癖が無くなった。かっけえ。此れも同様に、突っつくと切り替わります。

12/17 日、+1:55 14 px の外字

後、Osaka の 14 px を基にして外字を作って遊んだりもしました。此れは14 日にやりました。

12/17 日、+1:55 ミュンヘン・クリスマス市

而し此の日記ってホントに全然フツーの日記が出て来ませんね。よし、書くか。もう時間無いから少しだけ。

大通公園で毎年やってる‘ミュンヘン・クリスマスいち’に行って来ました。旨そうな物とか綺麗な飾り物とか売ってます。詳しくは公式サイト及び‘札幌市観光案内’内の紹介記事へ。

伯母が英語教室やってて、其のクリスマス会の様な物で振舞う為のお菓子類を買うので、ほぼ毎年行ってるんです。面白いので今回も蹤いて行きました。

10 時頃出て、札幌ターミナル行きのバスが来たので其れに乗る。地下鉄より安い(370 円)のでバス直通、但し 20 分程遅い。着いたらターミナル周辺の道の様相が変わってた。歩道橋が無かった。

最初の方で見た‘クリスマスカードコレクション 2006’がちょっと印象に残りました。北海道在住の‘クリエイター’(ほぼ非営利と見られる絵描きさん,含中学生)が描いた絵が葉書に印刷されてて、1 枚 158 円だったかな。何が印象に残ったって、直前に見たガラス細工のほのぼのとした感じから打って変わって、[コミケからはみ出して来た様な]絵が並んでたから。面白かったさ。うん。

でも、〈X’mas〉と書くのは日本での慣例と云う事で宜いとして、〈X‘mas〉はおかしいと思いました。

後は、モーツァルトの衣装のテディベアとか。掌サイズで手作り,腕と脚が可動。小 1500 円,大 2500 円だった。

後、売ってるのは旨そうな物と綺麗な飾りでした。

会場内放送は日本語・英語・韓国語・中国語の 4 言語でやってた。韓国語がやけに長くて,中国語はやけに短かった。期待していたのだがドイツ語は無かった。

昼なので物を食べました。蝦夷鹿のハンバーグと輪切り林檎と塩漬けキャベツの入ったハンバーガー 500 円,豚肉と豆の煮たの 300 円(?),林檎を揚げてシナモン・砂糖まぶしたの(‘りんごドーナツ’)300 円。あったかい部屋が設けられてたので、其の中に持ち込んで食べました。蝦夷鹿は油が少なくてさっぱりしてました。多分、増え過ぎてるってんで撃たれた野生の鹿なんだろうなぁ。旨かったよ、良かったね、鹿。豚肉はどうもパサついてた。うーん。‘りんごドーナツ’はおいしかった。

んで後は、伯母はココアをまぶしたアーモンド(旨い)とか,廃油から蝋燭を作るのに使う香りとかを買って、近くの‘ソニープラザ’と謂う外国の物を扱ってる店で又別のお菓子を買って、地下鉄とバスで帰りました。

以上。急いで書いたらやっぱり急いで書いた様な文章になりますね。

で、帰って来たら何か喉に違和感。嚔が出る。風邪引き掛けてる。どうしよう。早く寝なきゃ。

12/19 火、+1:47 云々

もう 12 月も下旬か。今年は余りサイトを弄れなかったなぁ。絵とか全然増えないし。頑張らなきゃ。

そしてもう午前 1 時か。何も書けないぞ。

12/19 火、+1:47 どうぶつの森の映画

明日(深夜 0 時で切るなら今日)の午前中に見に行く事にしました。講義が無いので。

すすきの駅を降りて、‘スガイ・シネプレックス札幌劇場’に行きます。10 時に開始です。平日の朝ならきっとお子様も少なく、比較的快適に視られるでしょう。

然て、どんな為上がりかな。公式サイトの記述は見れば見る程期待できなくなって来るけど、めげないぞ。

12/19 火、+1:47 小学校の漢字教育

思い返すと、小学校の先生ってあんまり学の無い人も居ました。以下の話は教員に依って違う物なのか、其れとも大体全国で似た様な物なのか分かりませんが、小学校の漢字の教え方は良くなかったと思います。

何がいけないって、[教える必要の有る事]以外教えないのね。積極的には触れないってだけならまだしも、常用漢字外は[無い物]扱いなんだもの。

例えば、〈作〉と云う字を習う時、此の旁の部分の〈乍〉と云う漢字は存在しない事にされたのを憶えています。然うじゃなくて、もっときっちり『〈乍〉と云う字も在るけれど、普段余り使わないので学校では教えない』って言って呉れた方が良いじゃないですか。興味を持った子が勝手に調べられる余地は残さないと駄目だし,特に興味の無い人であっても[〈乍〉と云う字は無い]って誤りを信じた儘大人になったら恥かきます。

他にも、現在の漢字教育は全体的に駄目ですけどね。現在ってさゆぬが小学生だった頃ですが。例えば[〈乍〉が〈サク〉と云う読みを持つから〈作〉も〈昨〉も〈サク〉と読む]とか教えるか気付かせるかしないと。

と言うか教える必要の有る事以外教えないのは漢字に限った事じゃなくて、例えば歴史の教科書も分量 3 倍ぐらいにした方が憶え易いでしょう。いや、3 倍の内容を全部憶えろってんじゃなくて、其の中の重要な事柄を憶える話。今の教科書って[全部憶えろ]じゃないですか。其れは、同じ大きさの直方体の積み木を一個一個縦に積んで行く様なもんです。ピラミッド型に積んだ方が安定するでしょ。要点だけが孤立した状態よりも、其の周辺までぼんやり知っておいた方が要点を憶え易いって事。面白いしね。教科書が無理なら副読本を然うしても良い。

12/19 火、+1:47 クリスマス市のサンタ

前回書き忘れてた。

食べ物を眺めてたら、赤く長いローブを着て長い杖を突いた人がゆっくりと歩いていました。然り気無く顔を覗き込んでみたんですが、フードで暗くなってる上に白い鬚を付けてるので遠目にはよく判らざりました。でも外人さんだと思う。相当背ぇ高かったし。

周りの人にちょっと手を振ったりしながら、杖をコツコツ言わせて歩いていると、一緒に写真を撮らせて貰う人がちょくちょく居る様でした。其れは宜いんですが、其れを遠くから眺めてると、サンタさんはスニーカーを履いている事に気付いてちょっとどうかと思いました。

而しあれは何だったんだろう。主催側の関係者じゃない様に見えた。だったのかな。

12/20 水、16:02 どうぶつの森の映画を視て来た

めげないでちゃんと行きましたよ。成り行き上、祖母も。

「お子様も少なく」って期待してましたが、其れ処か、我々以外には 2 名しか居なかりました。準貸し切り状態。後は女の子と其のお母さんの様でした。

で、肝心の作品に就いてです。なかなかでした。トントン拍子に話が進むので、のんびりしてる原作のどうぶつの森とは結構違った印象でした。

ネタバレを避ける為に細かくは触れませんが、村がしっかり[起伏の有る森の中]になってるのが良いなぁと思いました。原作をやってると『森って謂うか‘どうぶつの更地’じゃん?』とか思う事が有ったんですが、其れがゲームの表現としてだけあったと云う事が示された感じです。

斯う云った解釈の一例が、原作の監督の下で充分な品質を持って提供されるのは、良い事だと思います。確かに解釈の例は、商業の場でも個人の趣味の場でも、 4 コマ漫画などの形態で様々に創られています。けれど、やはり此所迄がっちりと世界観を拡張して、安定した‘どうぶつ村’の中にお話を展開させる様な作品には今迄出遇わざりました。やり方の一つの拠り所になると良いですね。


処で、受け付けの若い男性に券を渡した時、先着で呉れるって言う絵葉書を呉れなかったんですよ。席に着いてから其れに気付いて、携帯電話でウエブに繋いで『貰える』って事を確認して、終わった後に貰いに行きました。

さゆぬ「あの、どうぶつの森で、」

受け付けの女性「はい。」

さゆぬ「先着順にポストカードセットを頂けるって云うのは、もう終わっちゃいましたか?」

女性「え、いえ、やっていますよ。」

女性、隣の男性をちらりと見る。

男性「(女性に)あ、渡さなかった。」

女性「こちらです。」

女性、直ぐ手許に積んであった袋入りの絵葉書の山から、一袋取る。

女性「あ、お二人様ですね。」

さゆぬ「はい、二人です。」

女性、もう一袋取って、呉れる。

さゆぬ「ありがとうございます。」

女性「どうも失礼しました。」

以上、無駄に詳しく其の時の遣り取りを書こうと試みてみました。うーん、実際の会話って、文字に出来ない複数の仕草も並行しながらだから、記述するのは難しいんですね。

携帯電話って斯う云う時に便利ですね。此れが無いと自信を持って「ポストカードセット」って言葉を言えなかったし、其れ以前に、本当に貰えるのかの自信も無くて、貰うのを諦めて帰ってしまったかも知れない。

而し、ちゃんとやって下さいよ、男性。

12/28 木、21:29 冬休みの課題を確かめておく

冬休みは 1 月 4 日の木曜日迄になっています。でも 5 日の授業は全て休みになったので、8 日月曜の成人の日を越えて、実質は 9 日から再開します。

其れ迄に終わらせる必要の有る事を此所で確かめておきます。完全に自分の為の物なので、読んで下さっても別に面白くないです。

12/31 日、15:03 訂正

かなり早期に気付いてたんですが、[書きたい時は暇が無く,暇が有る時は忘れてる]って云う感じでずっと訂正できなかったのを、取り合えず今訂正します。

先づ、15 日の日記の‘どんな風に文字列を符号化しようか’で、16 進数表記の符号の例を書いてますが、全て桁数が 2 倍になってます。24 ビットと言い乍ら 48 ビットになってます。適当に読み替えて下さい。

其れと、此ちらは別に重要じゃない事。10 月 16 日の‘文書には符号化方式の情報を埋め込まねばならん’で謂う「JIS X 0208」は、ISO 2022-JP の事です。