2++で簡単ネットブラウジング(その4)

 
前回はプラグインを使ったRSSの取得方法を紹介しました。
しかしmemn0ckさんのWILLCOM NEWSなどはサーバにMTを設置しておられますので
プラグインは用意されていません。
でもちゃんと取得できます。
 
まずは前回同様、<local.brdの編集>で板を作ります。

板名 memn0ck.com - Blog
ホスト !rss
BBS memn0ck.com/blog/index.rdf


この画面では
board_url memn0ck.com/blog/index.rdf
plugin チェックなし
kanji 3:utf8

 
これで一応取得できるわけですが

なんだか本文以外の、ヘッダーやサイドカラムも表示されて
ものすごく見づらいですね。
ちゃんと本文のみを表示するには、切り取りポイントを設定する必要があります。
 
切り取りポイントは<start_event>から下に適切なことを入れてやればいいのですが
いったいどうやって探すのか?
ちょっと面倒ですが、母艦、つまりWindows機を使います。
まずは『2RSS』というソフトをダウンロード。
http://homepage3.nifty.com/UK-taniyama/
このサイトの
http://homepage3.nifty.com/UK-taniyama/tools/2rss.html

http://hpcgi3.nifty.com/UK-taniyama/access.cgi?tools/2rss.2.0.0.4.lzh
をダウンロードします。
 
※このソフトはあくまでWindows用(XP、Vistaで動作を確認)で
 WindowsMobile(もちろんアドエスを含む)では動作しません!

 
まず起動してみます。
いっぱい項目がありますが、必要なのはRSSのアドレスだけです。

RDF>というところに
http://memn0ck.com/blog/index.rdf
と入力します。
(「2++」では「http://」は不必要でしたが「2RSS」では必要です)
 
すると下にずらっとログがでてくるはずですので
ためしにひとつを選んで<download>を押してください。

ログは取得できたはずですが、ずいぶん文字化けしていると思います。
これは文字コードが違っているからです。
文字コードを変更するためには<kanji>で変更します。
どの文字コードが正しいかは、ひとつひとつやっていった方が手っ取り早いです。
<kanji>を変更したのち、<download>を押していって確認します。

すると「3:utf8」で正しく日本語が表示できたはずです。
 
が、まだ切り取りポイントが設定できていません。
<kanji>の横に<start>と<end>とありますが
ここをいじって切り取りポイントを設定できます。
その下にずらっとHTMLソースが表示されたと思いますので
これを見ながら切り取りポイントを探していくわけです。
 
一応説明を。
 
・0:null
特に設定しない場合はこれです。
 
・1:text
タグ以外のテキストを切り取りポイントに設定します。
毎回変わる(本文やタイトル)に設定してしまうと、うまく切り取れません。
 
・2:comment
タグの種類に「<!--」と「-->」で囲まれた、コメントタグというものがありますがそれで指定できます。
注意点として、もし「<!-- アドエス生活 -->」ならば、「-- アドエス生活 --」となります。
 
・3:start-tag
・4:end-tag

たとえば「<h1>」ならstart-tag、「</h1>」ならend-tagになります。
 
やり方としては
・本文の直前にある、タグ、もしくはテキストをスタートポイントに指定。
・本文の終わった直後にある、タグ、もしくはテキストをエンドポイントに指定。
これだけです。
 
が、タグというものは、本文前にも繰り返し使われているものが多く
探し出すのはかなり面倒です。
 
もう自分も面倒になってきたので、memn0ck.com - Blogの切り取りポイントの答えを書きます;;;
 
start 1:text Permalink
end 3:start-tag h3

 
これでもう一度<download>を押すと

完全ではありませんが、かなり切り取られて、すっきり読みやすくなったと思います。
あとはアドエスの「2++」でも同じ設定にしてやればいいわけです。


ずいぶんややこしい上に、ポイントを探すのはめんどくさいことこの上ない。
しかもHTMLのタグがわかっていない方は、正直ちんぷんかんぷんでしょう;;;
 
しかも中にはどうしてもうまく切り取れないブログも存在します。
特に難儀なのは、実ははてなダイアリーで、プラグインでもダメ
切り取りポイントを設定してもうまく切り取れないブログが結構あるのです。
これははてなダイアリーの設定のせいで、どうも日記モードにしていると
うまく切り取れないようです。
たとえばモバイル界の重鎮・伊藤浩一氏の「伊藤浩一のW-ZERO3応援団」などは
どうしてもエントリごとに切り出すことができません。
 
今回は母艦が必要、しかもHTMLがわかっている方向けと
かなり限定した説明になってしまいました。
自分も書いてて「これでうまく伝わるんだろうか」とどんどん不安になってきたり;;;
やってみたらそれほど難しいことではないんですが;;;;
お詫びといっちゃなんですけど、もしどうしても切り取りポイントがわからないブログがあれば
コメントをいただければお教えします。
ただしさっきもいったように、どうしてもうまく切り取れないブログや
「2++」で取得するのが困難なブログもありますので、その辺はご了承ください。
 
次回はニュースサイトの取得方法を。