スクレイピングツールを作成してみた
2026.01.27

ホームページから情報を拾おうとしたときに
使う技術がスクレイピングですが、
一般的なPythonあたりでやると、BeautifulSoupが定番。
しかし意外とかゆいところに手が届かないことが多くて悩むことが多い。
一番の問題が速度問題。
htmlソースのリード時間の殆どは通信速度に依存するため、
この部分はどうしようもないとしても、
解析に時間が掛かるのは納得がいかない。
Delphiのみでやってみると、望むとおりの結果はだせるが、
速度がやはり物足りない。
最適解はなんだと検討した結果、
スクレイピングエンジンはC言語で作って、
抽出結果を多言語で取り扱うように決めた。
作成は結構手間取ったが思い通りのものができたので大変満足。
実行ファイル名は、scrape.exe
スクレイピングしたいURLをurl.txtに書いておく。(現状は1アドレスのみ)
抽出したい箇所のXpathをXpath.Txtへ(何レコードでも可能)
抽出結果はout.txtにCSVで吐き出される。
各ファイル名を変更したい場合はコマンドラインに-fオプションを指定すれば可能。
第1引数がUrlファイル名、第2引数がXpathファイル名、第3引数が出力ファイル名になる。
例としては、
Scrape.exe -f a.txt b.txt c.txt
抽出したデータの空白を取り除きたいときは -t オプションをつけるといい。
scrape.exeを立ち上げる時にメモリのロードに時間がとられるが、
それが煩わしい場合は、事前に起動してメモリに常駐するモードも用意した。
-w で事前に立ち上げて置き、
プログラムからパイプで接続するだけでいい。とても快適だ(;´Д`)
ただし、エラーが出たら毎回警告がでるのでは完全自動化にすることができないので
-q オプションでエラー表示をしないというものも付けた。
Javascriptで表示されるページの情報が欲しい場合、
動作は遅いが、-jで取りに行けるようにもしてある。
常駐モードは処理が速い。快適、快適。望む通りの速度が出ている。
単体でテキストファイル(CSV)が吐き出される形にしたので、
Excelで直接開くことも可能だ。もちろんAccessのデータベースに貯めることもできる。
応用の幅は広い。
スクレイピングの対象であるホームページが改変されたとしても、
Xpath.txtの内容を書き換えるだけでいいので、
プログラムのコードは一切いじる必要がない。
このツールができたことで、スクレイピングのプログラムを作るたびに
毎回似たようなコードを書く必要もなくなった。
ここ最近でもっとも効率化がすすんだ部分だと思う。
オムロン電子体温計 MC-1600W-HP 電池交換
2025.12.04

オムロン電子体温計はほとんどが電池交換できるのに、
なぜか高級モデルのMC-1600W-HPは電池交換が禁止になってます。

2015年モデルなので9年程で電池がなくなりました。
まぁ、9年も持てば十分と言えばそうなんですが、
電池がなくなったからと言ってゴミ箱にポイっていうのはエコじゃないので
電池交換のチャレンジだけでもやってみようかと。

オムロン系で電池交換できるタイプは
「OMRON」という文字が書かれてる部分の中に電池が格納されている場合が多い
この部分だけ外すことができれば何とかなるんじゃないかと。
まずは境界線が存在するのでそこを隠さないように
養生テープで保護します。

境界線の部分にカッターの刃をいれて何度も何度も根性で切り口を深くします。
感触は、接着剤のような気もしますが、柔らかいプラスチックな感じもします。
あまり力を入れると刃が折れるので軽めの力で何度も入れた方が無難。

上手く切り離しが成功しました。
どうやら接着剤ではなく、
重ね合わせによるロックだったようです。
これは切り離すしか方法無かったわけですね(;´Д`)
刃が赤いリード線に触れていたらしく断線を起こしています。
幸いとうか、この線はブザー用なので繋げなおすだけで問題なし。

裏返すとLR41が2個入っていました。一般的な電池で安堵。
電池がハンダ付けされてると思いきやソケットにはめるタイプ。
ここまでできててなぜ交換できる仕様にしなかったのだろう?(;´Д`)
早速交換。

切断してしまったリード線も繋げなおし、動作確認。
問題なく温度を測り始めました。ブザーも鳴ります。

キャップは接着したほうがいいのですが、
また交換するときに面倒なので、
何かいい方法が見つかるまでセロテープで固定(;´Д`)
きっと永遠にセロテープのままだな・・
この電子体温計の電池交換は、オムロンでは禁止しています。
防水性は当然失われますし、体温も正常に示さなくなる可能性があります。
これらによる不具合は自己責任なので、
マネする人はくれぐれもオムロンに迷惑をかけないようにお願いします。
JB64W ジムニー 5型 契約
2025.11.06

今乗っているJB23Wの数々の不調。
それに合わせてなのかタイミングよく11月4日に
ジムニーの5型が発売開始となりました。
いま注文すると1年以内という納期。
次の車検まで1年なので、ギリギリ間に合うかというこのタイミングで契約してきました。
ディーラーの営業に納期を聞くと1年と返ってきましたが
正直5型の納期はディーラーでも未知数とのことで
とりあえず1年と答えておくという定例句になっているようです。
もちろん早まる可能性はあるとのことでした。
まぁ、次の車検まで間に合えば文句はないですがね(;´Д`)
===========================================
※以下写真はスズキジムニーホームページからの引用です
今回の5型では先進的な装備が大きく変更になっています。
①先進安全装備の新機能追加
安全システム「デュアルセンサーブレーキサポートⅡ」を採用
これは最近発売されたノマドにも搭載されてない装備。
4速AT車にアダクティブクルーズコントロール(ACC)、後方誤発信抑制機能を標準装備
前後の完全停止までできる誤発進抑制機能を標準装備
(5速MT車にはアダクティブクルーズコントロール(ACC)をのみが採用)
他社の安全装備では先行車の発進を教えてくれる機能がありますが
赤信号から青信号の切り替わりまで教えてくれます。
車線逸脱に関する補助機能はいままで音やモニターの警告のみだったのが、
ハンドル制御も加わって振動でも知らせてくれるようになりました。

②バックカメラ付き9インチディスプレイオーディオを設定
このディスプレイオーディオからコネクテッドサービス「スズキコネクト」に対応しています。
これでスマホからエアコンの電源を入れたり、鍵のロックや車の現在位置確認等が可能に。
車両情報や、セーフティサポートの状況なども表示されるようで、
車両システムとの親和性も高いようです。
USBメモリの接続も可能で、音楽のみならず動画の再生も行えるとのこと。
USB接続端子はオプションで付けなくても付属するみたいです。
ただしHDMI接続端子には対応していないようです。
現在このディスプレイオーディオのみスズキコネクトに対応しているようで、
ほかのナビやカーオーディオを選択した場合はスズキコネクトには接続できません。

③メーターでは中央の液晶部分にカラーディスプレイを採用。
4型までは黒背景白文字のモノクロでした。
モーションやパワー/トルクなど、多彩な表示に対応。
スピードメーター下部にアナログ燃料計が追加されました。
一部の警告灯はスピードメーター部に移設となりました。
このことで4型までのメーターとは互換性がなくなりました。
④フロントバンパーとリアバンパーの形状が大きく変更になりました。
ACCの為にセンサーを大幅追加したため、
パーキングセンサーがリアに4基だけだったのがフロントにも4基追加され合計8基となりました。
センサー位置が重要なので、既存の社外バンパーは使用不能になったと思われます

⑤ルームランプがLEDに。
不評だったランプがついにLEDになりました。明るさ問題はこれで解決したかもしれません。
⑥追加及び、形状変更
・リアパーキングセンサーの大型化
・ATオイルパンガード追加
・エンジンオイルパンインシュレーター(ガード)追加
・トランスファーガード追加
・トランスファー用インシュレーターのサイズ大型化
・フロア下インシュレーターの形状変更
・フロントタイヤハウス内インシュレーター追加
・フロントバンパー下部に空気の流れを変える加工が追加
・ヘッドライトの内部改良により消費電力を軽減。
・給油口レバーの形状変更。
・ABSユニットの配管が金属から樹脂に変更。
・エンジン始動時のウエルカム音が音声に変更。
・ウインカー音の変更。
⑦価格も大幅変更。XCのATは+158,400円となりました。
マニュアルはATと値段共通になったことで+260,000円増加。
なぜマニュアルがこれだけ高いかは謎です。
1型のXC ATは1,841,400円だったので、約319,000円の値上げです。
次期はブレーキホールドが装着されることが予想できるので、さらに高くなるでしょう。
納期が確定する前にマイナーチェンジしないことを願います。
2026.01.27 01:59
|





