21/10/2006

資訊監測利器--Web Page Converter and Web Site Monitor

原本我是要尋找網頁更新檢查服務的。我的理想是,這樣的服務應該能讓我輸入想要監測的 URL,待該網站一有更新訊息時,就用 RSS/Atom 之類的 feed 形式,將網頁的更新內容自動 outline 出來。為什麼希望是 feed 形式呢?因為我已用慣了 Pageflakes 這樣的個人化入口網站,它嚴然成為我的情資中心,feeds 也自然成為我搜集各種情報的主要方法。

Part 1: Web Page to RSS Converter


後來我並沒有在這類服務中找到用的順手的,於是便將心念一轉,想說也許有人提供可將 webpage 轉成 RSS 的服務也說不定。就這樣,找到了一些不錯網頁轉換服務。包括:

其中當以 Feed43.com 最具知名度。不過當我試著以 Feed43.com 為想要監視的網站建立 rss feed 時,它卻說無法解析我所輸入的樣式,要我再把 help 研究透澈一點。哎~ 我越來越不會 coding 了...

我再試試 Ponyfish。哇,這個讚,完全不用 coding 什麼 patterns, templates 之類的,反正就是輸入你所關注的 URL,然後再於你所想要轉成RSS feed 內容的連結上 click, click, click 就好了。底下有圖為證:

Ponyfish Webpage to RSS Converter



不過當然 Ponyfish 也不是什麼都好,免費的會員只能抓取連結的文字及 URL 導入 RSS。其他更進階的轉換功能,像是加上摘要什麼的,可是要付費會員才有的。

至於 RSSxl,使用界面看起來不怎麼討喜,每月還要換一次什麼 validation code 的,那就別了吧!

Part 2: Web Site / Web Page Monitor

回頭來談談原本想找的網站監視服務。其實這樣的服務或程式可大致分為兩類:「網站伺服器監視系統」及「網頁更新監視系統」。

站監視系統不時的探測某些主機位址,這些主機可能是 HTTP, SMTP 或 FTP 等伺服器。然後當異常狀況發生,像是無法連線時,於第一時間以 email, IM 或 pager 等方式通知使用者 (通常是網站管理員),好讓問題可以於第一時間排除。這類系統中我個人所知做的最出神入化的要算是 mon.itor.us 了。它不但提供了許多種型式的伺服器監測、各種效能報表、還讓你可以使用 email, IM(包括 MSN, ICQ, Gtalk 及 Yahoo!) 及 RSS 訂閱監測狀態。而最驚人的,它的使用界面與功能竟與 PageflakesNetvibes 一樣,本身就是個個人化的入口網站。

至於網頁更新監視系統,通常用來作為競爭對手的網站監控或是新聞網站的情報蒐集。TrackEngineWatchThatPage 要算是這類網站中比較優質的了。它們都提供了網頁版及 email 版的監視報告,但卻都沒有提供 RSS 訂閱功能。其實我們想想,每個網頁通常都會有固定的結構,當網頁變更時,只用透過簡單的演算法,就可完全自動的識別出不同的地方,甚至萃取出其中的連結與 摘要。這樣一來,要自動產生 RSS 也不是什麼難事 (甚至連 click, click, click 都不用)。多希望國內那些 Web 1.0 時代就做 information retrieval 的廠商腦筋轉一下,趕上 Web 2.0 的熱潮…