June 26, 2009
Plurk Backup
因為Derek的一噗,這兩天不誤正業的在研究作Plurk備份的方法。
Google Code裡找到了這個Unofficial API。花了很多時間在解決登入的問題,最後發現,使用者名稱輸入錯誤...。這之後,一切都簡單多了,因為從來沒學過PHP,因此也只能一邊修改一邊google。除了多花了一些時間在解決plurk server每次讀取條目的數量限制,其他都是在做一些美化的工作。
寫網頁程式的優點在於,結果很快就能看到,不像平常工作,compile到驗證,花的時間比在coding的時間長得多。
大致上先做了兩個功能,getrecent和getall。getrecent只會顯示最近大約二十個左右的噗。getall則會把全部通通抓出來,如果有輸入email的話,結果會寄到email信箱去。getall還有一些需要改進的地方:
1. 起迄時間:對於已經噗到進入Nirvana境界的人,getall可能會變得非常緩慢,簡單的解決方法就是提供起迄時間的設定,分段備份。 2. 美化輸出:現在的輸出結果美其名是,html檔,但是跟txt檔其實相去無幾。如果能配上自訂的CSS Stylesheet就更好了。
3. 網站結合:把這些功能鑲嵌到這個頁面。
4. 打包帶走:待我把code清理打包之後,只要有安裝PHP5以上的server都可以直接使用這些code。
如果上面這些缺陷都在忍受範圍,那麼歡迎試用。文章數太多的,或是對於在我這邊輸入密碼不放心的,那就等我把那些待辦事項完成了再說囉。
----- UPDATE 02 -----
起訖時間完成。
Latest Date:
從這天往前抓。
Earliest Date:
略過比此日期早的資料。因為每次抓取數量都固定,因此這個時間並不是硬性規定,有可能會抓比這個日期早一些的資料。當然,要讓輸出資料不超過此日期也是做得到,但是因為這個功能的主要目的是讓資料太多的使用者可以分段備份,因此多備份到幾筆重複的資料我想應該算是可以接受的吧。
UPDATE 01當中,便當狗的打包沒有包含這些更新。
----- UPDATE 01 -----
打包。- 下載完成後,把tgz檔放上有安裝PHP5以上的server。
- tar xzf backup.tgz
- getrecent.php 和 getall.php是上面提到的兩個功能。



