BigLaw @ g0v === 希望各位會喜歡,也歡迎來貢獻與討論! http://biglaw.tw https://github.com/biglawtw/biglaw ![](http://i.imgur.com/2LYhsMJ.png) ![](http://i.imgur.com/zkjCurY.png) ![](http://i.imgur.com/sDdzGf5.png) ![](http://i.imgur.com/zkckOfO.png) ![](http://i.imgur.com/m9eSrOj.png) 我們是誰?為什麼做這個? --- - 沒有人,之前是北科大的學生 - 為了參加Open Data創新應用競賽,拿特優 - 這個服務叫做 BigLaw - 開放法律判決智慧檢索與分析應用 - 原本想商業化,但是人手不足乾脆開放 (? 法院的資料很難看又很難用! --- - 網站不友善 - 阻擋來源 (沒辦法好好分享) - 鎖IP、半夜伺服器會休息 (爬蟲器哭哭) - 搜尋條件超複雜 (先選法院再選類別日期等逼哩八啦) - 裁判書不友善 - 純文字 (沒有任何 metadata) - 硬斷行 (hard-wrap) - 格式凌亂 (段落、關鍵用詞可能不同) - 對齊用等寬字 (細明體只有 Windows 有) - 純文字圖表 (在不同螢幕寬度顯示會爆炸) - 市場壟斷 - 目前市場上有名的服務有:法源、植根、元照、裁判家 - 其實這些服務不是做的非常好 (每間各有優缺點),需要新的力量將這塊基礎建設做好 所以我們可以做什麼? --- - 做一個開放的服務 - 免費使用 - 方便分享與連結 - 大家一起做筆記 (法律麻瓜也看得懂) - 做一個開放的格式 - 很容易Parse - 開放API - 使加值更容易 BigLaw 做了什麼? --- - 一個搜尋框、一個搜尋框、一個搜尋框! - 簡易的排序與篩選 - 兩個圖表 - 回應式網站 (各種裝置都可以用) - 自動段落與目錄 - 結合 g0v **[法規亦毒氣](http://g0v.github.io/laweasyread-front/)** - 司法院裁判書查詢系統 爬蟲器 (使用暴力的 Tor) - 裁判書分析器 (基於 python 的超強力 regex 分析) BigLaw 目前資料範圍 --- - 資料筆數:33萬筆左右 (raw data 消失了...) - 資料年份:2013/1/1 ~ 2014/7/31 - 裁判書類型:刑事、民事(應該只有一點點) 以下開放討論! --- 隨便說都可以啦!!! ###### tags: `BigLaw`