• 網路爬蟲工具

    Info Scrapy是一套Python框架,專門針對大型網路爬取作業而設計。Scrapy項目架構的控制器稱蜘蛛(spider),它們是獨立的爬行器,提供了一組指令允許開發人員重新使用他們的代碼,更容易地構建和擴展大型爬行作業,支援如具有逾期時間的快取、非同步HTTP請求、亂數指定User-Agent等功能。

    Keywords Scrapy、spider、python、http、xpath

    前往工具 Demo
  • 詮釋資料建議工具

    Info 開放資料統整平台提供以DCAT為基礎的詮釋資料一致化工具,將詮釋資料統一,因此可以與國際資料平台及符合國發會詮釋資料標準之資料平台進行串接,另外也可使用詮釋資料建議工具Linked Open Vocabularies來選懌可選用的詮釋資料標準。


    Keywords lov、okfn、vocabulary、ontology

    前往工具
  • W3C資料出版最佳實踐

    Info W3C於2017年所提出的網路資料出版最佳實踐,條列出35項有助於資料發布者和資料消費者之間的互動、加值的要點。最佳實踐以範本形式提供,方便資料出版者查找及使用,範本共分為七個部分:最佳實踐主題名稱及簡要描述、使用該最佳實踐的原因及可解決的問題、預期結果、可行的實作方式、測試方式、與最佳實踐使用案例的關連性、採用該最佳實踐可產生的好處。

    Keywords W3C、data publishing、best practice、http

    前往工具