台灣最大的程式設計社群網站
線上人數
960
 
會員總數:355015
討論主題:190859
免費程式:2730
歡迎您免費加入會員
首頁 >> 程式下載 >> 程式資料檢視
程式資料
名稱 风越批量文本提取、网页采集器
類別 其他 使用者介面 應用程式
程式語言 C# 開發狀態 100% - 成熟
語系 簡體中文 難易度 難度一(初學者基礎語法)
原創者 liunu  原創者網址 http://www.sino8848.com
提供者 liunu 執行網址  
版權 共享 評分
(共有 0 人投票,總分 0)
我要評分 : 不好<- 1 2 3 4 5 -> 很好   這個程式不能有問題歐! 加入我的收藏夾!
說明
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。
支持从其它网站直接提取文本内容,生成所需数据库文件
支持UTF-8多种编码
可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。
可设置提取文件的间隔,避免下载网页过快,服务器不响应

提供多种查找、获取信息的方式:
提取文件中全部email邮件地址
提取文件中全部互联网址(无参数)
提取文件中全部互联网址(带参数)
提取HTML文件中body的文本内容
提取HTML文件中title与body的文本内容
提取HTML文件中textarea的文本内容
提取HTML网页的显示文本内容
提取DOC/RTF等文件中全部文本内容
并可自定义正则表达式获取信息
預覽畫面
目前尚無任何預覽畫面
檔案列表
檔名 : Fire_GetTxt.rar  下載數:525
檔案大小:11178632 Bytes  上傳時間:2011-02-22 17:44
下載此檔案
--
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。
支持从其它网站直接提取文本内容,生成所需数据库文件
網友回應  
如要發送訊息請先登入.
需要下载安装 .net framework 2.0框架 liunu [2011-02-22 17:49]
微软官方下载:
http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe