網(wǎng)友評分:
5.5分
水淼關鍵詞網(wǎng)址采集器是一款能夠根據(jù)特定的關鍵詞快速搜索百度、360、搜狗、谷歌并采集相應的網(wǎng)址的工具,它還能夠將搜索結果的網(wǎng)址和標題保存到電腦中。
關鍵詞網(wǎng)址采集器的功能就是幫助用戶挖掘長尾詞、采集外鏈、采集例子等,而且可以分析競爭。
#網(wǎng)址#:采集的原始網(wǎng)址
#標題#:網(wǎng)址對應的網(wǎng)頁標題
#域名#:原始網(wǎng)址的域名部分,如“http://test.shuimiao.net/123.htm”中的“test.shuimiao.net”
#頂級域名#:取原始網(wǎng)址的頂級域名部分,如“http://test.shuimiao.net/123.htm”中的“shuimiao.net”
#描述#:網(wǎng)頁標題下面的一段描述文字
為什么采集一段時間之后,無法采集?
這可能采集多了被搜索引擎限制,重啟軟件可繼續(xù)采集,如果不換,只能等待搜索引擎取消屏蔽之后才能繼續(xù)采集。百度的屏蔽時間通常半小時到數(shù)小時。
不過,現(xiàn)在即使出現(xiàn)驗證碼屏蔽,軟件也會彈出驗證碼手動輸入的(百度、谷歌)
不同批次關鍵詞采集的結果為什么會存在部分網(wǎng)址重復?
尤其是只引用了 #域名# 或 #頂級域名# 之后,這種部分網(wǎng)址重復的情況比較多。這也是正常的,因為每個網(wǎng)站的內頁可能包含很多主題,不同關鍵詞都可能采集到該網(wǎng)站的不同內頁,當引用域名后,相同網(wǎng)站的不同內頁的域名結果自然就相同了。
另外,軟件里的自動去重,是針對本次采集的結果內部進行去重,以前采集的結果是不在本次去重范圍的。如果兩次采集的結果存在部分網(wǎng)址重復,可以把他們合并一起,使用軟件去重(水淼·文本去重打亂器)。
為什么采集回來的網(wǎng)址的主題與關鍵詞不符?
是因為引用了 #域名# 或 #頂級域名# 后,取的是域名部分,域名打開的是該網(wǎng)站的首頁,而采集的原網(wǎng)址可能不是首頁,而是該網(wǎng)站的某一篇文章的內頁,該內頁包含關鍵詞主題,因此被搜索引擎收錄,軟件才能采集得到。但取域名后,你打開的域名首頁就不一定包含該關鍵詞。
為了比對采集是否正確,可以在保存模板里輸入:<a href="#網(wǎng)址#" target="_blank">#標題#</a>,保存為htm文件,采集完后可以自己打開該文件查看比對。
1.改造為支持OEM代理
2.增加必應和雅虎采集;多項改動
3.將必應、雅虎、谷歌改為https請求以避免一些情況下的采集失敗問題。
4.增加百度新聞采集。
5.一些更新。
6.增加關鍵詞分割線選項。
7.修復百度最新變動無法采集的問題。
8.修復必應改動采集失效問題;修復某些電腦不能使用xmlhttps的問題(涉及谷歌、必應、雅虎)。
標簽: 網(wǎng)址采集
關于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2025 virtualinsta360.com.All rights reserved.
浙ICP備2024132706號-1 浙公網(wǎng)安備33038102330474號