台灣最大程式設計社群網站
線上人數
1682
 
會員總數:246493
討論主題:190002
歡迎您免費加入會員
討論區列表 >> MS SQL >> [SQL]如何找出網友最想要的資料
[]  
[我要回覆]
1
回應主題 加入我的關注話題 檢舉此篇討論 將提問者加入個人黑名單
[SQL]如何找出網友最想要的資料
價值 : 0 QP  點閱數:2006 回應數:5
樓主

Benjamin
初學者
66 12
170 19
發送站內信

請問一下.當網友輸入他要搜尋的字串時.系統要如何將最照耀的資料show出來呢?
我的意思是說,像是Google等搜尋引擎,當我輸入字串時,他總是能將最重要的資料放在最前面.
有些搜尋資料的網站,甚至能能時show出重要性(以百分比顯示)

我想請問大家,不知道有沒有想過要如何做到這一點.
人工智慧要如何判斷資料的重要性,並且把重要資料show出來呢?

因為我的網站有提供科學新聞,隨著網站新聞量的增加,我需要一個有效率的搜尋機制,
請網友給我一個思考的方向好嗎?謝謝了...

=======================================================
我的網頁:科學網 http://scienceweb.biz/

本篇文章發表於2002-04-27 15:11
1樓
回應

cuculon
檢舉此回應
這個東西滿主觀的.建議進行方式如下:
1、請先分析出「重要性」的判斷依據.
2、再將這些條件予以「量化」
3、推導出判斷「公式」或「演算法」
4、將演算結果存入資料庫,再依序取出
本篇文章回覆於2002-04-27 21:39
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
2樓
作者回應

Benjamin
檢舉此回應
所以您的意思是說,我先制定一些規定,如網也愈搜尋的字串有出現在"關鍵字"內,就得10分,如果網友欲搜尋的子串有在內文中,則凡出現一次得1分...然後把每一篇文章的方數加起來,再以這個分數作為判斷文章重要性的依據.對嗎?

還有想請問,除了我剛剛提到的評分規則之外,還有什麼其他的評分規則嗎?
如有知道的網友,可以貢獻一下嗎?謝謝啦...
本篇文章回覆於2002-04-27 22:04
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
3樓
回應

葉子
檢舉此回應
這只是我個人的想法,沒實做過
應該是從兩個點著手
1.資料的權重
2.資料與keyword的mach程度

權重:
比較大的網站或是比較熱門的網站,權重就比較高
或者被點閱的次數很多,資料比較有參考性,權重也較高
權重越高,就放的越明顯的地方
像是點閱率,刊登日期之類的,都可以成為權重的依據
說的簡單一點,就是order by 啦

mach度:
這個在複合式查詢(找 "笨蛋 and 白痴 not 天才")時,比較明顯有效
需要對使用者輸入的關鍵字,做拆字分析

如果有字典庫
還可以做相似查詢~~

嗯~~
個人淺見
本篇文章回覆於2002-04-27 23:21
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
4樓
回應

FlowerHouse
檢舉此回應
It may not applying to your site, but here's the basic idea of Google's approach.
Each web page is weighted by the number of links that other similiar web pages
point to it.  Simply put, if all the pages of a certain topic have a link to 
this X page, this X page must be important. 
本篇文章回覆於2002-04-28 06:40
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
5樓
作者回應

Benjamin
檢舉此回應
謝謝大家,我有一點點概念了...
歸納一下,可以作為評斷標準的指標,可能有以下數點...
1.是否在關鍵字出現
2.是否在內文出現
3.是否在標題出現
4."網友總點選量" 除以 "從張貼以來到現在的時間"
5.網友的評分 (設計一個讓網友評分的選項,然後紀錄網友的評分)
6.郵寄次數
.........................等等


所以我想我可以朝上面的方向去做...
本篇文章回覆於2002-04-28 10:21
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
   
1

回覆
如要回應,請先登入.