分類頁
您當前的位置 : 首 頁 > 新聞資訊 > 行業新聞

熱門關鍵詞Keywords

聯系我們Contact Us

寧波匯隆文具有限公司

電 話:139 6838 5898

傳 真:86-0574-65803873

郵 編:315700

網 址:www.valfir.com

地 址:浙江省寧波市象山縣經濟開發區濱海工業園

風琴箱簡單介紹

2021-10-16

    向量空間實體模型(VectorSpaceModel):對文檔開展簡單化表明,在忽視特征項中間的基本信息后,一個文字就可以用一個特征空間向量來表明,也就是特征項室內空間中的一個點;而一個文字集能夠表述成一個引流矩陣,也就是特征項室內空間中的一些點的結合。

    ?相似性(Similarity):相似性Sim(D1,D2)用以衡量2個文檔D1和D2中間的主要內容有關水平。當文檔被表述為文檔室內空間的空間向量,就可以利用歐式距離,內積間距或余弦距離等空間向量相互間的間距計算方法來表明文檔間的相似性。

    在其中特征選擇是文字表明的重要,方式包含:文檔頻率法(DF),風琴包廠家信息增益法和互信息法這些。

    在做特征選擇以前,一般還需要開展數據預處理的工作中,要對先向網頁頁面減噪。此外在具體的分類中,除開利用文檔的內容特征以外,很有可能還會繼續使用具體運用中所獨有的特征,例如在網頁頁面分類中,很有可能使用url的特征,html的構造特征和標識特征等信息內容。

    分類的主要過程是如此的:界定分類管理體系,將事先分類過的文檔做為訓練集,文具批發從訓煉集中化得到分類實體模型,隨后用練習得到出的分類實體模型對其他文檔多方面分類。文檔全自動分類是學術界科學研究很多年,文件分類技術性上較為完善的一個行業?,F階段分類優化算法關鍵分下邊這種:

    在其中較為常見的是:svm算法(SVM)方式,樸素貝葉斯(NB)方式,神經元網絡(NN)方式,K鄰近(KNN)方式,決策樹算法(DecisionTree)方式等。

    

風琴箱簡單介紹


標簽

Z近瀏覽:

20140306093422_275[1].jpg


掃一掃,關注我們

1.png手機:139 6838 5898
2.png傳真:86-0574-65803873
3.png郵編:315700
4.png地址:浙江省寧波市象山縣經濟開發區濱海工業園


  • 網站首頁
  • 咨詢電話
  • 返回頂部
  • 久热这里只有精品-午夜国产精品小蝌蚪在线观看-四虎永久在线精品视频免费-深田咏美无码资源在线观看