Week 10 (5/03) - Text Mining & Machine Learning
Pecu PPT / Code :
https://ceiba.ntu.edu.tw/course/26c034/content/TextMining%20&%20ML.pdf
https://ceiba.ntu.edu.tw/modules/index.php?csn=26c034&default_fun=syllabus¤t_lang=chinese
先在 Console 安裝以下套件
主要套件:
install.packages("rJava")
輔助套件:
install.packages("SnowballC")
install.packages("slam")
install.packages("Matrix")
**上週已安裝了 tmcn &tm
**
老師分享的連結:http://www.michaelwsherman.com/projects/drugs/
餘弦相似性 (cos similarity ranking)
google 的猜圖網頁 :https://www.autodraw.com
rJava 之於 Mac 使用者
Step 1. 打開 Terminal 在裡面打下面這行
/usr/libexec/java_home
Step 2. 會得到長得像這樣的新的一行
/Library/Java/JavaVirtualMachines/jdk1.8.0_101.jdk/Contents/Home
**Step 3. 把這行貼到你的 R script 中 Sys.setenv 這行
Sys.setenv(JAVA_HOME="/Library/Java/JavaVirtualMachines/jdk1.8.0_101.jdk/Contents/Home")
**
ass = findAssocs(tdm,”老師”,0.75)
View(ass)
TF-IDF 假設每篇文章都出現的文字就不重要了
課後小練習:https://github.com/LisaTsai/joor1052/tree/master/TMMLexample
**Before you Start :
Step 1. 在你的 R Studio 創一個 R project ,並且把所有的程式下載下來放進去
Step 2. 執行 main.R,產生等等練習要用到的資料(可以將URL改成你想要蒐集資料的網頁)
**
Example 1.