Week 10 (5/03) - Text Mining & Machine Learning

Pecu PPT / Code :

https://ceiba.ntu.edu.tw/course/26c034/content/TextMining%20&%20ML.pdf

https://ceiba.ntu.edu.tw/modules/index.php?csn=26c034&default_fun=syllabus&current_lang=chinese

先在 Console 安裝以下套件

主要套件:

install.packages("rJava")

輔助套件:

install.packages("SnowballC")

install.packages("slam")

install.packages("Matrix")

**上週已安裝了 tmcn &tm

**

老師分享的連結:http://www.michaelwsherman.com/projects/drugs/

餘弦相似性 (cos similarity ranking)

google 的猜圖網頁 :https://www.autodraw.com

rJava 之於 Mac 使用者

Step 1. 打開 Terminal 在裡面打下面這行
/usr/libexec/java_home
Step 2. 會得到長得像這樣的新的一行

/Library/Java/JavaVirtualMachines/jdk1.8.0_101.jdk/Contents/Home

**Step 3. 把這行貼到你的 R script 中 Sys.setenv 這行
Sys.setenv(JAVA_HOME="/Library/Java/JavaVirtualMachines/jdk1.8.0_101.jdk/Contents/Home")

**

ass = findAssocs(tdm,”老師”,0.75)

View(ass)

TF-IDF 假設每篇文章都出現的文字就不重要了

課後小練習:https://github.com/LisaTsai/joor1052/tree/master/TMMLexample

**Before you Start :
Step 1. 在你的 R Studio 創一個 R project ,並且把所有的程式下載下來放進去
Step 2. 執行 main.R,產生等等練習要用到的資料(可以將URL改成你想要蒐集資料的網頁)

**

Example 1.

results matching ""

    No results matching ""