標題 | 107D12-應用語言模型於線上招募詐欺偵測 | |
姓名 | 洪英皓 | |
指導教授 | 余銘忠 老師 | |
畢業日期 | 2018/06 | |
參考連結 |
|
|
摘要 | 隨著網路科技的快速發展與進步,眾多生活型態也隨之改變。在人才招 募方面,也逐漸從傳統的平面媒體轉成網路媒體來進行招募。雖然改善過去 在招募人力時的成本,卻導致衍生許多網路求職陷阱,造成不少民眾受害。 儘管過去政府與人力招募平台大幅的宣導詐騙防範理念,但詐騙手法日新月 異的變化,改善的幅度非常有限。 近年來人工智慧的技術快速發展,在不少的領域中皆有許多的突破。而 本研究發現過去針對於網路招募詐欺偵測議題,較少研究提出深度學習的方 法來應對。因此本研究基於語言模型(BERT, Word Embedding, Topic Model)來 提出兩種模型架構(BERT-DNN, GRU-DNN),藉此來探索適合應用在網路招 募詐欺偵測的語言模型為何。 本研究以EMSCAD 作為模型訓練與測試資料集,並使用維基百科的語料 庫作為預訓練詞向量模型之語料庫,並交互實驗以及比較不同的詞向量模型 (fastText, word2vec)對所提出的模型架構之影響力。在研究結果中,發現以 RNN 為基礎的模型總體表現皆優於以BERT 為基礎的模型,兩者在平衡後的 準確率方面分別取得97.33%與94.33%,在f1_score 則是77.13%與59.76%。 此結果也優於過去研究採用的機器學習模型表現,因此未來若使用本研究所 提出的模型架構進行偵測,能有效的降低民眾受害之機率。 關鍵詞:詐欺偵測;主題模型;自然語言處理;深度學習;BERT |