標題 107D12-應用語言模型於線上招募詐欺偵測
姓名 洪英皓
指導教授 余銘忠 老師
畢業日期 2018/06
參考連結

檔案下載Adobe PDF

摘要 隨著網路科技的快速發展與進步,眾多生活型態也隨之改變。在人才招
募方面,也逐漸從傳統的平面媒體轉成網路媒體來進行招募。雖然改善過去
在招募人力時的成本,卻導致衍生許多網路求職陷阱,造成不少民眾受害。
儘管過去政府與人力招募平台大幅的宣導詐騙防範理念,但詐騙手法日新月
異的變化,改善的幅度非常有限。
近年來人工智慧的技術快速發展,在不少的領域中皆有許多的突破。而
本研究發現過去針對於網路招募詐欺偵測議題,較少研究提出深度學習的方
法來應對。因此本研究基於語言模型(BERT, Word Embedding, Topic Model)來
提出兩種模型架構(BERT-DNN, GRU-DNN),藉此來探索適合應用在網路招
募詐欺偵測的語言模型為何。
本研究以EMSCAD 作為模型訓練與測試資料集,並使用維基百科的語料
庫作為預訓練詞向量模型之語料庫,並交互實驗以及比較不同的詞向量模型
(fastText, word2vec)對所提出的模型架構之影響力。在研究結果中,發現以
RNN 為基礎的模型總體表現皆優於以BERT 為基礎的模型,兩者在平衡後的
準確率方面分別取得97.33%與94.33%,在f1_score 則是77.13%與59.76%。
此結果也優於過去研究採用的機器學習模型表現,因此未來若使用本研究所
提出的模型架構進行偵測,能有效的降低民眾受害之機率。
關鍵詞:詐欺偵測;主題模型;自然語言處理;深度學習;BERT