Pengelasan Bahasa Kesat Menggunakan Pemberat Istilah Sebagai Pemilihan Ciri Bagi Kandungan Laman Web

Similar documents
EVALUATION USABILITY MEASUREMENT INDEX FOR HIGHER EDUCATION INSTITUTE MUHAMMAD ALIIF BIN AHMAD

THE EFFECTS OF TAPERED SLEEVE IN IMPROVING THE ANCHORAGE BOND OF REINFORCEMENT BAR PAMELA ADELINE LO

MANAGEMENT OF VARIATION ORDER IN PUBLIC WORKS DEPARTMENT MALAYSIA CONSTRUCTION PROJECT SHARIL AMRAN BIN AMIR MOHAMED

IMPROVING ENERGY SAVING EVALUATION IN LIGHTING USING DAYLIGHT UTILIZATION WITH AREA SEGREGATION TECHNIQUE MOHAMMAD ASIF UL HAQ

PENGIRAAN OBJEK DALAM IMEJ Mah Min Ren Dr Kok Ven Jyn. Fakulti Teknologi & Sains Maklumat, Universiti Kebangsaan Malaysia ABSTRAK

UNIVERSITI PUTRA MALAYSIA QURANIC ONTOLOGY FOR RESOLVING QUERY TRANSLATION DISAMBIGUATION IN ENGLISH-MALAY CROSS-LANGUAGE INFORMATION RETRIEVAL

A NOVEL MAGNETORHEOLOGICAL VALVE WITH MEANDERING FLOW PATH STRUCTURE FITRIAN IMADUDDIN UNIVERSITI TEKNOLOGI MALAYSIA

(The Human Soul Based on the Opinion of Fakhr al-din al-razi) ELBAHLOUL MOHAMED HUSSEIN* MOHD NASIR OMAR AHMAD SUNAWARI BINLONG MUDASIR BIN ROSDER

UNIVERSITI PUTRA MALAYSIA

MESHFREE FORMULATION FOR BUCKLING OF COMPOSITE BEAM WITH SLIP MOHD HAMIDI BIN HARUN UNIVERSITI TEKNOLOGI MALAYSIA

SCHOOL OF PHYSICS LOGO DESIGN CONTEST

NOTA 5: PANDUAN MENGHASILKAN LAMAN (SITES) 1.1 Pengenalan

SEISMIC AND PROGRESSIVE COLLAPSE ASSESSMENT OF NEW PROPOSED STEEL CONNECTION IMAN FARIDMEHR

FORECASTING REVENUE PASSENGER ENPLANEMENTS USING WAVELET-SUPPORT VECTOR MACHINE MOHAMAD AIMAN ZAINUDDIN

VISUALISASI MAKLUMAT PENGURUSAN PENCAPAIAN RANGSANGAN KOGNITIF KANAK-KANAK LAMBAT BERTUTUR

وظاي ف الدولة الا سلامية (The Duties And Function Of An Islamic State)

COMMON CONTRACTUAL ISSUES FACED BY MALAYSIAN CONTRACTORS OPERATING IN MIDDLE EAST USING FIDIC FORM OF CONTRACTS

THE PREVAILING PRACTICE IN DECIDING THE PRACTICAL COMPLETION OF CONSTRUCTION WORK. MOHAMMAD HARITH BIN MOHD YUNOS

AN INVESTIGATION ON VEHICLE OVERLOADING IN MUAR MELAKA ROAD HAZLINA BINTI MARWAN

UNIVERSITI TEKNOLOGI MALAYSIA

FLOW IN A PIPELINE WITH LEAKAGE SITI NUR HASEELA BINTI IZANI

FACTORS THAT AFFECT KNOWLEDGE SHARING AMONG EMPLOYEES IN MULTINATIONAL ORGANIZATION YASER HASSAN HASSAN AL-QADHI UNIVERSITI TEKNOLOGI MALAYSIA

Manual Pengguna. Disediakan Untuk : Audit Korporat

ABSTRACT Muslim youth face many challenges today due to the huge scientific development. New information technologies can be considered one of the mos

Proses Penyelidikan Tindakan. MTE3133: Penyelidikan Tindakan

Latihan MyMesyuarat -PENGERUSI- DibentangkanOleh

A ROBUST ESTIMATION METHOD OF LOCATION AND SCALE WITH APPLICATION IN MONITORING PROCESS VARIABILITY ROHAYU BT MOHD SALLEH

MOLECULAR PHYLOGENY OF SELECTED MANGO CULTIVARS BASED ON INTERNAL TRANSCRIBED SPACER (ITS) REGION SHAHKILA MOHD ARIF

TERMINATION OF CONTRACT: ABANDONMENT OF WORK MOHD NUR IMAN AL HAFIZ BIN MOHD JAMIL

THE EFFECTS OF RISK MANAGEMENT PRACTICES, RISK BEHAVIOUR ON RESEARCH AND DEVELOPMENT PROJECT PERFORMANCE IN UTM NOR ALIAA BINTI ZAINAL ABIDIN

M2-1: Proses Penyelidikan Tindakan MTE3113: PENYELIDIKAN TINDAKAN

TINDAKAN PIHAK BERKUASA NEGERI DAN PIHAK BERKUASA TEMPATAN TERHADAP KES PELANGGARAN SYARAT GUNA TANAH

MODELLING AND VIBRATION CONTROL OF PIEZOELECTRIC ACTUATOR

THE EFFECTS OF INFLUENTIAL BEHAVIOURAL FACTORS ON INVESTORS DECISION MAKING IN STOCK MARKET OF PAKISTAN MISBAH SADIQ

Bab 2. Polisi e-pembelajaran di IPT Malaysia. Hanafi Atan Mohamed Amin Embi Supyan Hussin. Pengenalan

HAK MILIK PmAT mrenajlr.mi mm.u. sum Jl. ! l1hat Sebelah. 'Pe l) tesis

FEAR OF CRIME WITHIN NON-GATED RESIDENTIAL COMMUNITIES IN THE URBAN CONTEXT SITI AISHAH BINTI AHMAD KAMIL

MOSAICKING OF TORN IMAGE USING GRAPH ALGORITHM AND COLOR PIXEL MATCHING IBRAHIM THORIG

KECENDERUNGAN PELAJAR DAN MASYARAKAT ISLAM TERHADAP PENUBUHAN BANK WAKAF

SULIT P2115-EKONOMI DARI PERSPEKTIF ISLAM/JAN 08

BIOMIMETIC PATTERN RECOGNITION FOR WRITER IDENTIFICATION USING GEOMETRICAL MOMENT FUNCTIONS

SPM4342 KONSEP ASAS DALAM WEBPAGE

LAPORAN TEKNIKAL RALAT PENDISPENSAN UBAT DI FARMASI HOSPITAL

Laman Web Komuniti PANDUAN ADMINISTRATOR 5R STRATEGIC CONSULTANCY SDN BHD. Version History

SISTEM PEMBANGUNAN LAMAN WEB AKOMODASI BERASASKAN AWAN. Muhammad Nazmi Bin Anuar Zamri Murah

PEMBANGUNAN LAMANWEB BAGI SUBJEK BAHASA PENGATURCARAAN I C++ BERDASARKAN STRATEGI PEMBELAJARAN BERASASKAN SITUASI

MANUAL PENGGUNA PENERIMAAN BARANG(ASET/INVENTORI) MELALUI NOTA TERIMAAN BARANG (GRN) MENGGUNAKAN APLIKASI:-

Keywords : The Khawarij Religious Views- Purposes of poem Traces of the Quran Characteristics

LAMAN WEB PERBANDINGAN HARGA PAKAIAN. Ainul Suhana Binti Abd. Rahim Dr. Umi Asma Binti Mokhtar

(The rise of al-ahbash movement and Its Impact in Malaysia) Faculty of Islamic Civilization, Universiti Teknologi Malaysia

SKRIPSI DEIXIS USED IN ENGLISH TRANSLATION OF SURAH YUSUF

SISTEM E-PELAPORAN PEMANTAUAN LAMAN WEB JABATAN STANDARD MALAYSIA. Maggery Roxane Dennis Dr. Mohd Ridzwan Yaakub

UNIVERSITI PUTRA MALAYSIA

KESAN KAEDAH ANSUR MAJU DALAM MEMBETULKAN TULISAN HURUF BESAR DAN HURUF KECIL MURID TAHUN EMPAT. Oleh. Zaharin Bin Liam

Jamalludin Bin Harun & Khairun Nisak Binti Basaruddin Fakulti Pendidikan Universiti Teknologi Malaysia

INTERAKSI KOMPUTER PENGGUNA (SCV 1023)

SPM4342 PEMBANGUNAN SISTEM PEMBELAJARAN BERASASKAN WEB PRINSIP ASAS MEREKA BENTUK WEB

METAPHOR ANALYSIS OF DR. MAHATHIR S BUSINESS SPEECHES ALIAKBAR IMANI

POWER QUALITY IMPROVEMENT BY DYNAMIC VOLTAGE RESTORER AND UNIFIED POWER QUALITY CONDITIONER USING FUZZY LOGIC FARIDULLAH KAKAR

Oleh. Syed Mohd Solehin bin Wan Sarip ABSTRAK

MATROID STRUCTURE OF DYNAMIC GRAPH MODEL OF EVAPORATION PROCESS IN A BOILER SYSTEM NUR SYAHIDAH BINTI KHAMIS UNIVERSITI TEKNOLOGI MALAYSIA

UNIVERSITI PUTRA MALAYSIA EAST-WEST DIALOGUE ON JALALUDDIN RUMI AND RALPH WALDO EMERSON IN RELATION TO MYSTICISM HOSSEINALI LIVANI

UTILITY CONSUMPTION PATTERN AMONG MALAYSIAN ELECTRICITY USERS NURHIDAYAH BT MAHUSIN UNIVERSITI TEKNOLOGI MALAYSIA

PERKHIDMATAN UTAMA PRASISWAZAH

UNIVERSITI PUTRA MALAYSIA NUMERICAL PERFORMANCE EVALUATION OF PLAIN FIN TUBEHEAT EXCHANGER UNDER FROSTY CONDITIONS

PENGGUNAAN TEKNIK BERCERITA UNTUK MENINGKATKAN MINAT DAN KEFAHAMAN MURID TAHUN DUA TERHADAP TOPIK CAHAYA DI KUCHING

Bimbingan Oleh Guru Pembimbing Kepada Guru Pelatih Utm. Noor Azlan Bin Ahmad Zanzali & Lim Wee Mei Fakulti Pendidikan Universiti Teknologi Malaysia

Kajian Rintis Penerimaan Mualaf Di Selangor Terhadap Aplikasi Smartsolat

HENDRA SAPUTRA UNIVERSITI TEKNOLOGI MALAYSIA

UNIVERSITI SAINS MALAYSIA EEE 320 MIKROPEMPROSES II

PENGGUNAAN KIT LAMPU ISYARAT QALQALAH (KLIQ) MEMBANTU MURID MEMBEZAKAN QALQALAH SUGHRᾹ DAN KUBRᾹ. NOR AZWA ASSHIFA BINTI ASSERI

Abstrak. R.A.F.T. dan Think-Tac-Toe dalam Pengajaran dan Pembelajaran. Hairani Sani

UNIVERSITI PUTRA MALAYSIA PENGGUNAAN LAMAN WEB ZAKAT LEMBAGA ZAKAT SELANGOR DAN PEMBAYARAN ZAKAT SECARA ATAS TALIAN

TONG SAMPAH PINTAR BERASASKAN INTERNET PELBAGAI PERKARA (IOT)

METRIK DAN INDEKS KESELAMATAN LAMAN SESAWANG: SATU KAJIAN KES TERHADAP INSTITUSI PENGAJIAN TINGGI AWAM DI MALAYSIA

Tahap Modul Bahasa Arab Masjid dan Hubungannya dengan Tahap Kemahiran Asas Berbahasa Arab dalam Kalangan Pelajar

HBT 503 SEMINAR SISWAZAH: ISU-ISU PENTERJEMAHAN

LAPORAN KAJIAN TINDAKAN PENGURUSAN DAN KEPIMPINAN PENDIDIKAN

THERMOLUMINESCENCE PROPERTIES OF DYSPROSIUM-DOPED CALCIUM BORATE GLASS FOR DOSE MEASUREMENT SUBJECTED TO IONIZING RADIATION

HUBUNGAN ANTARA GANJARAN DAN ETIKA KERJA ISLAM DENGAN KOMITMEN DALAM KALANGAN PEKERJA DI JABATAN PEMBANGUNAN PERSEKUTUAN KELANTAN

PENGGUNAAN SUPER AYAT DALAM MENINGKATKAN KEMAHIRAN MEMBACA SECARA MEKANIS MURID TAHUN EMPAT. Oleh. Norhadi Anwar bin Tamit

menjelaskan bahawa ia merujuk kepada doa dan bukan transaksi ekonomi.

WPK 213 Wajah sebenar Psikologi Islam Sifat Psikologi Islam Psikologi Moden Persamaan dan Perbezaan Psikologi Islam & Barat

UNIVERSITI PUTRA MALAYSIA EFFECTS OF HIJAB AS ISLAMIC RELIGIOUS SYMBOL ON MUSLIM CONSUMER ATTITUDES TOWARDS ADVERTISEMENTS

METAPHORS CORRESPONDENCES OF SOURCE AND TARGET DOMAIN ON THE GOSPEL OF JOHN

UNDANG-UNDANG MALAYSIA. Akta 369 AKTA HARI KELEPASAN (1) Akta ini bolehlah dinamakan Akta Hari Kelepasan 1951.

SISTEM PENJADUALAN SYIF. Nurul Iddayu Bahari Idrus. Fakulti Teknologi & Sains Maklumat, Universiti Kebangsaan Malaysia ABSTRAK

PUSAT PENGAJIAN SAINS PERUBATAN UNIVERSITI SAINS MALAYSIA MS ISO 9001:2008. PENGURUSAN PEMBELIAN BAHAN PAKAI HABIS (VOT 27000) (PPSP/Pent/CP5)

UNIVERSITI PERUBATAN ANTARABANGSA INTERNATIONAL MEDICAL UNIVERSITY MALAYSIA

Katakunci : kualiti kehidupan, Kolej Tun Dr Ismail (KTDI)

BORANG PENGESAHAN STATUS TESIS

UNIVERSITY OF NORTH SUMATERA FACULTY OF CULTURE STUDIES DIPLOMA III ENGLISH STUDY PROGRAM MEDAN JUNE 2011

PERSEPSI GURU TERHADAP PEMBELAJARAN ILMU HADITH DI SEKOLAH-SEKOLAH MENENGAH KEBANGSAAN AGAMA (SMKA) DI SARAWAK, MALAYSIA

ZAIZUL B. AB. RAHMAN & KHAIDZIR B. ISMAIL

RADON AND THORON STUDY IN AREAS OF ELEVATED BACKGROUND RADIATION IN PALONG, SEGAMAT, JOHOR NUR AMIRA BINTI ABD WAHAB UNIVERSITI TEKNOLOGI MALAYSIA

PORTAL PERSATUAN PENDUDUK (PPP)

KAJIAN KES PORTFOLIO HARTANAH BERBEZA

Keywords: Ilmu Mantik, Understand, Practice, UniSZA

SHUNT ACTIVE POWER FILTER OPERATING WITH A MULTI-VARIABLE FILTER AND NEW REFERENCE CURRENT GENERATION FOR HARMONICS AND REACTIVE POWER COMPENSATION

PERSEPSI MAHASISWA PUSAT ASASI KUIS TERHADAP KEUPAYAAN MEMBACA SURAH AL-FATIHAH

Transcription:

Prosiding Komputeran UTM Inovasi di dalam Teknologi dan Aplikasi Komputeran Volume: I Year: 2016 ISBN: 978-967-0194-82-0 1 Pengelasan Bahasa Kesat Menggunakan Pemberat Istilah Sebagai Pemilihan Ciri Bagi Kandungan Laman Web RIDZWAN BIN MOHAMED @ HUSSIN1, ROSELINA SALLEH@SALLEHUDDIN Jabatan Sains Komputer, Fakulti Komputeran, Universiti Teknologi Malaysia, 81310 Johor Bharu, Johor, Malaysia 1 ridzwanmh@gmail.com, 2 roselina@utm.my *2 Abstrak Kini kebanyakan urusan seharian kita melibatkan penggunaan laman web di internet. Bagaimanapun, terdapat beberapa laman web yang tidak sesuai dilayari kerana mengandungi bahasa kesat yang melampau. Pendedahan seumpama ini terhadap golongan remaja dan kanak-kanak boleh menyebabkan atau menyumbang kepada berlakunya gejala-gejala negatif seperti kejadian rogol dan pembuangan bayi. Justeru, bagi mencegah kanak-kanak daripada bebas melayari laman web yang tidak baik tersebut, pengesanan isi kandungan laman web menggunakan model pengelasan Support Vector Machine (SVM) boleh dilaksanakan. Untuk meningkatkan prestasi pengelas SVM bagi pengesanan bahasa kesat dalam isi kandungan laman web, dua skim pemberat istilah digunakan sebagai pemilih ciri iaitu Kekerapan Istilah (TF) dan Kekerapan Istilah Songsang Kekerapan Dokumen (TFIDF). Prestasi ketepatan SVM menggunakan kedua-dua skim pemberat ini diukur dan dibandingkan menggunakan data yang diperolehi dari laman web yang sama. Keputusan eksperimen menujukkan kedua-dua skim pemberat menghasilkan ketepatan yang sama iaitu 70%. Keputusan ini menunjukkan bahawa TF dan TFIDF sesuai digunakan sebagai pemilih ciri bagi meningkatkan prestasi pengelasan SVM untuk pengesanan kandungan bahasa kesat dalam laman web. Kata Kunci: Bahasa Kesat, Skim Pemberat Istilah, TF, TFIDF 1.0 Pendahuluan Kini kebanyakan urusan seharian kita dijalankan dengan menggunakan laman web. Hampir semua golongan bebas melayari laman web termasuk juga golongan remaja dan kanak-kanak. Walau bagaimanapun, terdapat sesetengah laman web mengandungi penggunaan bahasa kesat yang melampau pada isi kandungannya. Hal ini boleh memberikan kesan negatif seperti kejadian rogol dan pembuangan bayi. Bagi mengatasi masalah penggunaan bahasa kesat yang melampau pada isi kandungan laman web, pengelasan bahasa kesat memnggunakan skim pemberat istilah sebagai pemilihan ciri bagi isi kandungan laman web harus dilaksanakan. Dengan menggunakan skim pemberat

2 istilah sebagai pemilihan ciri, istilah-istilah yang dianggap kesat pada laman web boleh dikelaskan. Dalam kajian ini, skim pemberat istilah Kekerapan Istilah (TF) dan Kekerapan Istilah Songsang Kekerapan Dokumen (TFIDF) digunakan. Daripaad itu, objektif kajian ini adalah (i)mengenal pasti dan mengelaskan istilah atau bahasa kesat dengan melibatkan kepakaran manusia, (ii) menganalisis istilah atau bahasa kesat itu tadi dengan menggunakan skim pemberat istilah Kekerapan Istilah (TF) dan Kekerapan Istilah Songsang Kekerapan Dokumen (TFIDF) dengan menggunakan Support Vector Machine (SVM), dan (iii) membuat perbandingan antara kedua-dua skim pemberat istilah. 2.0 Metodologi Pembangunan Secara umum, aliran kajian ini dapat dilihat dalam Rajah 1. Ia bermula dengan pengumpulan data di mana data-data yang diperoleh daripada laman web seperti laman web yang mengandungi penggunaan bahasa kesat yang melampau dan laman web yang berunsurkan pendidikan atau kesihatan. Pra-pemprosesan pula adalah fasa di mana data yang dalam bentuk Hypettext Markup Language (HTML) ditukarkan menjadi bentuk teks. Penghuraian HTML berlaku bagi membuang semua sintaks yang terdapat dalam HTML. Dalam fasa ini juga, proses stemming dan stopping juga berlaku. Stemming adalah bertujuan untuk menjadikan perkataan itu sebagai kata akar manakala stopping pula adalah untuk membuang perkataan-perkataan yang sering digunakan seperti is, are, and dan sebagainya. Pernyataan data adalah fasa yang di mana data yang telah melalui fasa sebelumnya ditunjukkan. Data tersebut kini dalam bentuk teks dan barulah fasa seterusnya boleh dilaksanakan. Bagi melaksanankannya, satu pakej yang dikenali sebagai Voyant Server digunakan bagi mengenal pasti antara perkataan atau istilah yang akan digunakan bagi fasa seterusnya. Dalam fasa pemilihan ciri, skim pemberat istilah Kekerapan Istilah (TF) dan Kekerapan Istilah Songsang Kekerapan Dokumen (TFIDF) digunakan. Sebanyak 20 perkataan yang akan dipilih bagi melaksanakan fasa ini. Kekerapan perakataan ini akan dikira berdasarkan skim pemberat yang dipilih. Daripada 100 data yang dikumpulkan, data-data tersebut akan dibahagikan kepada dua iaitu 60 bagi data latihan dan 40 bagi data ujian. Kedua-dua data ini akan menjalani proses yang sama iaitu TF dan TFIDF. Perbezaannya adalah jumlah data sahaja. Selepas melakukan pemilihan ciri iaitu TF dan TFIDF, data tersebut akan dikelaskan dengan menggunakan Support Vector Machine (SVM). Bagi melaksanakan SVM, perisian LibSVM akan digunakan. Daripada SVM, ini data tersebut dapat dikelaskan sama ada normal atau kesat. Fasa penilaian keupayaan pula adalah fasa bagi membandingkan keteapatan antara kedua-dua pemberat istilah yang digunakan iaitu TF dan TFIDF.

3 Pengumpulan Data Pra-pemprosesan Pernyataan Data Pemilihan Ciri Latihan Ujian Pengelas (SVM) Normal Kesat Penilaian Keupayaan Rajah 1 Aliran Kajian 3.0 Keputusan Label 1 adalah bermaksud kesat manakala label 0 bermaksud tidak kesat. Hasil daripada perisian LibSVM itu akan dibandingkan dengan data latihan. Keputusan bagi skim pembearat istilah TF adalah seperti dalam Jadual 1 manakala Jadual 2 menunjukkan keputusan bagi TFIDF. Rajah 2 pula menunjukkan perbandingan ketepatan antara kedua-dua skim pemberat yang digunakan.

4 Jadual 1 Keputusan Ketepatan bagi TF Latihan Keputusan Ketepatan

5 Jadual 2 Keputusan Ketepatan bagi TFIDF Latihan Keputusan Ketepatan 80 70 60 50 Ketepatan 40 TF 30 TFIDF 20 10 0 TF TFIDF Rajah 2 Perbandingan Ketepatan

Ketepatan = 14 X 100% 6 4.0 Perbincangan Hasil daripada keptusan yang dibuat SVM, kedua-dua skim pemberat itu menunjukkan ketepatan sebanyak 70%. Hal ini berdasarkan daripada formula berikut. h Ketepatan = X 100% = 70% Berdasarkan keputusan yang diperoleh daripada TF dan TFIDF, sebanyak 14 data daripada jumlah keselurahan iaitu 20 memberi keputusan yang betul. Justeru, ketepatannya adalah sebanyak 70%. 5.0 Kesimpulan Berdasarkan kajian yang dijalankan, hasil ketepatan yang diperoleh daripada kedua-dua skim pemberat istilah TF dan TFIDF menunjukkan ketepatan sebanyak 70%. Antara cadangan yang boleh ditambah bagi menambahkan lagi ketepatan keputusan ini adalah dengan menambah bilangan data. Rujukan Aghdam, M. H., Aghaee N.G., Basiri M.E, (2009) Text feature selection using ant colony optimization. Expert Systems with applications. Hu, W., Wu, O., Fu, Z. & Maybank, S. (2007). Recognition of pornographic web pages by classifying texts and image. IEEE Transaction on Pattern Analysis and Machine Intelligence. pp-1019-1034 Joachims, T. (1998). Text categorization with support vector machines: Learning with many Relevant Features in Proceesings of ECML-98, 10th European Conference on Machine Learning Lee, Z. S. (2008) Enhance Term Weighting Algorithm as Feature Selection Technique for Illicit Web Content Classification. ISDA 08 proceeding of the 2008 Eighth International Conference on Intelligent Systems Design and Applications Volume 02. Washington, DC, USA: IEEE, 145-150. Lee, Z.S. (2010). Enhanced Featured Selection Method for Illicit Web Content Filtering. Doctor Philosophy, Universiti Teknologi Malaysia, Skudai. Razavi, A., Ink Ipen, D., Uritsky, S., and Matwin, S., (2010). Offensive language detetction using multi-level classification. Proceedings of 23rd Canadian conference on Advances in Artificial Intelligence. Berlin, Heidelberg, Springer Verlag, 16-27. Rohan S., Kalyani N., Shivani S., Shantanu N., Gopal U., (2015) A System to Detect Inappropriate Messages in Online Social Networks. 18th IRF International Conference. Pune, India Selamat, A. and Omatu, S. (2004). Web page feature selection and classification using neural networks. Information Sciences. 158, 69-88.

Siti, F. (2012). Comparative Study On Term Weighting Schemes As Feature Selection Method For Malay Illicit Web Content Filtering. Master, Universiti Teknologi Malaysia, Skudai. Wohnee, L., Samuel S.L., Seungjong C., & Dongun A., (2007). Harmful Contents Classification Using the Harmful Word Filtering and SVM, Chonbuk National University, South Korea Yadav, S. H. and Parne, B. L. (2014). A Survey on Different Text Categorization Techniques for Text Filtration. International Journal of Computer Science and Technologies, Vol. 5(6), 8233-8235. Nagpur, India. Xu, Z. and Zhu, S., (2010) Filtering Ofensive Language in Online Communities Using Grammatical Relations. Seventh annual Collaboration, Electronic messaging, Anti- Abuse and Spam Conference July 13-14, 2010, Washington, USA. 7