Menerapkan Fuzzy Set untuk Pendapat
Opini
Peneliti :
Shaidah
Jusoh (College of Computer Science & Information Systems)
Hejab M.
Alfawareh (College of Computer Science & Information Systems)
Disusun oleh :
Denny Kusuma
Muhammad Alif Gaza
Ricky Valeri
Kukuh Prasetyo
Latar Belakang
Logika Fuzzy merupakan
suatu logika yang memiliki nilai kekaburan atau kesamaran (fuzzyness) antara
benar atau salah. Dalam logika klasik dinyatakan bahwa segala hal dapat
diekspresikan dalam istilah binary (0 atau 1, hitam atau putih, ya atau tidak),
sedangkan logika fuzzy memungkinkan nilai keanggotaan antara 0 dan 1, tingkat
keabuan dan juga hitam dan putih, dan dalam bentuk linguistik, konsep tidak
pasti seperti "sedikit", "lumayan" dan "sangat".
Logika ini berhubungan dengan himpunan fuzzy dan teori kemungkinan. Logika
fuzzy ini diperkenalkan oleh Dr. Lotfi Zadeh dari Universitas California,
Berkeley pada 1965.
Logika fuzzy dapat digunakan dalam bidang teori kontrol, teori keputusan, dan beberapa bagian dalam managemen sains. Selain itu, kelebihan dari logika fuzzy adalah kemampuan dalam proses penalaran secara bahasa (linguistic reasoning), sehingga dalam perancangannya tidak memerlukan persamaan matematik dari objek yang dikendalikan. Adapun salah satu contoh aplikasi logika fuzzy dalam kehidupan sehari-hari adalah Pada tahun 1990 pertama kali dibuat mesin cuci dengan logika fuzzy di Jepang (Matsushita Electric Industrial Company). Sistem fuzzy digunakan untuk menentukan putaran yang tepat secara otomatis berdasarkan jenis dan 2 banyaknya kotoran serta jumlah yang akan dicuci. Input yang digunakan adalah: seberapa kotor, jenis kotoran, dan banyaknya yang dicuci. Mesin ini menggunakan sensor optik , mengeluarkan cahaya ke air dan mengukur bagaimana cahaya tersebut sampai ke ujung lainnya. Makin kotor, maka sinar yang sampai makin redup. Disamping itu, sistem juga dapat menentukan jenis kotoran (daki atau minyak).
Logika fuzzy dapat digunakan dalam bidang teori kontrol, teori keputusan, dan beberapa bagian dalam managemen sains. Selain itu, kelebihan dari logika fuzzy adalah kemampuan dalam proses penalaran secara bahasa (linguistic reasoning), sehingga dalam perancangannya tidak memerlukan persamaan matematik dari objek yang dikendalikan. Adapun salah satu contoh aplikasi logika fuzzy dalam kehidupan sehari-hari adalah Pada tahun 1990 pertama kali dibuat mesin cuci dengan logika fuzzy di Jepang (Matsushita Electric Industrial Company). Sistem fuzzy digunakan untuk menentukan putaran yang tepat secara otomatis berdasarkan jenis dan 2 banyaknya kotoran serta jumlah yang akan dicuci. Input yang digunakan adalah: seberapa kotor, jenis kotoran, dan banyaknya yang dicuci. Mesin ini menggunakan sensor optik , mengeluarkan cahaya ke air dan mengukur bagaimana cahaya tersebut sampai ke ujung lainnya. Makin kotor, maka sinar yang sampai makin redup. Disamping itu, sistem juga dapat menentukan jenis kotoran (daki atau minyak).
Himpunan fuzzy didasarkan pada gagasan untuk memperluas jangkauan fungsi
karakterisik sedemikian hingga fungsi tersebut akan mencakup bilangan riil pada
interval [0,1]. Dalam tugas akhir ini dibahas mengenai kardinalitas,
keterbatasan dan kekonvekan himpunan fuzzy. Pada himpunan fuzzy, sebuah objek
dapat berada pada sebuah himpunan secara parsial. Derajat keanggotaan dalam
himpunan fuzzy diukur dengan fungsi yang merupakan generalisasi dari fungsi
karakteristik yang disebut fungsi keanggotaan atau fungsi kompatibilitas.
Menerapkan Fuzzy Set
untuk Pendapat Opini
Abstac-Pendapat selalu
diungkapkan dalam komentar atau ulasan Sistem penambangan opini otomatis telah dilihat sebagai Mengekstraksi pendapat dari ulasan dan komentar membutuhkan
sistem untuk ditangani teks bahasa natural. Pendekatan saat ini dalam penambangan opini mengklasifikasikan kata-kata sentimen
menjadi dua kutub; positif dan negatif. Sayangnya, ini tidak cukup. Kata-kata seperti "Sangat baik" dan
"baik" keduanya diklasifikasikan menjadi positif, namun, derajat positif dari kedua kata itu
tidak sama. Kertas ini memperkenalkan penggunaan fuzzy lexicon dan fuzzy set dalam memutuskan tingkat positif dan negatif. Hasil
eksperimen kami menunjukkan bahwa pendekatan tersebut mampu mengekstrak pendapat dan
menyajikan pendapat dengan
cara yang lebih efisien. (Abstrak)
Intruksi
Opening mining.
Pekerjaan penelitian pendapat penambangan telah dilakukan pada berbagai
platform. Ini termasuk, mengekstraksi pendapat dari messenger [2], forum online
tempat pertukaran konsumen pendapat produk [3], jejaring sosial [4], Weblogs
[5] dan masih banyak lagi. Pekerjaan peninjauan [6] telah mengungkapkan hal
yang luar biasa potensi metode penambangan opini untuk analisis tekstual
kontribusi warga dalam perdebatan kebijakan publik. Pekerjaan penelitian [1],
[7] juga menunjukkan pendapat ulasan pelanggan Web. Berbagai teknik telah
diterapkan dalam pendapat pertambangan. Misalnya, karya [8] telah menerapkan
sentiment analisis untuk ulasan film online. Temuan penelitian mereka
menunjukkan bahwa teknik pembelajaran mesin, khususnya mesin pendukung berlaku
untuk mendeteksi sentimen di ulasan film. Ekstraksi informasi [9], pembelajaran
mesin, grafik [10], pendekatan penguatan [11], leksikon [12], [13], a
pendekatan linguistik [13] adalah teknik lain yang digunakan dalam penambangan
opini.
FUZZY SETS
Satu set fuzzy adalah satu set tanpa
jelas batas. Ini dapat berisi elemen dengan hanya sebagian derajat
keanggotaan. Akar teori set fuzzy terletak pada ide variabel linguistik. Suatu
variabel linguistik x ditandai oleh sebuah term-set yang berisi satu set nama
x. Arti dari setiap nama diberikan oleh set fuzzy, ditandai dengan fungsi
keanggotaan. Fungsi keanggotaan itu sendiri tergantung konteks. Mari kita
pertimbangkan proposisi “yang lama buku itu murah ”. Di sini kami segera mengidentifikasi
murah sebagai anggota dari set jangka variabel linguistik HARGA. Untuk
contoh,T (HARGA) = ¶ murah, sedang, mahal}.dimana nilai fuzzy murah,
sedang, mahal ditandai dengan set fuzzy di alam semesta tertentu dari wacana U.
Konsep variabel linguistik memungkinkan untuk simpan dan refleksikan informasi
tersebut ke komputer. The fuzzy nilai-nilai variabel linguistik HARGA dapat
dengan bebas diinterpretasikan tergantung pada konteks. Tentunya harga satu
detik Buku hardcover tangan berbeda dari novel bekas penutup. Namun demikian,
manusia memiliki kemampuan untuk menyesuaikan arti dari konteks kalimat
tergantung. Variabel linguistic adalah variabel fuzzy. Misalnya, pernyataan
“Ali itu tinggi man ”menyiratkan bahwa variabel linguistik yang diambil Ali
nilai linguistik tinggi. Rentang nilai yang mungkin dari a variabel linguistik
mewakili alam semesta wacana itu variabel. Misalnya, alam semesta wacana Tinggi
variabel linguistik mungkin berkisar antara 6 dan 8 kaki. Sekarang, mari kita
pertimbangkan pernyataan “x adalah positif yang sangat kecil integer ”sebagai
contoh. x dikatakan dibatasi oleh saya, fuzzy set bilangan bulat positif yang
sangat kecil, atau saya dikatakan sebagai membatasi set fuzzy x. Teori
kemungkinan adalah teori yang menggunakan manusia umum akal untuk memperkirakan
kemungkinan suatu peristiwa terjadi di bawah kondisi tertentu. Dalam teori
kemungkinan, suatu peristiwa bisa terjadi direpresentasikan sebagai ekspresi
yang mengandung variabel, suatu kondisi dapat diwakili dengan menggunakan set
fuzzy yang membatasi, dan pada kemungkinan untuk suatu peristiwa terjadi di
bawah kondisi tertentu bias diperkirakan oleh fungsi distribusi kemungkinan.
Biarkan U menjadi semesta wacana, yang elemen generiknya dinotasikan U sebagai
μ: U = {μ}. Satu set fuzzy F ⊂ U ditandai oleh a fungsi keanggotaan
μF yang berhubungan dengan masing-masing μ? U adalah nilai keanggotaan di [0,
1]. Sebagai contoh, kita dapat mendefinisikan fuzzy set "bilangan bulat
positif yang sangat kecil" sebagaimana didefinisikan di bawah ini,

set uzzy. Variabel x dapat dibatasi oleh fuzzy set F. Kami menunjukkan
pembatasan seperti £ (x, F) dan memanggil F membatasi set fuzzy x. £ (x, F)
mengaitkan distribusi kemungkinan dengan x. Fungsi distribusi kemungkinan ) (μ
π xF menandakan kemungkinan untuk x untuk mengambil nilai u di bawah batasan F.
Secara numerik, fungsi distribusi x di bawah pembatasan F didefinisikan sama
dengan fungsi keanggotaan dari F yaitu:
Pertimbangkan pernyataan "x adalah bilangan bulat positif yang
sangat kecil" sebagai sebuah contoh. x dikatakan dibatasi oleh saya,
himpunan fuzzy sangatbilangan bulat positif kecil, atau saya dikatakan sebagai
set fuzz yang membatasi dari x. Fungsi distribusi kemungkinan π x (μ)
didefinisikan seperti di bawah:

Fungsi π x (μ) Saya dapat digunakan untuk memperkirakan kemungkinan x
untuk mengambil nilai di bawah batasan "sangat kecil positif bilangan
bulat". Misalnya, ketika x dikenal sebagai sangat kecil bilangan bulat
positif, kemungkinan untuk x menjadi 1 adalah 1,0, kemungkinan untuk x menjadi
2 adalah 0,9 dan seterusnya.
PENDEKATAN YANG DIUSULKAN
Kerangka pendekatan yang diusulkan diilustrasikan dalam Gambar 1. Dalam
pendekatan ini, ulasan akan menjadi teks input. SEBUAH tinjauan dapat terdiri
dari kata, kalimat, atau paragraf. Ini umum untuk menemukan pengkaji untuk
menulis hanya satu kata, seperti "Hebat", "bagus" atau
"tidak berguna". Resensi juga dapat menulis pendapatnya dalam satu
kalimat, misalnya, “ruangan itu besar". Beberapa pengulas mungkin
membutuhkan lebih banyak upaya saat menulis a ulasan. Pendapat mereka
diungkapkan lebih dari satu kalimat. Sebagian besar waktu akan menjadi
paragraf. Di penambangan pendapat, meskipun kata resensi hanya mengatakan satu
kata, itu akan menjadi diambil sebagai ulasan. Pendekatan yang diusulkan
terdiri dari 5 langkah utama. Langkah langkah termasuk, tokenizing kalimat,
mengidentifikasi dan mengekstraksi SenWord, Menetapkan set fuzzy ke Sen-positif
dan negative Word, Menghitung tingkat sentimen positif atau negative dan visualisasi.
Sebuah leksikon dari kata sentimen (SenWord) adalah dikembangkan dan digunakan
dalam proses identifikasi dan mengekstrak SenWord. Implementasi
langkah-langkahnya juga disajikan di bawah ini. Langkah 1: Tokenisasi Kalimat
Token tokenisasi dilakukan jika peninjauan dilakukan dalam bentuk sebuah
kalimat atau paragraf. Meminjamkan kalimat adalah sebuah proses memecah kalimat
menjadi daftar kata-kata. Dengan kata lain, a tokenizer mem-parsing kalimat ke
dalam daftar token (kata-kata). Sebuah output dari proses tokenization kalimat
akan disimpan dalam daftar dinamis. Secara teknis disimpan sebagai array.
Buatan tangan aturan digunakan untuk menentukan kata yang memiliki dua bagian
yang mungkin pidato. Jika sebuah kata dapat ditandai oleh lebih dari satu, bagian
dari pidato, aturan buatan digunakan untuk menentukan yang paling kemungkinan
bagian dari pembicaraan. Misalnya kata ‘tempat’ bias ditugaskan sebagai kata
kerja serta kata benda. Aturannya 'jika yang sebelumnya kata adalah sebuah
artikel, maka kata itu adalah kata benda, jika tidak itu adalah a kata kerja ',
digunakan. Dalam karya ini, kami telah mengadopsi parsing dangkal teknik.
Langkah 2:
Ekstraksi SenWord Sentiment Word (SenWord) didefinisikan sebagai kata
apa saja yang bias digunakan untuk mewakili sentimen negatif atau positif.
Untuk anexample "luar biasa" biasanya digunakan untuk mewakili
positif Sentimen sementara "miskin" biasanya digunakan untuk
menggambarkan negative benda. Dalam mengidentifikasi SenWord, dalam ulasan / komentar,
aleksikon SenWord telah dikembangkan. Setiap SenWord di leksikon dilekatkan
dengan nilai derajat positif atau derajat negatif. Gambar 2 mengilustrasikan
SenWord positif dengan nilainya, sementara Gambar 3 mengilustrasikan yang
negative SenWord dengan nilainya. Nilai-nilai menunjukkan tingkat gelar SenWord
positif atau negatif. Untuk membuat komputasi proses lebih ekonomis, hanya kata
yang ditandai dengan Bagian dari Pidato kata keterangan dan kata sifat dalam
daftar dinamis dipetakan ke SenWord yang disimpan dalam leksikon.

Langkah 3:
Tetapkan Set Fuzzy Positif / NegatifGambar 4 menunjukkan contoh ulasan.
Sebuah kata miring menunjukkan SenWord. Ulasan dapat berisi satu atau lebih
SenWord. Misalnya, dalam Tinjau 4 dan 6 (lihat Gambar 4), itu hanya berisi 1
SenWord, sedangkan Ulasan 5 berisi 6 SenWords. Setiap SenWord dilampirkan
dengan tingkat nilai positif atau negatif seperti yang ditunjukkan pada Gambar
2 dan Gambar 3 berdasarkan polaritasnya. Akal sehat dan linguistik manusia
pengetahuan telah digunakan dalam menentukan nilai derajat. Jika SenWord diakui
sebagai SenWord positif, kemudian positif nilai akan dilampirkan, jika tidak,
nilai negatif dilampirkan.

Kumpulan tinjauan fuzzy diformulasikan seperti dalam
(1).FR = {(wi, μR (wi) (1)
Dengan demikian serangkaian Tinjauan 4 yang samar-samar dalam Gambar 4
dapatdiformulasikan seperti pada (2)
nFR4 = {(luar biasa, 0,8), (hebat, 0,9)} (2)
Langkah 4: Hitung Tingkat SenWord Tingkat sentimen pendapat dalam
tinjauan diperoleh dengan menghitung tingkat SenWord. Dalam pendekatan ini,
fuzzy Operator maksimal digunakan untuk menentukan level positif atau negative
gelar dalam ulasan. Menggunakan operator fuzzy maks, positif tingkat Ulasan 4
adalah 0,9. Persamaan 3, menunjukkan bagaimana maks Operator fuzzy diterapkan.
FR4 = maks {0,8, 0,9} (3)

Langkah 5:
VisualisasiVisualisasi telah disetujui oleh banyak ilmuwan sebagaicara
efektif untuk mengkomunikasikan pesan. Derajat dari sentimen dalam satu set
opini dapat divisualisasikan dalam banyak hal formulir. Misalnya, semua
pendapat yang diekstraksi dapat diwakili dalam satu grafik.
IMPLEMENTASI DAN PERCOBAAN
Pendekatan yang diusulkan telah diterapkan menggunakanVisual C ++.
Setiap langkah dalam modul yang diusulkan telah diimplementasikan sebagai modul
terpisah dari prototipe. Di Bereksperimen dengan pendekatan yang diusulkan kami
telah mengumpulkan 39 ulasan untuk satu hotel yang terletak di Aqaba, Yordania.
Ini ulasan dibuat oleh orang-orang yang tinggal di hotel itu selama liburan
mereka atau tinggal di Aqaba. Ulasan ini bebas dapat diakses melalui internet.
39 ulasan digunakan sebagai test case dalam percobaan pendekatan yang
diusulkan. Gelar setiap ulasan telah dikumpulkan dan disimpan dalam bentuk
excel untuk tujuan visualisasi. Gambar 5 menunjukkan hasil dari diekstraksi
pendapat dari 39 ulasan hotel. Dengan melihat pada grafik kita dapat menentukan
bahwa keseluruhan ulasan hotel adalah mendekati 1 derajat. Ini menunjukkan
bahwa keseluruhan pendapat tentang hotel dapat disajikan sebagai luar biasa,
bagus, luar biasa atau hebat.
KESIMPULAN DAN SARAN
Makalah ini telah menyajikan pendekatan baru untuk penambangan opini
dari ulasan. Teori kemungkinan telah terjadi digunakan dalam menentukan tingkat
derajat masing-masing positif atau SenWord negatif, dan set fuzzy telah
diterapkan ke satu set kata sentimen yang ditemukan dalam ulasan. Itu teknik
visualisasi telah digunakan untuk menggambarkan ekstraksi pendapat. Hasil
eksperimen menunjukkan bahwa pendekatan berhasil. Pekerjaan masa depan dari
penelitian ini adalah untuk memperbesar leksikon fuzzy, mengevaluasi pendekatan
yang diusulkan menggunakan lebih banyak ulasan dan menggunakan pengetahuan
konteks untuk menentukan sebuah frase sentimen dalam ulasan.
No comments:
Post a Comment