Tuesday, November 27, 2018

Menerapkan Fuzzy Set untuk Pendapat Opini


Menerapkan Fuzzy Set untuk Pendapat Opini





Peneliti :
Shaidah Jusoh (College of Computer Science & Information Systems)
Hejab M. Alfawareh (College of Computer Science & Information Systems)

Disusun oleh :
Denny Kusuma
Muhammad Alif Gaza
Ricky Valeri
Kukuh Prasetyo


Latar Belakang
Logika Fuzzy merupakan suatu logika yang memiliki nilai kekaburan atau kesamaran (fuzzyness) antara benar atau salah. Dalam logika klasik dinyatakan bahwa segala hal dapat diekspresikan dalam istilah binary (0 atau 1, hitam atau putih, ya atau tidak), sedangkan logika fuzzy memungkinkan nilai keanggotaan antara 0 dan 1, tingkat keabuan dan juga hitam dan putih, dan dalam bentuk linguistik, konsep tidak pasti seperti "sedikit", "lumayan" dan "sangat". Logika ini berhubungan dengan himpunan fuzzy dan teori kemungkinan. Logika fuzzy ini diperkenalkan oleh Dr. Lotfi Zadeh dari Universitas California, Berkeley pada 1965.
Logika fuzzy dapat digunakan dalam bidang teori kontrol, teori keputusan, dan beberapa bagian dalam managemen sains. Selain itu, kelebihan dari logika fuzzy adalah kemampuan dalam proses penalaran secara bahasa (linguistic reasoning), sehingga dalam perancangannya tidak memerlukan persamaan matematik dari objek yang dikendalikan. Adapun salah satu contoh aplikasi logika fuzzy dalam kehidupan sehari-hari adalah Pada tahun 1990 pertama kali dibuat mesin cuci dengan logika fuzzy di Jepang (Matsushita Electric Industrial Company). Sistem fuzzy digunakan untuk menentukan putaran yang tepat secara otomatis berdasarkan jenis dan 2 banyaknya kotoran serta jumlah yang akan dicuci. Input yang digunakan adalah: seberapa kotor, jenis kotoran, dan banyaknya yang dicuci. Mesin ini menggunakan sensor optik , mengeluarkan cahaya ke air dan mengukur bagaimana cahaya tersebut sampai ke ujung lainnya. Makin kotor, maka sinar yang sampai makin redup. Disamping itu, sistem juga dapat menentukan jenis kotoran (daki atau minyak).
            Himpunan fuzzy didasarkan pada gagasan untuk memperluas jangkauan fungsi karakterisik sedemikian hingga fungsi tersebut akan mencakup bilangan riil pada interval [0,1]. Dalam tugas akhir ini dibahas mengenai kardinalitas, keterbatasan dan kekonvekan himpunan fuzzy. Pada himpunan fuzzy, sebuah objek dapat berada pada sebuah himpunan secara parsial. Derajat keanggotaan dalam himpunan fuzzy diukur dengan fungsi yang merupakan generalisasi dari fungsi karakteristik yang disebut fungsi keanggotaan atau fungsi kompatibilitas.


Menerapkan Fuzzy Set untuk Pendapat Opini

Abstac-Pendapat selalu diungkapkan dalam komentar atau ulasan Sistem penambangan opini otomatis telah dilihat sebagai Mengekstraksi pendapat dari ulasan dan komentar membutuhkan sistem untuk ditangani teks bahasa natural. Pendekatan saat ini dalam penambangan opini mengklasifikasikan kata-kata sentimen menjadi dua kutub; positif dan negatif. Sayangnya, ini tidak cukup. Kata-kata seperti "Sangat baik" dan "baik" keduanya diklasifikasikan menjadi positif, namun, derajat positif dari kedua kata itu tidak sama. Kertas ini memperkenalkan penggunaan fuzzy lexicon dan fuzzy set dalam memutuskan tingkat positif dan negatif. Hasil eksperimen kami menunjukkan bahwa pendekatan tersebut mampu mengekstrak pendapat dan menyajikan pendapat dengan cara yang lebih efisien. (Abstrak)

Intruksi

Pendapat selalu mengevaluasi dalam komentar atau. Sistem penambangansalah satu alat bisnis yang diinginkan. Sistemnya bisa ekstrak opini publik tentang topik, produk atau layanan tertentu yang terpisahkan dalam teks tidak terstruktur. Mengekstraksi pendapat dari pengalaman dan komentar membutuhkan sistem untuk dilalui teks bahasa alami. Perhatian saat ini dalam penambangan opini mengklasifikasikan kata-kata sentimen menjadi dua kutub; positif dan negatif. Sayangnya, ini tidak cukup. Kata-kata seperti "Sangat baik" dan "baik" hal gelas menjadi positif, namun, derajat positif dari kata kata tidak sama. Kertas ini menggunakan fuzzy lexicon dan fuzzy set dalam memutuskan tingkat positif dan negatif. Hasil eksperimen kami bahwa bahwa bahwa bahwa bahwa bahwa bahwa bahwa bahwa bahwa bahwa mampu dengan cara yang lebih efisien. polaritas membutuhkan leksikon polar. Leksikon mengandung kata-kata atau frasa yang dapat digolongkan sebagai positif atau negatif.Dua macam pendekatan telah diajukan untuk masalah ini. Satu didasarkan pada tesaurus. metode menggunakan sinonim atau glosses dari tesaurus untuk menentukan polaritas kata-kata[1]. Pendekatan kedua mengeksploitasi korpus mentah. Orang-orang menggunakan linguistik untuk menyajikan derajat positif atau negatif sentimen. Misalnya, pernyataan "buku itu bagus" dan Pernyataan "buku ini luar biasa" dapat diklasifikasikan menjadi kutub positif. Namun, derajat positif keduanya pernyataan tidak sama. Kata 'bagus' memiliki derajat yang lebih tinggi dari kata 'bagus'. Mari kita pertimbangkan contoh negatif. Sebuah pernyataan “buku membosankan ”dan pernyataan“ buku itu tidak berguna ”bisa jadi diklasifikasikan menjadi kutub negatif. Namun, derajat negatifnya antara 'membosankan' dan 'tidak berguna' berbeda. Buku itu mungkin berguna, tetapi gaya penulisan mungkin membosankan. Namun, itu buku yang tidak berguna berarti buku tersebut tidak layak dibaca sama sekali.Dengan demikian dengan menggunakan polarisasi negatif dan positif saja tidak cukup untuk menyampaikan pendapat orang secara akurat. Tujuan dari makalah ini adalah untuk memperkenalkan pendekatan baru untuk pendapat pertambangan dari ulasan atau komentar. Pendekatan telah dilakukan kata-kata akun yang digunakan. Tingkat positif dan negatif diterapkan ke kata yang mengekspresikan sentimen. Biasa akal digunakan dalam menentukan nilai derajat. Satu set fuzzy miliki telah diterapkan untuk menghitung keseluruhan sentimen dalam ulasan. Makalah ini disusun sebagai berikut. Bagian II menyajikan a gambaran singkat tentang pekerjaan sebelumnya dalam penambangan opini. Bagian III mewakili teori kemungkinan dan fuzzy set. Kami pendekatan yang diusulkan disajikan dalam Bagian IV. Bagian V menyajikan implementasi dan percobaan yang diusulkan pendekatan dan bagian VI menyajikan kesimpulan dan pekerjaan di masa depan penelitian ini.


Opening mining.
Pekerjaan penelitian pendapat penambangan telah dilakukan pada berbagai platform. Ini termasuk, mengekstraksi pendapat dari messenger [2], forum online tempat pertukaran konsumen pendapat produk [3], jejaring sosial [4], Weblogs [5] dan masih banyak lagi. Pekerjaan peninjauan [6] telah mengungkapkan hal yang luar biasa potensi metode penambangan opini untuk analisis tekstual kontribusi warga dalam perdebatan kebijakan publik. Pekerjaan penelitian [1], [7] juga menunjukkan pendapat ulasan pelanggan Web. Berbagai teknik telah diterapkan dalam pendapat pertambangan. Misalnya, karya [8] telah menerapkan sentiment analisis untuk ulasan film online. Temuan penelitian mereka menunjukkan bahwa teknik pembelajaran mesin, khususnya mesin pendukung berlaku untuk mendeteksi sentimen di ulasan film. Ekstraksi informasi [9], pembelajaran mesin, grafik [10], pendekatan penguatan [11], leksikon [12], [13], a pendekatan linguistik [13] adalah teknik lain yang digunakan dalam penambangan opini.

FUZZY SETS
Satu set fuzzy adalah satu set tanpa  jelas batas. Ini dapat berisi elemen dengan hanya sebagian derajat keanggotaan. Akar teori set fuzzy terletak pada ide variabel linguistik. Suatu variabel linguistik x ditandai oleh sebuah term-set yang berisi satu set nama x. Arti dari setiap nama diberikan oleh set fuzzy, ditandai dengan fungsi keanggotaan. Fungsi keanggotaan itu sendiri tergantung konteks. Mari kita pertimbangkan proposisi “yang lama buku itu murah ”. Di sini kami segera mengidentifikasi murah sebagai anggota dari set jangka variabel linguistik HARGA. Untuk
contoh,T (HARGA) = ¶ murah, sedang, mahal}.dimana nilai fuzzy murah, sedang, mahal ditandai dengan set fuzzy di alam semesta tertentu dari wacana U. Konsep variabel linguistik memungkinkan untuk simpan dan refleksikan informasi tersebut ke komputer. The fuzzy nilai-nilai variabel linguistik HARGA dapat dengan bebas diinterpretasikan tergantung pada konteks. Tentunya harga satu detik Buku hardcover tangan berbeda dari novel bekas penutup. Namun demikian, manusia memiliki kemampuan untuk menyesuaikan arti dari konteks kalimat tergantung. Variabel linguistic adalah variabel fuzzy. Misalnya, pernyataan “Ali itu tinggi man ”menyiratkan bahwa variabel linguistik yang diambil Ali nilai linguistik tinggi. Rentang nilai yang mungkin dari a variabel linguistik mewakili alam semesta wacana itu variabel. Misalnya, alam semesta wacana Tinggi variabel linguistik mungkin berkisar antara 6 dan 8 kaki. Sekarang, mari kita pertimbangkan pernyataan “x adalah positif yang sangat kecil integer ”sebagai contoh. x dikatakan dibatasi oleh saya, fuzzy set bilangan bulat positif yang sangat kecil, atau saya dikatakan sebagai membatasi set fuzzy x. Teori kemungkinan adalah teori yang menggunakan manusia umum akal untuk memperkirakan kemungkinan suatu peristiwa terjadi di bawah kondisi tertentu. Dalam teori kemungkinan, suatu peristiwa bisa terjadi direpresentasikan sebagai ekspresi yang mengandung variabel, suatu kondisi dapat diwakili dengan menggunakan set fuzzy yang membatasi, dan pada kemungkinan untuk suatu peristiwa terjadi di bawah kondisi tertentu bias diperkirakan oleh fungsi distribusi kemungkinan. Biarkan U menjadi semesta wacana, yang elemen generiknya dinotasikan U sebagai μ: U = {μ}. Satu set fuzzy F U ditandai oleh a fungsi keanggotaan μF yang berhubungan dengan masing-masing μ? U adalah nilai keanggotaan di [0, 1]. Sebagai contoh, kita dapat mendefinisikan fuzzy set "bilangan bulat positif yang sangat kecil" sebagaimana didefinisikan di bawah ini,

set uzzy. Variabel x dapat dibatasi oleh fuzzy set F. Kami menunjukkan pembatasan seperti £ (x, F) dan memanggil F membatasi set fuzzy x. £ (x, F) mengaitkan distribusi kemungkinan dengan x. Fungsi distribusi kemungkinan ) (μ π xF menandakan kemungkinan untuk x untuk mengambil nilai u di bawah batasan F. Secara numerik, fungsi distribusi x di bawah pembatasan F didefinisikan sama dengan fungsi keanggotaan dari F yaitu:
Pertimbangkan pernyataan "x adalah bilangan bulat positif yang sangat kecil" sebagai sebuah contoh. x dikatakan dibatasi oleh saya, himpunan fuzzy sangatbilangan bulat positif kecil, atau saya dikatakan sebagai set fuzz yang membatasi dari x. Fungsi distribusi kemungkinan π x (μ) didefinisikan seperti di bawah:
Fungsi π x (μ) Saya dapat digunakan untuk memperkirakan kemungkinan x untuk mengambil nilai di bawah batasan "sangat kecil positif bilangan bulat". Misalnya, ketika x dikenal sebagai sangat kecil bilangan bulat positif, kemungkinan untuk x menjadi 1 adalah 1,0, kemungkinan untuk x menjadi 2 adalah 0,9 dan seterusnya.

PENDEKATAN YANG DIUSULKAN
Kerangka pendekatan yang diusulkan diilustrasikan dalam Gambar 1. Dalam pendekatan ini, ulasan akan menjadi teks input. SEBUAH tinjauan dapat terdiri dari kata, kalimat, atau paragraf. Ini umum untuk menemukan pengkaji untuk menulis hanya satu kata, seperti "Hebat", "bagus" atau "tidak berguna". Resensi juga dapat menulis pendapatnya dalam satu kalimat, misalnya, “ruangan itu besar". Beberapa pengulas mungkin membutuhkan lebih banyak upaya saat menulis a ulasan. Pendapat mereka diungkapkan lebih dari satu kalimat. Sebagian besar waktu akan menjadi paragraf. Di penambangan pendapat, meskipun kata resensi hanya mengatakan satu kata, itu akan menjadi diambil sebagai ulasan. Pendekatan yang diusulkan terdiri dari 5 langkah utama. Langkah langkah termasuk, tokenizing kalimat, mengidentifikasi dan mengekstraksi SenWord, Menetapkan set fuzzy ke Sen-positif dan negative Word, Menghitung tingkat sentimen positif atau negative dan visualisasi. Sebuah leksikon dari kata sentimen (SenWord) adalah dikembangkan dan digunakan dalam proses identifikasi dan mengekstrak SenWord. Implementasi langkah-langkahnya juga disajikan di bawah ini. Langkah 1: Tokenisasi Kalimat Token tokenisasi dilakukan jika peninjauan dilakukan dalam bentuk sebuah kalimat atau paragraf. Meminjamkan kalimat adalah sebuah proses memecah kalimat menjadi daftar kata-kata. Dengan kata lain, a tokenizer mem-parsing kalimat ke dalam daftar token (kata-kata). Sebuah output dari proses tokenization kalimat akan disimpan dalam daftar dinamis. Secara teknis disimpan sebagai array. Buatan tangan aturan digunakan untuk menentukan kata yang memiliki dua bagian yang mungkin pidato. Jika sebuah kata dapat ditandai oleh lebih dari satu, bagian dari pidato, aturan buatan digunakan untuk menentukan yang paling kemungkinan bagian dari pembicaraan. Misalnya kata ‘tempat’ bias ditugaskan sebagai kata kerja serta kata benda. Aturannya 'jika yang sebelumnya kata adalah sebuah artikel, maka kata itu adalah kata benda, jika tidak itu adalah a kata kerja ', digunakan. Dalam karya ini, kami telah mengadopsi parsing dangkal teknik.
Langkah 2:
Ekstraksi SenWord Sentiment Word (SenWord) didefinisikan sebagai kata apa saja yang bias digunakan untuk mewakili sentimen negatif atau positif. Untuk anexample "luar biasa" biasanya digunakan untuk mewakili positif Sentimen sementara "miskin" biasanya digunakan untuk menggambarkan negative benda. Dalam mengidentifikasi SenWord, dalam ulasan / komentar, aleksikon SenWord telah dikembangkan. Setiap SenWord di leksikon dilekatkan dengan nilai derajat positif atau derajat negatif. Gambar 2 mengilustrasikan SenWord positif dengan nilainya, sementara Gambar 3 mengilustrasikan yang negative SenWord dengan nilainya. Nilai-nilai menunjukkan tingkat gelar SenWord positif atau negatif. Untuk membuat komputasi proses lebih ekonomis, hanya kata yang ditandai dengan Bagian dari Pidato kata keterangan dan kata sifat dalam daftar dinamis dipetakan ke SenWord yang disimpan dalam leksikon.
Langkah 3:
Tetapkan Set Fuzzy Positif / NegatifGambar 4 menunjukkan contoh ulasan. Sebuah kata miring menunjukkan SenWord. Ulasan dapat berisi satu atau lebih SenWord. Misalnya, dalam Tinjau 4 dan 6 (lihat Gambar 4), itu hanya berisi 1 SenWord, sedangkan Ulasan 5 berisi 6 SenWords. Setiap SenWord dilampirkan dengan tingkat nilai positif atau negatif seperti yang ditunjukkan pada Gambar 2 dan Gambar 3 berdasarkan polaritasnya. Akal sehat dan linguistik manusia pengetahuan telah digunakan dalam menentukan nilai derajat. Jika SenWord diakui sebagai SenWord positif, kemudian positif nilai akan dilampirkan, jika tidak, nilai negatif dilampirkan.
Kumpulan tinjauan fuzzy diformulasikan seperti dalam
(1).FR = {(wi, μR (wi) (1)
Dengan demikian serangkaian Tinjauan 4 yang samar-samar dalam Gambar 4 dapatdiformulasikan seperti pada (2)
nFR4 = {(luar biasa, 0,8), (hebat, 0,9)} (2)
Langkah 4: Hitung Tingkat SenWord Tingkat sentimen pendapat dalam tinjauan diperoleh dengan menghitung tingkat SenWord. Dalam pendekatan ini, fuzzy Operator maksimal digunakan untuk menentukan level positif atau negative gelar dalam ulasan. Menggunakan operator fuzzy maks, positif tingkat Ulasan 4 adalah 0,9. Persamaan 3, menunjukkan bagaimana maks Operator fuzzy diterapkan.
FR4 = maks {0,8, 0,9} (3)
Langkah 5:
VisualisasiVisualisasi telah disetujui oleh banyak ilmuwan sebagaicara efektif untuk mengkomunikasikan pesan. Derajat dari sentimen dalam satu set opini dapat divisualisasikan dalam banyak hal formulir. Misalnya, semua pendapat yang diekstraksi dapat diwakili dalam satu grafik.

IMPLEMENTASI DAN PERCOBAAN
Pendekatan yang diusulkan telah diterapkan menggunakanVisual C ++. Setiap langkah dalam modul yang diusulkan telah diimplementasikan sebagai modul terpisah dari prototipe. Di Bereksperimen dengan pendekatan yang diusulkan kami telah mengumpulkan 39 ulasan untuk satu hotel yang terletak di Aqaba, Yordania. Ini ulasan dibuat oleh orang-orang yang tinggal di hotel itu selama liburan mereka atau tinggal di Aqaba. Ulasan ini bebas dapat diakses melalui internet. 39 ulasan digunakan sebagai test case dalam percobaan pendekatan yang diusulkan. Gelar setiap ulasan telah dikumpulkan dan disimpan dalam bentuk excel untuk tujuan visualisasi. Gambar 5 menunjukkan hasil dari diekstraksi pendapat dari 39 ulasan hotel. Dengan melihat pada grafik kita dapat menentukan bahwa keseluruhan ulasan hotel adalah mendekati 1 derajat. Ini menunjukkan bahwa keseluruhan pendapat tentang hotel dapat disajikan sebagai luar biasa, bagus, luar biasa atau hebat.



KESIMPULAN DAN SARAN
Makalah ini telah menyajikan pendekatan baru untuk penambangan opini dari ulasan. Teori kemungkinan telah terjadi digunakan dalam menentukan tingkat derajat masing-masing positif atau SenWord negatif, dan set fuzzy telah diterapkan ke satu set kata sentimen yang ditemukan dalam ulasan. Itu teknik visualisasi telah digunakan untuk menggambarkan ekstraksi pendapat. Hasil eksperimen menunjukkan bahwa pendekatan berhasil. Pekerjaan masa depan dari penelitian ini adalah untuk memperbesar leksikon fuzzy, mengevaluasi pendekatan yang diusulkan menggunakan lebih banyak ulasan dan menggunakan pengetahuan konteks untuk menentukan sebuah frase sentimen dalam ulasan.

No comments:

Post a Comment