Pengertian analisis teks |
Apakah rekans pernah bertanya-tanya seperti pada gambar di atas?
Jika pernah, berikut ini saya coba tuliskan artikel sederhana untuk rekans yang pernah bertanya-tanya dan ingin tahu pengertian analisis teks.
Baik tanpa basa-basi lagi berikut pembahasannya.
Pengertian Analisis Teks
Analisis teks adalah suatu aktivitas menganalisis data teks seperti email, blog, tweet, forum dan bentuk lainnya. Teks dapat dimasukkan kedalam kategori data tidak terstruktur ( kita bisa sebut dengan unstructured-data ). Dikarenakan pembahasan pengertian analisis teks tidak lengkap jika tidak membahas juga apa itu unstructured-data, untuk itu unstructured-data akan saya bahas lebih lanjut di bawah.
Apa itu unstructured-data?
Mengapa untuk mengerti analisis teks kita perlu tahu tentang unstructured-data, hal ini karena data teks atau unstructured-data memiliki beberapa ciri yang memperngaruhi cara kita dalam melakukan analisis teks.
Jika anda sering menggunakan teknologi database sebelumnya, maka rekans pastinya sudah terbiasa dengan data terstrutur (kita sebut : structured-data).
Jumlah data dari structured-data jauh lebih sedikit jika dibanding dengan unstructured-data, hal ini jika memperhatikan begitu besarnya jumlah artikel blog, status di sosial media seperti facebook, twitter, linkedin, dll, dokumen yang di buat, email yang dikirim setiap hari.
Rekans bisa bayangkan jika dalam sehari hampir 2 juta lebih artikel blog di buat, 500 juta tweet (belum lagi dari social media lainnya), 100 milyar email dikirim. Dari sini bisa kita ketahui begitu besarnya jumlah unstructured-data jika dibandingkan terhadap structured-data.
Apa pentingnya unstructured-data tersebut bagi kita?
Untuk bisa melihat pentingnya unstructured-data kita perlu tahu beberapa contoh informasi penting yang bisa kita dapat dari unstructured-data.
Dalam setiap dokumen selalu ada informasi yang tersembunyi di dalamnya, kita ambil contoh dokumen laporan keuangan triwulan dari suatu perusahaan, dari dokumen tersebut kita bisa mendapatkan informasi penting seperti statistik pendapatan atau nama-nama orang penting dari perusahaan.
Contoh informasi penting lain adalah kita bisa tahu pola komunikasi yang sangat penting dari unstructured-data, informasi penting ini bisa berupa kebiasaan orang dalam bekomunikasi yaitu bagaimana mereka menyampaikan opini ketika berkomunikasi baik dalam email, status di social media. Informasi ini sangatlah penting sebagai alat bantu dalam bidang marketing, pengukuran kepuasan pelanggan, mengetahui minat dari seseorang, dan berbagai manfaat lainnya.
Masalah yang dihadapi dari unstructured-data
Namun untuk mendapatkan informasi penting dari tipe data ini tidak semudah dari tipe structured-data. Hal ini karena karakter utama dari unstructured-data adalah mudah dipahami bagi manusia namun sulit bagi komputer atau mesin.
Mengapa lebih sulit bagi komputer dalam memahami unstructured-data?
Jika dibandingkan dengan structured-data yang disusun dalam bentuk tabel, di mana sudah di definisikan atribut-atrbut dari data seperti nama atribut dan tipe data (seperti integer, Decimal, Text, Numeric, dll ) dari atribut tersebut. hal ini mudah bagi komputer untuk memahaminya.
Namun sifat utama dari unstructured-data adalah tidak memiliki atribut tipe data spesifik seperti pada structured-data, hanya berupa sekumpulan text saja.
Lalu, bagaimana manusia bisa tahu makna dari unstructured-data?
Manusia bisa tahu melalui konteks dari kalimat atau teks tersebut.
Ambil contoh pada kalimat "Dana baru saja mendapatkan dana segar", kita bisa dengan mudah memahami bahwa kata Dana bermakna berbeda secara konteks dalam kalimat tersebut. Namun bagi komputer kata dana adalah merupakan kata yang identik.
Perbandingan structured-data vs unstructured-data |
Lalu bagaimana kita menganalisis unstructured-data tersebut jika ternyata tidak mudah bagi komputer?
Tenang..dulu mungkin sulit, namun saat ini sudah banyak berkembang teknologi yang mampu membantu analisis teks, apalagi dewasa ini dengan semakin berkembang dan booming-nya teknologi Big Data. Untuk informasi tambahan akan saya coba sebutkan di bawah contoh-contoh teknologi yang bisa kita gunakan untuk analisis teks ini.
Pertanyaan yang muncul selanjutnya untuk apa kita perlu melakukan analisis teks?
Manfaat analisis teks
Untuk dapat menjawab pertanyaan mengapa perlu melakukan analisis teks adalah karena proses ini akan memberikan manfaat yang cukup berarti bagi sebagian besar industri atau kepentingan lainnya seperti politik misalnya. Sebagai contoh, berikut beberapa kegunaan yang diperoleh dari aktivitas analisis teks.
- Jika perusahaan rekans ada kecurigaan tentang kemungkinan rahasia perusahaan yang bocor ke pesaing oleh karyawan sendiri, maka perusahaan dapat menganalisis jutaan email karyawan perusahan untuk mendeteksi lebih awal kemungkinannya.
- Jika rekans ingin mengetahui kesulitan/keluhan yang dihadapi oleh pelanggan ketika menggunakan produk rekans, maka rekans dapat menganalisis komentar dan pertanyaan mereka di forum ataupun di social media.
- Jika rekans ingin mengukur dan membandingkan persepsi positif atau negatif terhadap perusahaan, merek, atau produk, maka rekans dapat melakukan analisis sentimen (Sentiment Analytics) menggunakan analisis teks.
- Jika rekans ingin mengukur dan membandingkan persepsi masyarakat terhadap calon pemimpin suatu daerah, ambil contoh yang sedang hot saat saya menulis artikel ini adalah pemilihan gubernur Jakarta. Pak Basuki Tjahaja Purnama (Ahok) atau lawannya seperti Sandiaga Uno bisa memanfaatkan analisis teks sebagai bagian strategi penting dalam mendukung kemenangannya masing-masing.
- dan masih banyak lagi contoh manfaat dari melakukan analisis teks.
Teknologi analisis teks yang tersedia
Dengan banyaknya teknologi yang tersedia saat ini, ketika memilih teknologi analisis teks yang akan kita gunakan bisa tergantung dari tiga faktor berikut ini.
- Tipe data yang akan diolah
- Informasi penting apa yang ingin di ektraks
- Lingkungan teknologi yang akan digunakan
Berikut ini beberapa contoh teknologi yang bisa digunakan untuk keperluan analisis teks
- Pig
- JAQL
- AQL
- Phyton Natural languange Toolkits (NLTK)
- General Architecture for Text Engineering (GATE)
- QDA Miner Lite
- TAMS Analyzer
- Carror2
- CAT
- KH Coder
Untuk tiga teknologi paling atas termasuk alat bantu yang tersedia pada lingkungan teknologi Big Data dan Hadoop. sebenarnya masih banyak tools atau teknologi selain 10 teknologi diatas, namun untuk artikel ini saya coba sebutkan list diatas sebagai contoh saja.
Demikian artikel ini saya tulis, jika rekans merasa bermanfaat, tentu dengan senang hati saya perbolehkan rekans untuk share ataupun like artikel ini.
0 Response to "Menjelaskan Pengertian Analisis Teks dan Manfaat Analisis Teks"
Post a Comment