Business Intelligence
pengertian data warehouse
- Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari berbagai macam sumber.
- Jadi, Data Warehouse merupakan motode dalam perancangan database yang menunjang DSS (Decission Support System) dan EIS (Executive Information System). Data warehouse adalah database yang berisi data dari beberapa system operasional yang terintegrasi dan terstruktur sehingga dapat digunakan untuk mendukung analisa dan proses pengambilan keputusan dalam bisnis. Data warehouse didesain untuk dapat melakukan query dengan cepat. Informasi diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat trend (kecenderungan)
Istilah-istilah yang berkaitan dengan data warehouse antara lain
- DATA MART
- DATA MINING
- DATA WAREHOUSE
- DATA OLAP (Online Analytical Processing)
- DATA MOLAP (Multimentional Olap)
- DATA ROLAP (Relational Olap)
- BUSSINESS INTELLIGENCE (Relational Olap)
- DATA HOLAP (Heybrid Olap)
Pengertian dari istilah-istilah tersebuat adalah
DATA MART
Data mart adalah repositori dari data dikumpulkan dari database yang selanjutnya dapat melayani tujuan dari suatu kepentingan tertentu atau kelompok tertentu. Dalam pengembangan perangkat lunak produk, Data mart membantu dalam memenuhi tuntutan spesifik dari kelompok pengguna dalam hal konten, akses analisis, dan presentasi secara keseluruhan.
Terminologi
Sebuah gudang data adalah agregasi pusat data (yang dapat didistribusikan secara fisik); data mart adalah gudang data yang mungkin atau tidak mungkin berasal dari sebuah gudang data dan yang menekankan kemudahan akses dan kegunaan untuk tujuan tertentu yang dirancang. Secara umum, data warehouse cenderung menjadi konsep strategis tetapi agak belum selesai; data mart cenderung taktis dan ditujukan untuk memenuhi kebutuhan segera. Seorang penulis, Marc Demarest, menunjukkan menggabungkan ide-ide ke dalam Universal Data Arsitektur (Uda). Dalam prakteknya, banyak produk dan perusahaan yang menawarkan layanan data gudang juga cenderung untuk menawarkan kemampuan data mart atau jasa.
Ada dapat beberapa data mart di dalam sebuah perusahaan tunggal; unit bisnis masing-masing yang relevan dengan satu atau lebih untuk yang dirancang. DMS mungkin atau mungkin tidak tergantung atau terkait dengan pasar data lain dalam sebuah perusahaan tunggal. Jika data mart ini dirancang menggunakan fakta sesuai dan dimensi, maka mereka akan terkait. Dalam beberapa penyebaran, masing-masing departemen atau unit bisnis dianggap sebagai pemilik data mart, termasuk semua perangkat keras, perangkat lunak dan data. Hal ini memungkinkan setiap departemen untuk menggunakan, memanipulasi dan mengembangkan data mereka dengan cara apapun mereka mau.; Tanpa mengubah informasi dalam pasar data lain atau data warehouse. Dalam penyebaran lain di mana dimensi sesuai digunakan, kepemilikan unit usaha ini tidak akan terus berlaku untuk dimensi bersama seperti pelanggan, produk, dll
The spreadmart istilah yang terkait menggambarkan situasi yang terjadi ketika satu atau lebih bisnis analis mengembangkan sistem spreadsheet terkait dengan melakukan analisis bisnis, kemudian tumbuh ke ukuran dan tingkat kompleksitas yang membuat hampir tidak mungkin untuk mempertahankan.
Kelebihan
Mart data memiliki berbagai keuntungan. Ini adalah terutama sebagai berikut:
1. Akses mudah ke data yang sering digunakan.
2. Penciptaan pandang kolektif untuk sekelompok pengguna.
3. Peningkatan respon-time dari pengguna akhir.
4. Fleksibel dan mudah cara pembuatan.
5. Lebih hemat biaya daripada Data warehouse.
6. Definisi pengguna lebih jelas dari sebuah gudang data.
Kekurangan
Data mart memiliki kelemahan tertentu juga. Data mart tidak bisa sepenuhnya menilai kinerja LAN berbasis sistem manajemen database sementara port dari satu lingkungan yang lain. Juga, data mart dapat mendukung kelompok-kelompok pengguna kecil atau sederhana sumber data, yang tidak ideal untuk aplikasi perangkat lunak didistribusikan dan pengembangan skala besar Perusahaan-lebar sistem manajemen database.
DATA MINING
Istilah data mining sudah berkembang jauh dalam mengadaptasi setiap bentuk analisa data. Pada dasarnya data mining berhubungan dengan analisa data dan penggunaan teknik-teknik perangkat lunak untuk mencari pola dan keteraturan dalam himpunan data yang sifatnya tersembunyi. Data mining diartikan sebagai suatu proses ekstraksi informasi berguna dan potensial dari sekumpulan data yang terdapat secara implisit dalam suatu basis data. Banyak istilah lain dari data mining yang dikenal luas seperti knowledge mining from databases, knowledge extraction, data archeology, data dredging, data analysis dan lain sebagainya [AGR-93].
Kelebihan
Ø Kemampuan dalam mengolah data dalam jumlah yang besar.
Ø Pencarian Data secara otomatis.
Kekurangan
¨ Kendala Database ( Garbage in garbage out ).
¨ Tidak bisa melakukan analisa sendiri.
DATA WEREHOUSE
Data warehouse adalah suatusistem komputer untukmengarsipkan dan menganalisis datahistoris suatu organisasi seperti data penjualan, gaji, dan informasi lain dari operasi harian. Pada umumnya suatu organisasi menyalin informasi dari sistem operasionalnya (seperti penjualan dan SDM) ke gudang data menurut jadwal teratur, misalnya setiap malam atau setiap akhir minggu. Setelah itu, manajemen dapat melakukan kuerikompleks dan analisis (contohnya penambangan data, data mining) terhadap informasi tersebut tanpa membebani sistem yang operasional.
Struktur database Warehouse
Kelebihan
Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini (Ramelho).
- Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
- Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
- Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
- Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
- Membangun data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan, karena data warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut melebihi pesaing-pesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean Nolan,Tom Huguelet):
Kekurangan
Data warehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
Ø Data perlu di ekstrak, diubah (ETL) dan di load ke datawarehouse sehingga membutuhkan tenggang waktu untuk memindahkannya.
Ø Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah datawarehouse.
Ø Datawarehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.
DATA OLAP
OLAP menawarkan metode analisis data secara kompleks dan terkustomisasi yang disesuaikan dengan kebutuhan akan informasi oleh para analis maupun eksekutif. Data yang dikelola oleh OLAP berasal dari data warehouse. Pengguna OLAP umumnya memanfaatkan OLAP dengan pola analisis seperti berikut ini :
1) Meringkas dan mengumpulkan sejumlah besar data.
2) Melakukan filtering, pengurutan, dan memberikan peringkat (rangking).
3) Membandingkan beberapa set dari data.
4) Membuat sketsa/bagan/diagram.
5) Menganalisis dan menemukan pola dari data.
6) Menganalisis kecenderungan data
Kelebihan
Berbagai kelebihan bisa didapat dengan menggunakan OLAP ini diantaranya :
1. Dapat meningkatnya produktivitas bisnis, IT developers, dan seluruh organisasi.
2. Akses yang lebih terkendali terhadap informasi yang dapat meningkatkan efektivitas pengambilan keputusan.
3. Mempercepat respon terhadap permintaan pasar.
4. Mengurang “backlog”pengembangan aplikasi bagi staf IT dengan membua tpemakai akhir dapat merubah schema dan membangun model sendiri.
5. Penyimpana pengawasan organisasi melalui integritas data koorporasi sebagai aplikasi OLAP tergantung pada data warehouse dan sistem OLTP untuk memperbaharui sumber tingkatan data mereka.
6. Mengurangi aktifita squery dan lalulintas jaringan pada sistem OLTP atau pada data warehouse.
7. Meningkatkan hasil dan keuntungan secara potensial dengan mengizinkan organisasi untuk merespon permintaan pasarlebihcepat.
DATA MOLAP
MOLAP adalah tipe OLAP yang memiliki storage sendiri, yang isinya merupakan precomputed agregasi data – sum, count, min, max, dan sebagainya – yang terlibat pada berbagai level detil. Storage ini berupa format yang hanya dikenali oleh MOLAP server tersebut dan telah khusus dioptimalkan untuk penggunaan oleh aplikasi tersebut.
Cara kerja MOLAP secara umum dibagi ke dalam dua tahap sebagai berikut :
- Tahap konstruksi dan populasi data, pada tahap ini sumber data akan dibaca, dilakukan perhitungan agegrasi (summary group) pada berbagai level dimensi, dan hasilnya akan disimpan di storage MOLAP. Jika objek data diperumpamakan dengan table, maka untuk satu cube akan banyak fragmen table yang isinya adalah detil agregasi dari level tertentu.
- Tahap query atau layanan permintaan data analisis, pada tahap ini OLAP Server akan melayani permintaan query dari client dan membaca data dari storage MOLAP. Table yang akan dibaca adalah suatu fragmen yang akan disesuaikan dengan permintaan dari client. Pada fase query ini, jika OLAP Server terputus dengan data source tidak apa-apa karena sudah tidak ada kaitannya.
HOLAP (Hybrid OLAP)
HOLAP hadir untuk mengatasi kelemahan dari ROLAP dan MOLAP, kelemahan tersebut adalah :
- Performa ROLAP tidak begitu baik karena agregasi selalu dilakukan ulang apabila cache sudah expired.
- Keterbatasan storage dari MOLAP jika digunakan untuk menyimpan kombinasi agregasi pada semua level.
Jadi HOLAP merupakan kombinasi atau “jalan tengah” antara keduanya dimana HOLAP akan menyimpan data precomputed aggregate pada media penyimpanan (storage) HOLAP sendiri.
DATA ROLAP
ROLAP adalah tipe OLAP yang bergantung kepada database relasional atau RDBMS (Relational Database Management System) sebagai media penyimpanan (storage) data yang akan diolah. Dengan strategi tersebut maka OLAP Server terhindar dari masalah pengelolaan data storage dan hanya menerjemahkan proses query analysis (MDX) ke relational query (SQL). Otomatis proses optimasi ROLAP akan sangat ditentukan di sisi produk RDBMS yang digunakan misalkan dari sisi penanganan jumlah data dan strategi indexing.
Kelebihan dan kekurangan
Keuntungan dari ROLAP ini adalah tidak memerlukan storage tambahan. Namun kelemahannya adalah jika data untuk suatu cube sangat besar (masif) maka performa pengambilan data akan cukup buruk.
Cara kerja ROLAP secara umum adalah sebagai berikut :
1) OLAP client mengirimkan query analisis ke OLAP Server.
2) OLAP server akan melakukan pemeriksaan di cache apakah sudah bisa melayani permintaan query dari client tersebut, jika sudah akan dikirimkan.
3) Jika pada cache belum terdapat data diminta, akan dilakukan query SQL ke data mart dan hasil eksekusinya disimpan di cache dan dikirimkan kepada client. Demikian seterusnya.
4) Cache akan disimpan selama periode waktu tertentu dan akan dibersihkan total jika server dimatikan
BUISSINES INTELLIEGENCE
Menurut Nadia Branon, Business Intelligence merupakan kategori yang umum digunakan untuk aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisa, dan menyediakan akses pada data agar dapat membantu pengguna dari kalangan perusahaan agar dapat mengambil keputusan dengan lebih baik dan tepat. Dari definisi itu, dapat dikatakan bahwa Business Intelligence merupakan suatu sistem pendukung keputusan yang berdasarkan pada data-data fakta kinerja perusahaan. Business Intelligence berguna untuk mengefisienkan finansial, manusia, material serta beberapa sumber daya lainya.
Kegunaan BI
Perusahaan menggunakan BI untuk memperoleh lebih dalam lagi mengenai segala informasi yang berhubungan dengan kinerja bisnis. Hal ini digunakan untuk memahami, meningkatkan kinerja, penganggaran biaya yang lebih efisien dan mengidentifikasi peluang bisnis baru. Beberapa hal kegunaan BI, antara lain:
a. Analisa dalam perilaku konsumen, pola pembelian dan trend penjualan.
b. Mengukur, melacak dan memprediksi penjualan dan kinerja keuangan.
c. Penganggaran, perencanaan keuangan dan peramalan.
d. Mengetahui kinerja kegiatan pemasaran.
e. Optimalisasi proses dan kinerja operasional.
f. Meningkatkan efektifitaspengiriman dan pasokan.
g. Analisa CRM (Customer Relationship Management).
h. Analisa Resiko.
i. Analisa nilai strategis
j. Analisa social media
Perusahaan yang merepkan BI antara lain:
1) PT Indosat Sales Area Kota Mojokerto.
2) Blue Bird Group.
3) Bank Indonesia.
4) PT. Garuda Indonesia.
5) PT.Indofood.
6) PT Coca Cola Distribution Indonesia.
7) Ayala Corporation dari Filipina.
BI merupakan produk dari SAP ERP, product ini gunanya untuk menyimpan data + reporting yang berasal dari SAP ERP atau sistem lainnya seperti MsSql, Oracle, dll.
DATA HOLAP\
HOLAP membagi data anatara tabel relational dan tempat penyimpanan khusus. HOLAP hadir untuk mengatasi kelemahan dari ROLAP dan MOLAP, kelemahan tersebut adalah :
- Performa ROLAP tidak begitu baik karena agregasi selalu dilakukan ulang apabila cache sudah expired.
- Keterbatasan storage dari MOLAP jika digunakan untuk menyimpan kombinasi agregasi pada semua level.
Jadi HOLAP merupakan kombinasi atau "jalan tengah" antara keduanya dimana HOLAP akan menyimpan data precomputed aggregate pada media penyimpanan (storage) HOLAP sendiri. Yang disimpan pada storage HOLAP adalah data untuk beberapa level teratas atau high level view. Sedangkan untuk level yang lebih rendah atau lebih rinci akan disimpan di database relasional