Selasa, 29 Januari 2013

Data WareHouse

A. Pengertian data warehouse


Gudang data (Bahasa Inggris: data warehouse) adalah suatu sist em komputer untuk mengarsipkan dan menganalisis data historis suatu organisasi seperti data penjualan, gaji, dan informasi lain dari operasi harian. Pada umumnya suatu organisasi menyalin informasi dari sistem operasionalnya (seperti penjualan dan SDM) ke gudang data menurut jadwal teratur, misalnya setiap malam atau setiap akhir minggu. Setelah itu, manajemen dapat melakukan kueri kompleks dan analisis (contohnya penambangan data, data mining) terhadap informasi tersebut tanpa membebani sistem yang operasional.



Pengertian secara singkat :Data Warehouse : metode penyimpanan data dalam skala yang sangat besar..Data Mining : metode pencarian pengetahuan baru yang terkandung dalam data yang sangat besar OLAP : salah satu cara membuktikan pengetahuan baru yang didapatkan oleh data mining..Data yang terdapat dalam data warehouse dapat dibagi perbagian sesuai dengan kebutuhan dalam informasi. Inilah yang dsebut dengan data martData mart memiliki karakteristik yang sama dengandata warehouse, perbedaannya hanya terdapat pada jumlah data yang dimiliki. Dalam data mart, data yang ada hanya berasal dari satu bagian atau satu departemen saja, sedangkan pada data warehouse, data yang ada berasal dari seluruh bagian dalam perusahaan tersebut.Dalam pembuatan data warehouse, ada dua pendekatan yang dapat digunakan, yaitu :

  1. Pendekatan Top Down (Top Down Approach)
    Pendekatan ini dilakukan dengan membuat perancangan data warehouse terlebih dahulu secara keseluruhan. Dalam pembuatannya, ditentukan apa yang menjadi sumber data dan bagaimana cara untuk memasukkannya ke dalam data warehouse yang telah dirancang terlebih dahulu. Pendekatan ini menyatakan bahwa pembangunan desain arsitektur data warehouse adalah hal pertama yang dilakukan dalam membangun suatu data warehouse.
  2. Pendekatan Bottom Up (Bottom Up Approach)
    Berbeda dengan pendekatan Top Down, pendekatan ini menyatakan bahwa data warehouse berawal dari kumpulan data mart yang telah dibangun terlebih dahulu untuk masing-masing departemen.Data mart yang telah dibangun kemudian digabungkan untuk membangun suatu data warehouseyang utuh. 
B. Hubungan data mining dengan data warehouse

  • Data mining memerlukan data yang banyak untuk di analisa dan mendapatkan pattern2 tertentu, nah datanya dari datawarehouse yang menyimpan banyak data. nah DataWareHouse pake OLAP ini biar lebih cepet pemrosesannya CMIIW.
  • Data warehouse merupakan suatu sistem yang mengkonsolidasikan data secara periodik dari sistem-sistem yang ada (OLTP) ke dalam suatu penyimpanan dimensional. Pada umumnya, data warehouse menyimpan data histori beberapa tahun dan diquery untuk keperluan business intelligence atau aktifitas analisis lainnya. Data warehouse diremajakan secara batch, tidak serta-merta setiap terjadinya transaksi pada sistem-sistem sumber tersebut.
Data warehouse sebagai sumber data pada data mining dan OLAP, bukanlah data mentah, data tersebut telah melalui preprocessing (akan diterangkan lebih lanjut di seri selanjutnya), yaitu cleaning, integrasi, dan konversi. Proses ini lebih dikenal dengan Extract – Transform – Load (ETL).Extract mengambil data dari bermacam-macam jenis dan sumber data, transform membuat perubahan yang meningkatkan kualitas data, load memasukkan data yang sudah diubah (transform) ke data warehouse.


C. Perbedaan datawarehousing dan data mining

Data warehouse dan data mining adalah dua hal yang berbeda. data warehouse adalah database biasa yang berisi summary atau rekap untuk subject tertentu yang sudah diketahui. misalnya manajemen ingin mengetahui informasi tentang penjualan produk, maka dalam data warehouse dimasukkan rekap data penjualan dari database transaksi penjualan. bentuknya pun tabel biasa saja. tabel rekap ini hanya boleh diretrieve (diambil datanya) dan ditambah, tidak boleh diubah, atau di hapus. rekap ini biasanya akan ditampilkan dalam bentuk tabel, grafik, chart di dashboard (aplikasi Business Intelligence).


Data mining adalah proses pengolahan data untuk mendapatkan informasi yang belum diketahui informasi apa saja yang terdapat di kumpulan data tersebut. data mining dapat dilakukan terhadap berbagai jenis sumber data, misalnya data warehouse, artikel web, multimedia (gambar, suara, video), atau dokumen (files). data mining dilakukan dengan mengimplementasikan algoritma-algoritma data mining (akan dibahas di artikel lain) untuk mendapatkan informasi yang tidak terlihat dengan pengamatan langsung (perlu pengolahan lebih lanjut)



D. Tujuan membuat DatawarehouseTujuan ini membuat data warehouse harus memiliki beberapa sifat (referensi: Inmon, Turban) yaitu:

  1. Non volatile
  2. Berisi data bersih
  3. Terintegrasi
  4. standardized format
  5. enterprise-wide
  6. time variant
  7. subject oriented

Data warehouse menggunakan 3 macam pemodelan, yaitu
  1. star schema: adalah desain/skema dari satu fact table yang dikelilingi beberapa dimension table
  1. snow flake schema: adalah desain lanjutan dari star schema, digunakan jika ada dimension table yang memiliki struktur bertingkat-tingkat (leveling) misalnya [propinsi, kabupaten, kecamatan, kelurahan], [tanggal, bulan, kuarter, semester, tahun], atau [negara, pulau, kota]
  1. fact constellation: ini jika dalam satu skema terdapat beberapa fact table yang saling berbagi dimension table, ini mirip sekali dengan desain relational database, namun  fact table hanya menyimpan data yang akan diolah lebih lanjut di data mining dan OLAP

Pada data warehouse tidak digunakan istilan entity, istilah yang digunakan adalah fact table dan dimension table.
  1. fact table adalah tabel yang berisi semua data yang ingin dan dapat diolah, misalnya jumlah penjualan, gaji pegawai, nilai pengadaan dan seterusnya.
  2. dimension table adalah pengelompokkan untuk data yang ada di fact table, misalnya lokasi toko, usia pembeli, nama departemen, jenis pengadaan dan seterusnya

Keuntungan DatawarehouseDatawarehouse menyediakan model data yang bervariasi, dan tidak bergantung pada satu sumber data saja. Hal ini memudahkan pimpinan perusahaan/manager membuat laporan dan menganalisa. Saat me-load data ke dalam datawarehouse, data yang tidak konsisten akan diketahui dan secepatnya dirubah. Mendukung proses pembuatan laporan, agar keputusan yang diambil adalah keputusan yang benar sesuai data. Keamanan informasi didalam datawarehouse terjamin, karena datawarehouse selalu digunakan dan dimonitor oleh pengguna datawarehouse tersebut. Dalam membuat laporan tidak membuat proses transaksi yang ada menjadi lambat, karena datawarehouse terpisah dengan database operasional. Datawarehouse menyediakan berbagai macam bentuk laporan yang terbaru.


Kerugian Datawarehouse

  1. Datawarehouse tidak cocok untuk data yang tidak struktur.
  2. Data perlu di extract, diubah, dan di load ke datawarehouse, sehingga membutuhkan waktu (delay) kerja untuk datawarehouse yang belum terbentuk.
  3. Semakin lama masa hidup bisnis yang menggunakan datawarehouse, maka semakin banyak biaya yang dikeluarkan oleh perusahaan untuk memodifikasi teknologi datawarehouse atau perawatan berjalan datawarehouse.
  4. Jika data yang diambil lambat, maka data yang dimiliki di datawarehouse tidak berkulitas/ sehingga laporan tidak optimal.


Download : Data WareHouse

1 komentar:

  1. Graton Casino & Hotel - Mapyro
    Graton Casino & Hotel in Graton, LA is a 5-minute walk from Graton Casino 경주 출장안마 & Hotel. It also features a coffee shop and a wellness center. Rating: 8.1/10 안성 출장샵 · 계룡 출장안마 ‎1,903 reviews 안양 출장샵 · 서산 출장마사지 ‎Price range: $$$How is Graton Casino & Hotel rated?What days are Graton Casino & Hotel open?

    BalasHapus

 

Mee. Copyright 2012 All Rights Reserved