نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه آموزشی علم اطلاعات و دانش شناختی، دانشگاه رازی، کرمانشاه،

2 دانشگاه علوم پزشکی و خدمات درمانی و بهداشتی زنجان، ایران

چکیده

کیفیت اطلاعات در موفقیت تجزیه و تحلیل اطلاعات بسیار حیاتی و مهم است. اطلاعات بارگذاری شده در انبارداده باید صحیح، دقیق و با کیفیت باشد. داده با کیفیت در انباره داده موجب تحلیل مناسب و تصمیم‌گیری بهتر می‌‌شود. همچنین مباحث کیفیت داده باید قبل از بارگذاری در انباره داده مورد توجه قرار بگیرد. پاکسازی داده به مفهوم یافتن و حذف خطاها است. همچنین در این فرایند داده-های اضافی و ناسازگار شناسایی می‌شوند. پاکسازی‌داده در مرحله استخراج، انتقال، بارگذاری با اطمینان از کیفیت داده در انباره‌داده موجبات اثربخشی هوشمندی کسب‌وکار را فراهم می‌آورد. هدف پاکسازی‌داده، شناسایی داده‌های بد (اشتباه، نامرتبط و ناقص) به منظور اصلاح یا حذف آن‌ها است تا از دقت و سازگاری مجموعه داده اطمینان حاصل شود. این پژوهش با هدف تشریح و تبیین روش پاکسازی داده برای حذف داده‌های بد انجام شده است. بانک‌اطلاعاتی نمونه از اطلاعات بیماری‌های استان‌های زنجان، ایلام وهمدان تشکیل شده است. به منظور حل مشکلات داده در بانک نمونه از فرم سی‌شارپ و ابزاهای نرم افزار اس‌کیوال استفاده شده است. بخش اصلی نتایج نشان می دهد که بکارگیری روش پاکسازی داده موجب کاهش میزان خطای بانک داده تا میزان 008/0 درصد شده است.

کلیدواژه‌ها

 
[1] Al Farsi, Budour Ahmed; Saini, Dinesh Kumar. Business Intelligence Design Model (BIDM) for University. International Journal of Computer Applications, Vol. 111 , No 14, (2015),pgs.43-49
[2]Ghazanfari.M,M.Jafari.M, Rouhani.S.A tool to evaluate the business intelligence of enterprise systems.Scientia Iranica Transactions E(Industrial Engineering), Vol.16, No.6, )2011(, pgs.1579–1590
[3] Golfarelli , Matte.New Trends in Business Intelligence.Conference: Proceedings of the 28th International Convention MIPRO (BIS&DE&ISS), MIPRO 2005,)May 30-June 03, 2005(, Opatija, Croatia, https://www.researchgate.net/publication/ 221535705_New_Trends_in_Business_Intelligence , 2016/29/01
[4] Rupali Gil,R; Singh,J.A Review of Contemporary Data Quality Issues in Data Warehouse ETL Environment. Journal on Today’s Ideas Tomorrow’s Technologies,Vol. 2, No. 2,) 2014(, pgs.153-160
[5] Ong1, In Lih; Siew, Pei Hwa; Wong, Siew Fan.A Five-Layered Business Intelligence Architecture.IBIMA Publishing,Vol.2011, http://www.ibimapublishing .com/journals/CIBIMA/cibima.html,2016/29/01
[6] Kalelkar, Medha; Churi, Prathamesh; Kalelkar, Deepa. Implementation of Model-View-Controller Architecture Pattern for Business Intelligence Architecture. International Journal of Computer Applications, Vol.102, No.12, )2014(, pgs.16-21
[7] Anand , Nitin. ETL and its impact on Business Intelligence. International Journal of Scientific and Research Publications, Vol. 4, Issue 2, )2014(, pgs.1-3
[8] Tank, Darshan M; Ganatra, Amit; Kosta, Y P. Speeding ETL Processing in Data Warehouses Using High-Performance Joins For Changed Data Capture (CDC). International Conference on Advances in Recent Tecnologic in Communication and Computing, )2010( International Conference on Source: IEEE Xplore, pgs.365-368
[9] Rajashree, Y.Patil; Kulkarni,R.V. A Review of Data Cleaning Algorithms for Data Warehouse Systems. International Journal of Computer Science and Information Technologies, Vol. 3 , No.5 ,)2012(, pgs.5212 – 5214
[10] Kirange, Mayuri; Makhijani, R.K. Revolution In DW By Solving Causes Of Data Quality Problems In DW And ETL. International Journal of Computer Science and Mobile Computing, Vol. 4, Issue. 1, )2015(, pgs.64 – 73
[11] Devi1,S; Kalia, A. Study of Data Cleaning & Comparison of Data Cleaning Tools. International Journal of Computer Science and Mobile Computing, Vol. 4, Issue. 3,)2015(, pgs.360 – 370
[12] Kabiri,A.; Chiadmi,D. Survey on ETL processes. Journal of Theoretical and applied Information Technology. Vol. 54, No. 2, )2013(, pgs.219-229
[13] Talebzadeh,Hossein. A Service-Based Framework for ETL Process Based on Metadata. Journal of Basic and Applied Scientific Research,Vol.2, No.1, ) 2012(, pgs.54-59
[14] Ganapavarapu, Vinaya Bharadwaj. “Designing and Implementing a Data Warehouse using Dimensional Modeling” Master of Science, Computer Engineering , The University of New Mexico, Heileman,Gregory ,)2014(
[15] NEDELCU, Bogdan.Business Intelligence Systems. Database Systems Journal Vol. IV, No. 4, )2013(, pgs.12-20