نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشگاه علوم پزشکی و خدمات درمانی و بهداشتی زنجان، ایران

2 دانشگاه رازی- دانشکده آموزشی علم اطلاعات و دانش شناختی- کرمانشاه- ایران

چکیده

مهمترین مسئله در مدیریت داده­ ها، موضوع کیفیت داده است. کیفیت داده می‌تواند پاکسازی داده‌ها را قبل از بارگذاری به انبار داده‌ها تضمین­ کند. پاکسازی داده فعالیتی است شامل فرآیند تشخیص و اصلاح اشتباهات و تناقضات در انبار داده­ ها. به ­دلیل وجود اطلاعات زیاد در بانک ­های اطلاعاتی مشکلات و تناقضات فراوانی درآن­ها به ­وجود آمده ­است. هدف اصلی ما ارائه روشی برای رفع تناقضات موجود در بانک‌های اطلاعاتی برای پاکسازی داده‌های آلوده می‌باشد. با هدف بهبود کیفیت انبار داده برای تصمیم‌گیری‌های صحیح، روش جدیدی ارائه­ شده­ است و برای آزمایش روش پیشنهادی، از بانک اطلاعاتی شناسنامه سلامت دانشجویان دانشگاه علوم پزشکی زنجان ورودی سال­های 92 و 93، شامل 845  نفر که در حال حاضر همه آن­ها فارغ‌التحصیل شده‌اند به­ عنوان داده ­های مورد بررسی استفاده ­شده ­است. برنامه پیشنهادی با زبان برنامه‌نویسی سی‌شارپ پیاده‌سازی و اجرا شده­ است. برنامه یا اپلیکیشن ما در چهار لایه و به‌صورت ویندوز اپلیکیشن نوشته­ شده­ است. از طریق  اجرای روش پیشنهادی توانستیم با بررسی کدملی دانشجویان، داده‌های آلوده در این مشخصه را تشخیص ­داده و سپس فرآیند اصلاح داده را روی آن­ها اعمال ­نماییم. براساس نتایج به‌ دست ­آمده، میزان داده آلوده در انبار داده تولید­شده از 25.79 درصد به 4.97 درصد کاهش ­یافت. 

کلیدواژه‌ها

 
[1] Golfarelli, Matteo “New Trends in Business Intelligence”. Proceedings of the 28th International Convention MIPRO (BIS&DE&ISS). MIPRO (May 30-June  /2005), Opatija, Croatia. PP: (15-20)
[2] NEDELCU, Bogdan. “Business Intelligence Systems”. Database Systems Journal. Vol IV. no.4(2013). PP: (12-20)
[3] Inmon, William H. “Building the Data Warehouse”. Wiley Publishing. 4th Edition. (2005). P:32
[4] Ghosh, Ranak; Halder, Sujay; Sen, Soumya.  “An Integrated Approach to Deploy Data Warehouse in Business Intelligence Environment”. IEEE Third International Conference. (7-8 Feb- 2015), Hooghly). PP: (1 – 4)
[5] Talebzadeh, Hossein. A Service-Based Framework for ETL Process Based on Metadata. Journal of Basic and Applied Scientific Research. (2/1/ 2012). PP:( 54-59)
[6] Gill, Rupali; Singh, Jaiteg. “A Review of Contemporary Data Quality Issues in Data Warehouse ETL Environment”. Journal on Today’s Ideas Tomorrow’s Technologies. Vol. 2. No. 2. (19 December 2014). PP: (153_160)
[7] Choudhary, Nidhi. “A Study over Problems and Approaches of Data Cleansing/Cleaning”, International Journal of Advanced Research in Computer Science and Software Engineering. Vol. 4, Issue 2. (February 2014). PP: ( 774 _779)
[8] Bhattacharjee, Arup Kumar ; Chatterjee, Partha ; Prasad Shaw, Mukesh ; Chakraborty, Manomoy. “ETL based Cleaning on Database”, International Journal of Computer Applications.Vol.105, No. 8. (November 2014). PP: (34– 40)