نوع مقاله: علمی - پژوهشی

نویسندگان

1 کارشناس ارشد گروه ژئوشیمی جهاد دانشگاهی واحد صنعتی اصفهان

2 استاد دانشگاه

3 عضو هیات علمی جهاد دانشگاهی واحد صنعتی اصفهان

چکیده

داده‌های پرت در ژئوشیمی اکتشافی بسیار مهم هستند و می‌توانند اثرات زیادی بر نتایج روش‌های آماری از جمله جداسازی آنومالی از زمینه داشته باشند. بنابراین یکی از اولین مراحل پیش پردازش در تحلیل داده‌های ژئوشیمیایی، تشخیص و تصمیم‌گیری در مورد حذف یا تصحیح آن‌ها است. این داده‌ها را به 3 روش تک متغیره، دو متغیره و چند متغیره می‌توان شناسایی کرد که هدف از این تحقیق جداسازی آن‌ها با استفاده از روش‌های تک متغیره و چند متغیره است. با این حال، با توجه به این که داده‌های ژئوشیمیایی به صورت ترکیبی هستند قبل از هر تجزیه و تحلیلی باید از یک تبدیل مناسب برای رفع این مشکل استفاده کرد. خانواده تبدیل لگاریتمی ریشه‌ای از مناسب‌ترین تبدیل‌ها برای این کار هستند که از بین آن‌ها تبدیل ریشه‌ای ایزومتریک برای این مطالعه انتخاب شد. پس از اعمال تبدیل ایزومتریک بر روی داده‌ها، روش‌های نمودار جعبه‌ای و فاصله‌ی ماهالانوبیس مقاوم به ترتیب برای تشخیص آن‌ها به روش‌های تک متغیره و چند متغیره انتخاب شدند. در روش تک متغیره از چارک سوم به اضافه یک و نیم برابر فاصله‌ی چارکی به عنوان حد آستانه و در روش چند متغیره از یک حد آستانه‌ی تصحیح شده بر اساس تابع توزیع تجربی مربع فاصله ماهالانوبیس مقاوم و تابع توزیع مربع کای برای این کار استفاده شده است. نتایج این مطالعه نشان می‌دهد که با توجه به ماهیت چند متغیره بودن داده‌های ژئوشیمی اکتشافی، استفاده از روش‌های چند متغیره برای تشخیص داده‌های پرت با دقت بیشتری همراه خواهد بود. 

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Univariate and multivariate outlier detection in exploration geochemistry: A case study of Sari Gunay epithermal gold deposit

چکیده [English]

Outliers are very important in exploration geochemistry and they can greatly impact the results of the statistical methods especially separation of anomaly from background. Thus, recognition and decision about removal or correction of them is one of the first steps in the analysis of geochemical data processing. Outliers can be identified from a univariate, bivariate, or multivariate perspective based on the number of variables considered, however the bivariate detection is not the aim of this study. Since geochemical data are compositional data, meaning that they represent a closed number system, an appropriate transformation should be used prior to any analysis. The most widely used remedy for this issue is the family of logratio transformation among which the isometric was selected for this study. The data were transformed using the isometric logratio transformation and then boxplot and robust Mahalanobis distance were applied for univariate and multivariate outlier identification respectively. The threshold value for univariate method was the upper inner fence (third quartile plus 1.5IQR), while for Mahalanobis distance an adjusted quantile, deviation of the empirical distribution function of the robust Mahalanobis distance from the theoretical distribution function, was used as the cut off value for identifying outliers. It was demonstrated that regarding the multivariate nature of exploration geochemical data, using multivariate methods for outlier detection is more accurate.
 

کلیدواژه‌ها [English]

  • outliers
  • compositional data
  • isometric logratio transformation
  • box plot
  • robust Mahalanobis distance