نوع مقاله: علمی - پژوهشی

نویسندگان

1 دانشجوی دکتری/ دانشگاه یزد

2 عضو هیئت علمی/ داننشگاه یزد

3 دانشجوی دکتری / دانشگاه یزد

چکیده

روش نگاشت خودسازمانده (SOM)یکی از روش‌های خوشه‌بندی است که می‌تواند بدون نظارت و با کمک شبکه عصبی، فضاهای چندبعدی و پیچیده داده‌ها را به یک فضای دوبعدی تبدیل کند. به دلیل بسته بودن و خاصیت ترکیبی ذاتی داده‌های ژئوشیمیایی،قبل از هر تحلیلی بایستی با تبدیل‌های خاصی باز شوند. یکی از مهم‌ترین تبدیل‌هایی که امروزه روی این نوع داده‌ها برای بازکردن آن‌ها انجام می‌شود، خانواده تبدیل‌های نسبت لگاریتمی است که در دو دهه اخیر توسط دانشمندان علوم آمار ارائه شده است. در حال حاضر روش‌های تحلیل آماری و داده‌کاوی خاص این نوع داده‌ها مثل استاندارد سازی، آمار توصیفی، کاهش بعد، خوشه‌بندی، رگرسیون، زمین‌آمار و غیره از جنبه‌های مختلف در دنیا در حال بررسی است. در این پژوهش ضمن معرفی روش SOM به‌عنوان یکی از مهم‌ترین روش‌های خوشه‌بندی مبتنی بر هوش مصنوعی، کاربرد آن در تحلیل داده های ژئوشیمیایی بررسی شده است. به‌عنوان مطالعه موردی، داده‌های ژئوشیمیایی رسوبات آبراهه‌ای برگه 1:100,000 خوسفکه خاصیت بسته یا ترکیبی دارند، نخست با کمک تبدیل نسبت لگاریتمی مرکزی یا clr، باز شده و دندروگرام خوشه‌بندی مربوطه ترسیم شد. در مرحله بعد داده‌ها یکبار به‌صورت بازشده و بار دیگر به‌صورت خام ولی استاندارد شده با روشهای ترکیبی به شبکه SOM وارد شده و خروجی آن هربار به‌صورت نگاشتهای صفحات وزنی نورونها برای هر متغیر ترسیم شد. الگوی توزیع وزنی در نگاشت‌های بیان‌شده برای متغیرهایی که در یک خوشه قرار می‌گیرند، بسیار به هم شبیه است. مقایسه نتایج به کارگیری این روش با نتایج دندروگرام به‌دست آمده، نشان‌دهنده انطباق قابل قبول این دو روش درصورت استفاده از داده‌های خام استاندارد شده دارد. نقطه ضعف این روش این است که تشخیص الگوهای مشابه در خروجی به عهده ناظر است و اگر تعداد متغیرها زیاد باشد نمی‌توان تمام الگوهای مشابه را به راحتی تشخیص داد. 

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Studying the application of self organizing map (SOM) in geochemical data clustering of stream sediment and comparing the results with compositional data dendrogram

نویسنده [English]

  • Farhad Torab 2

چکیده [English]

Extensive development of the data mining methods via the artificial intelligence implementation and machine learning algorithms have become an important challenge to the classical statistical analysis. Some constraints in the statistical assumptions are not made in these methods and just by defining the initial conditions and proper training, acceptable results can be achieved.
Self organizing map (SOM) is a way that can unsupervisedly reduce the high dimensional complicated spaces to a 2 or 3D space and recognize the principal components without any difficult and almost impossible assumptions. Despite all the transformations applied to the geochemical data, they intrinsically do not suit any statistical analysis and this is a serious factor for so many ifs and buts before analyzing the data.
In this study, while introducing SOM as one of the most important approaches based on artificial intelligence, its usage in geochemistry has been demonstrated in a case study of stream sediment sampling carried out in Khusf geological 1:100000 sheet. Comparing the results of applying SOM on the compositionally scaled data and compositional univariate transformed data with exploratory compositional dendrogram of the data showed a favorable conformity of the dendrogram to the SOM clustering on the compositionally scaled data.
 

کلیدواژه‌ها [English]

  • Network
  • Self Organizing Map
  • Geochemistry
  • compositional data
  • Khusf