تعداد نشریات | 418 |
تعداد شمارهها | 10,002 |
تعداد مقالات | 83,585 |
تعداد مشاهده مقاله | 78,086,737 |
تعداد دریافت فایل اصل مقاله | 55,036,472 |
کارایی مدلهای آماری والگوهای یادگیری ماشین در پیش بینی گزارشگری مالی متقلبانه The efficiency of statistical and machine learning models in fraud financial statement | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
اقتصاد مالی | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
دوره 15، شماره 54، خرداد 1400، صفحه 267-292 اصل مقاله (889.38 K) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
نوع مقاله: علمی پژوهشی | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
نویسندگان | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
حسن ملکی کاکلر1؛ جمال بحری ثالث2؛ سعید جبارزاده کنگرلویی* 3؛ علی آشتاب4 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1گروه حسابداری، دانشگاه آزاد اسلامی، واحد ارومیه، ، ارومیه، ایران | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2گروه حسابداری، دانشگاه آزاد اسلامی واحد ارومیه، ارومیه، ایران | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3گروه حسابداری، واحد ارومیه، دانشگاه آزاد اسلامی،آذربایجان غربی ،ایران | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4گروه حسابداری، دانشگاه ارومیه، ارومیه، ایران، | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
چکیده | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
وجود تقلب و تداوم آن در صورتهای مالی،آثارگستردهای بر سلامت مالی شرکتها و توسعه پایدار بازار سرمایه دارد. روشهای متداول حسابرسی در پیشگیری و کشف صورتهای مالی متقلبانه، نتوانستهاندباتقلبهایحسابدارینوظهور به دلیل فقداندانشموردنیازدادهکاوی،پیچیدگی تقلبهای جدید و عدم تجربهکافیحسابرسان کناربیایند. در این پژوهش، انواع مدلهای آماری و یادگیریماشین در دستیابی به الگویی با کارایی بالا در پیشبینی گزارشگری مالی متقلبانهاستفاده شد. از 20 متغیر در قالب الگوی پنج ضلعی تقلب با تاکید بر ساختار کنترلهای داخلی در 166 شرکتهایفعال در بورس اوراق بهادار تهران طی سالهای 1388 الی 1397 و مقایسه بین مدلهای مورد بررسی،باکمکآزمـونمقایسـة نسبتها،نشان میدهدکهبه لحاظ آماریمدلهاییادگیریماشـیندرپیشبینیگزارشگری مالی متقلبانه نسـبتبـه مدلهایآماری،کارایی و دقتبیشتری دارند. ترکیب الگوریتم درخت تصمیمگیری CHAID، C5 و C&R بالاترین دقت در پیشبینی گزارشگری مالی متقلبانه را با دقت بالای 61/92 درصد در پیشبینی تقلب نشان میدهد. روشهای دادهکاوی بر پایه مدلهای یادگیری ماشین و بویژه ترکیب آنها بطور موفقیتآمیزی در پیشبینی و کشف تقلبدر صورتهای مالی می تواند مورد استفاده قرار گیرد. The efficiency of statistical and machine learning models in fraud financial statement Hassan Maleki Kaklar Jamal Bahri Saleth Saeed Jabbarzadeh Kangarloee Ali Ashtab The existence and persistence of fraud in financial statements can have adverse impact on the sustainable development of the capital markets as well as the financial health of companies. Using conventional audit procedures which is applied to prevent and detect fraudulent financial statements, auditors fail to cope with emerging accounting frauds. This can be due to many reasons, such as the lack of the required data mining knowledge, the complexity and infrequency of financial frauds, and the auditors without much experience. Accordingly, due to importance of identifying fraud in capital market, different types of statistical and machine learning based models were examined to establish a rigorous and effective model to detect financial statements fraud in this study. For this purpose, 20 variables in the form of the pentagonal fraud with emphasis on the structure of internal controls (pressure, opportunity, justification, capability, arrogance and internal control structure) were used from 166 manufacturing companies listed on Tehran stock exchange over the period 2009-2018. Based on the statistical indices obtained, machine learning based models exhibited higher predictive ability and accuracy than statistical based models in predicting financial statement fraud. The results also showed that C5, CHAID and C&R decision tree models were highly accurate in prediction of fraudulent datapresented in fnancial statement. Accordingly, the efficacy of combination of CHAID, C5 and C&R decision tree algorithms which had the highest accuracy in prediction of fraudulent financial reporting was examined. The high accuracy of 92.61% of the combination of these algorithms in fraud prediction shows that data mining methods based on machine learning models and especially their combination can be used successfully in fnancial statement fraud prediction. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
کلیدواژهها | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
واژههای کلیدی:گزارشگری مالی متقلبانه؛ مدلهایآماری؛ مدلهای یادگیری ماشین. طبقه بندی JEL: M41؛ M42؛ G32 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
اصل مقاله | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
کارایی مدلهای آماری والگوهای یادگیری ماشین در پیش بینی گزارشگری مالی متقلبانه
حسن ملکی کاکلر
جمال بحری ثالث[2] سعید جبارزاده کنگرلویی[3] علی آشتاب[4]
چکیده وجود تقلب و تداوم آن در صورتهای مالی،آثارگستردهای بر سلامت مالی شرکتها و توسعه پایدار بازار سرمایه دارد. روشهای متداول حسابرسی در پیشگیری و کشف صورتهای مالی متقلبانه، نتوانستهاندباتقلبهایحسابدارینوظهور به دلیل فقداندانشموردنیازدادهکاوی،پیچیدگی تقلبهای جدید و عدم تجربهکافیحسابرسان کناربیایند. در این پژوهش، انواع مدلهای آماری و یادگیریماشین در دستیابی به الگویی با کارایی بالا در پیشبینی گزارشگری مالی متقلبانهاستفاده شد. از 20 متغیر در قالب الگوی پنج ضلعی تقلب با تاکید بر ساختار کنترلهای داخلی در 166 شرکتهایفعال در بورس اوراق بهادار تهران طی سالهای 1388 الی 1397 و مقایسه بین مدلهای مورد بررسی،باکمکآزمـونمقایسـة نسبتها،نشان میدهدکهبه لحاظ آماریمدلهاییادگیریماشـیندرپیشبینیگزارشگری مالی متقلبانه نسـبتبـه مدلهایآماری،کارایی و دقتبیشتری دارند. ترکیب الگوریتم درخت تصمیمگیری CHAID، C5 و C&R بالاترین دقت در پیشبینی گزارشگری مالی متقلبانه را با دقت بالای 61/92 درصد در پیشبینی تقلب نشان میدهد. روشهای دادهکاوی بر پایه مدلهای یادگیری ماشین و بویژه ترکیب آنها بطور موفقیتآمیزی در پیشبینی و کشف تقلبدر صورتهای مالی می تواند مورد استفاده قرار گیرد.
واژههای کلیدی:گزارشگری مالی متقلبانه، مدلهایآماری، مدلهای یادگیری ماشین. طبقه بندی JEL: M41,M42 ,G32 1- مقدمه روند افزایشیتقلبدر محیطکسبوکاردنیای امروزی باعث شدهکشف تقلب در صورتهای مالیبهموضوعینوظهوربرایصاحبان بنگاههای تجاری،صنایعوهمچنین تحقیقاتدانشگاهیتبدیلشود (شرماو پانیگراهی[i]، 2013). رسواییهای مالی شرکتهای بزرگی همچون انرون، ورلدکام در دنیا و آثار زیان باری که درطییکدههگذشته به بار آوردهاند، باعث کاهش اعتماد عمومی و بویژه کاهش اعتماد سرمایهگذاران نسبت به گزارشهای مالیو خدمات حسابرسان شده است (خواجوی و ابراهیمی، 1396). از این روسازمانها باید در تلاش دائمی برای پیشگیری،بازدارندگی و کشف تقلب باشند (امیدی و همکاران، 2019). بنا به گزارش بازرسان رسمی تقلب[ii](2018) انواع تقلب در سه شکل سوءاستفادهازداراییها،فساد مالیوتقلب درصورتهایمالیطبقهبندیشده است. در این میان، گزارشگری مالی متقلبانه اگرچه در مقایسه با سایر اشکال تقلب کمتر اتفاق میافتد با اینحال از لحاظ هزینههای تحمیل شده به شرکتها گرانترین نوع تقلب به شمار میرود. در سالهای اخیردر ایران نیز ارتکاب تقلب، بحث غالب مطرح بازارهای مالی و نهادهای اقتصادی- اجتماعی داخلی بوده است. بحران مالی ایران در سالهای 1390 و 1397 که همراه با کاهش شدید ارزش ریال بودپیامدهای منفی از طریق تاثیرگذاری بر فضای کسب و کار و محدود کردن منابع مالی در اختیار به دنبال داشت. نمونهبارزتقلبهایمالیسالهایاخیر، پروندهیفسادگستردهبانکسرمایه بهمیزان ۱۴ هزارمیلیاردتومان که ازآنبهعنوانابرفسادمالییادمیشود؛تاثیربسزایمستقیموغیرمستقیم بررویبازارهایمالیداخلیداشتهاند.اگرچه در ایران آمارهای رسمی از تقلبها ارائه نمیشود ولی طبق آمارهای سازمان شفافیت بینالملل در سال 2019، ایران با نمره 27،در بین 180کشور دنیا رتبه 146 را دارد. کشف تقلب مدیریت با استفاده از روشهای حسابرسی عادی به دلایل زیرکار نسبتا دشواری است. اول اینکه شناخت کافی در مورد ویژگیهای تقلب مدیریت وجود ندارد. دوم ، بیشتر حسابرسان فاقد تجربه لازم برای کشف تقلب بوده و نهایتا ، مدیران مالی و حسابداران عمدتاً تلاش میکنند تا کار حسابرسی را بیاهمیت جلوه دهند.برایچنینمدیرانیکهاز این محدودیتهایحسابرسیمطلع هستند،ممکناستروشهایاستانداردحسابرسیکافینباشد (امیدی و همکاران، 2019). از این روبرایکشفمؤثرصورتهایمالیمتقلبانهنیازبهروشهایتحلیلیاضافیامری غیر قابل اجتناب مینماید.با توجه به تأثیر فزاینده گزارش حسابرسی شرکتها بر ثبات بازارهای مالی، در سالهایاخیر تلاشهای گستردهای برای ارتقای عملیات حسابرسی انجام شده، ابزارها و فنونی طراحی شدهاست که حسابرسان بتوانند عملیات حسابرسی خود را به کمک رایانه انجام دهند، که یکی از اینفنون و ابزارها، روشهای یادگیری ماشین[iii] است. در طی دهه گذشته اگرچه از این روشهای دادهکاوی[iv] برای کشف تقلبهایی نظیر پولشویی[v] ،تقلب درکارت اعتباری تجارت الکترونیکی[vi]، تقلب در سازمانهای بیمه با موفقیت استفاده شده است با این حال، بهدلیل ماهیت پیچیده گزارشگری مالی متقلبانه کشف و شناسایی آن نیز پیچیده و دشوار است (آپاراو[vii] و همکاران، 2009). در بیشتر پژوهشها در زمینه کشف تقلب در صورتهای مالی، به بررسی رویکرد آمار کلاسیک از جمله رگرسیون پرداخته شده است (زلقی و اعتمادی، 1392). مدلهای آماری اگرچه توانایی پیشبینیهای قابل قبول در تحلیل مسایل اقتصاد و حسابداری ارائه میکنند با اینحال مفروضات محدودکننده برخی از این مدلها (ابهام در روابط متغیرهای ورودی و خروجی مدل، خطای ناشی از هم خطی، کمبود مشاهدات...) اثربخشی آنها را کاهش میدهد (اصفهانیپور و همکاران، ۲۰۱۵). بنابراین این سوال که آیا میتوان مدلی ارائه داد که بتواند گزارشگری مالی متقلبانه را با دقت بالایی پیشبینی کند، از موضوعاتبسیار مهم در این زمینه است. برای انجام پیشبینی معمولا با تجزیه و تحلیل دادههای گذشته، الگویی شناسایی شده که بتوان از وقوع تقلب جلوگیری کرد. برای بررسی این امر در این پژوهش، از روشهای یادگیری ماشین استفاده میشود.در روشهای یادگیری ماشین،الگوریتمهاییکه براساسدادههاتوانایییادگیریوپیشبینیدارند،ایجاد و مورد بررسی قرار میگیرد.چنینالگوریتمهاییصرفا ازدستورهایبرنامهپیروینمیکنندبلکهازطریقمدلسازی دادههای ورودی نمونه، پیشبینی یا تصمیمگیری میکنند. از آنجا که آگاهی ضرورتانکارناپذیر تصمیمگیری است، پیشبینی تقلب در صورتهای مالی میتواند از تحمیل هزینههای زیاد، کاهش اعتبار شرکت و در نتیجه افزایشریسکو ناکارآمدیبازار جلوگیری کند. بنابراین ضرورت اصلی این پژوهش، ارتقای سطح آگاهی حسابرسان، نهادهای ناظر و سرمایهگذاران در این زمینه اسـت.آنچـه ایـنپژوهش را از پژوهشهای مشابه متمایز میکند، به شرح زیر است:
باتوجه به تواناییهای این مدلها، انتظار میرود از آن برای موضوع پیچیده کشف تقلب در صورتهای مالی استفاده شود، زیرا گزارشگری مالی متقلبانه تأثیر منفی بر بقا و عملکردهای پایدار بازارهای مالی، جامعه و اقتصاد جهانی دارد و به توسعه پایدار شرکتها آسیب میرساند.بنابراین نیاز به ابزار هوشمند و جدید برای فعال کردن حسابرسان در کشف دادههای جعلی بسیار ضروری است. بهعلاوه، گزارشگری مالی متقلبانه به متغیرهای مالی و غیرمالی زیادی بستگی داشته که خود این متغیرها مستقل از هم بوده و روابط بین آنها مشخص نیست. در چنین شرایطی کشف تقلب برای حسابرسان، نهادهای ناظر و سرمایهگذاران دشوار خواهد بود. ساختار مقاله حاضر بدین صورت است که در بخش اول به مبانی نظری و پیشینه پژوهش پرداخته میشود. در ادامه، به توصیف روش پژوهش و متغیرهای پژوهش پرداخته و سپس، روش تجزیه و تحلیل دادهها و یافتههای پژوهش مطرح میشود. در آخر، نتیجهگیری، پیشنهادها و محدودیتهای پژوهش بیان میگردد.
مبانی نظری و پیشینه تجربی پژوهش روشهای حسابرسی به دلیل اینکه برای کشف تقلب در صورتهای مالی طراحی نشدهاند دارای نقایص بیشماری برای شناسایی این نوع تقلب هستند. اگرچه از نظر اخلاقی، مدیر مسئولیت کشف دادههای تقلب مالی در یک سازمان را بر عهده دارد ولی در واقع اکثر تقلبها در صورتهای مالی با آگاهی یا رضایت مدیریت انجام میشود. نکته مهم اینست که هرگونه عدم موفقیت در کشف گزارشگری مالی متقلبانه میتواند به اعتبار حرفه حسابرسی آسیب جدی وارد کند (چوی[viii] و پیک[ix]، 2013) همچنین، شیوههای حسابرسی باید به موقع انجام شود تا از بروز موارد تقلب در صورتهای مالی و افزایش روزافزون آن جلوگیری شود. تکنیک های جدید مانند دادهکاوی که دارای طبقهبندی پیشرفته و قابلیت پیش بینی است می تواند برای تسهیل نقش حسابرسان از لحاظ کشف موفقیت آمیز تقلب مورد استفاده قرار گیرد( لین[x] و همکاران، 2015). دادهکاوی فرآیندی است که در آن از تکنیکهای مختلف برای استخراجدانشازحجمانبوهیازدادههااستفادهمیشود. دادهکاویشاملمجموعهایازتکنیکهاییاست که در حوزههای دیگر علمی مانند پایگاهدادهها،آمار،یادگیریماشین،شبکههایعصبی،بازیابیاطلاعاتوتشخیصالگومیتوان آنرایافت. مراحل مختلف دادهکاوی شامل انتخاب مناسبترین روشها (مانند طبقهبندی، رگرسیون، خوشه بندی[xi] یا قوانین انجمنی[xii]) و سپس انتخاب الگوریتم مناسب متعلق به یکی از روشهای مذکور است. نهایتا، با انتخاب و تنظیم پارامترهای اصلی و مرحله اعتبارسنجی، از الگوریتم انتخاب شده برای حل مسئله استفاده میشود(ژانگ و ژو[xiii]، 2004). به طور کلی، روشهای دادهکاوی به دو نوع توصیفی و پیش بینی تقسیم میشوند. دستهی اول به توصیف خصوصیت دادهها در پایگاه دادهها میپردازند و عملیات دستهی دوم با مدلسازی دادههای در دسترس سعی میکنند تا یک پیشبینی صحیح از دادههای آتی و آزمایشی داشته باشند. روشهای پیشبینی نیز خود به روشهای آماری و روشهای نمادین طبقه بندی میشوند.روشهای آماری با ارائه دانش از طریق مدلهای ریاضی بهمراه محاسبات مربوطه شناخته میشوند. روشهای نمادین دانش را با استفاده از نمادها و قوانین انجمنی ارائه میدهند، که در نهایت مدلهای قابل تفسیرتری ارائه میکنند. (اسماعیلی، 1398) مدلهای رگرسیون از جمله مدلهای کلاسیک هستند که در گروه روشهای آماری قرار گرفته و به نوعی به معادلات مدلسازی نیاز دارند. رگرسیون خطی، درجه دوم و لجستیک از مشهورترین مدلهای دادهکاوی هستند. ویژگی اصلی این مدلها اینست که الزامات اساسی را بر دادهها تحمیل کرده و از همه کارکرد آنها چه مفید باشد یا نباشد، استفاده میکنند. افزون بر اینها، شبکههای عصبی مصنوعی،یکی از قدرتمندترین مدلهای ریاضی است که تقریباً برای کلیه کارهای دادهکاوی مناسب است. شبکههای عصبی از لحاظ یادگیری در دو دستهی شبکههای وزن ثابت و شبکههایی با وزن متغیر تقسیم میشوند. شبکههایی با وزن متغیر که به نام شبکههای یادگیرنده نیز شناخته میشوند، خود میتوانند به دو دستههدایتشده[xiv] و هدایت نشده[xv] تقسیم میشوند. به منظور آموزش شبکه روشهای بسیار زیادی وجود دارند که یکی از مشهورترین آن الگوریتم پس انتشار خطااست که یکی از روشهای هدایت شده تلقی میشود. واژه یپس انتشار به معنای این است که خطاها به سمت عقب در شبکه تغذیه میشوند تا وزن ها را اصلاح کنند. در این الگوریتم ابتدا فرض بر این است که وزنهای شبکه بطور تصادفی انتخاب شدهاند (اسماعیلی، 1398). روشهای پیشبینی کننده عمدتاً به یادگیری هدایتشدهنسبت داده میشود. روشهای هدایت شده، روابط بین صفات ورودی و یک ویژگی مشخص را در ساختاری که "مدل" نامیده میشود، آشکار میکنند. مسائل رگرسیون و طبقهبندی هر دو جز روشهای هدایت شده هستند. سناریوی هدایت شده به گونهای عمل میکند که یک مدل در یک مجموعه داده آموزشی قرار گیرد و سپس برای پیشبینی موارد مشاهده نشده استفاده شود. در اینجا، هدف اصلی نقشه برداری ورودیها به خروجی است که مقادیر صحیح آن توسط یک ناظر تعیین میشود. از طرف دیگر، چنین ناظری در یادگیری بدون هدایت وجود ندارد و فقط دادههای ورودی در دسترس است. یکی از مزایای یادگیری بدون هدایت این است که، برخلاف یادگیری هدایت شده، مدلهای پیشرفتهتری میتوانند تحت آموزش قرار بگیرند. از آنجا که در یادگیری هدایت شده، هدف این است که رابطه بین دو مجموعه مشاهدات برقرار شود، با افزایش تعداد مراحل، فرایندهای یادگیری به دلیل هزینههای بالای محاسباتی بصورت تصاعدی رشد میکند و بنابراین این مدلها نمیتوانند بطور ریشهای تحت فرآیند آموزش قرار بگیرند. (امیدی و همکاران، 2019). مزیت بزرگ ماشینبردار پشتیبان این است کهقدرت روشهای آماری تئوری محور و روشهای یادگیری ماشین داده محور را ترکیب میکند (مین و لی[xvi]، 2005). ایده اساسی این الگوریتم آنست که بردارهای ورودی به صورت غیرخطی در فضای ویژگی که بُعد بسیار بالایی دارد، رسم شود. براساس این معیار که اگر بردارها بتوانند سختترین نقاط را مشخص کنند، دیگر نقاط به آسانی مشخص میشوند، ماشین بردار پشتیبان برخلاف روشهای بیشماری که بر کل دادهها تمرکز میکنند به دشوارترین مسأله تشخیص داده شده توسط نقاط توجه میکند. بردارهایی که تشخیص آنها دشوارتر از همه است نزدیک به ابرصفحهای قرار میگیرند، کهاصطلاحا بردار پشتیبان نامیده میشوند. فاصله موجود بین نزدیکترین نقاط داده در هر طبقه، نسبت به ابرصفحه حاشیه نامیده میشود. هدف این الگوریتم حداکثر کردن این حاشیهها است،بنابراین هر اندازه بردارها دورتر از ابرصفحه باشند،اطمینان از درستی طبقهبندی آنها بیشتر میشود. ماشینهای بردار پشتیبان زمانیکه دادهها به صورت خطی از هم تفکیک شوند بسیار خوب عمل میکنند.از سوی دیگربر خلاف مدلهای رگرسیون، این مدلها معمولاً نیازی به ایجاد تعامل بین متغیرها ندارند، مشابهشبکههای عصبی مصنوعی، نسبت به پارازیتها مناسب هستند )قاضی زاده احساییو همکاران، 1398). دادهکاویبهطورگستردهدربسیاریازحوزههاکاربرددارد. درزیرخلاصهایازکاربردهایدادهکاویآوردهشدهاست: الف) برنامههایدادهکاویدرامورمالی: پولشوییوکشفسایرجرایممالی،طبقهبندیمشتریانوبازاریابیهدف،پیشبینیپرداختواموتجزیهوتحلیلاعتبارمشتری. ب) کاربرددادهکاویدرصنعتخردهفروشی: تجزیهوتحلیلاثربخشینمایندگیفروش،حفظمشتریوتجزیهوتحلیلوفاداریمشتری،سفارشمحصولو. ج) دادهکاویبرایصنعتارتباطاتازراهدور: تجزیهوتحلیلالگوهایتقلبوشناساییالگوهایغیرمعمول،وخدماتارتباطازراه دور. در مطالعاتگستردهای ازروشهاینوآورانهبرای شناسایی وکشفتقلباستفادهشدهاست. به عنوان مثال(چاندولا[xvii]وهمکاران، 2009)درموردکاربردتکنیکهایمختلفبرایتشخیصناهنجاریوتقلببااستفادهازرویکردهایهدایتشده دادهکاویبحثکردند. آنها ازتکنیکهاینتیجهمحور مانندماشینبردارپشتیبانبرایانجامطبقهبندیاستفادهکردندودریافتندکهدر بسیاری از موارد مدلهادر مقایسه با حسابرسان درکشفسریعبدونانجام رسیدگیکارایی بالاتری دارند. (شاو[xviii]وهمکاران، 2012)بامرورتکنیکهایمورداستفادهبرایکشفتقلب،کاراییرایجترینتکنیکهایخوشهبندیمورد استفاده درتقلبوکشفناهنجاریها را مورد بررسی قرار دادند. (ژووکاپور،[xix] 2011) اثربخشیومحدودیتهایتکنیکهایدادهکاویماننددرختتصمیمگیریوشبکهعصبیوشبکههایبیزینرابررسیکردند.آنهابرایشناساییتقلبدرصورتهایمالییکچارچوبخودسازگار[xx]رابراساسمدلسطح پاسخ[xxi]درحوزهعلمکشفکردند. (شرما و پانیگراهی[xxii]، 2013)یکچارچوبدادهکاویبرایکشف تقلب در صورتهایمالیپیشنهاددادند. (سچینی[xxiii]وهمکاران، 2010)بااستفادهازدادههایمالیاولیهوعمومیکهدردسترسعمومهستند،یکروشبرایکمکبهکشفگزارشگریمالیمتقلبانهپیشنهاددادند. (چنوروکو[xxiv]، 2009)نشاندادندکهیکروشهوشمصنوعیدرشناساییو کشف تقلببسیارخوبعملمیکند، وازاینرومیتواندیکابزارحمایتیبرایمتخصصان امرباشد. تجزیه و تحلیل نسبتها معمولترین رویکردی است که حسابرسان برای کشف تقلب به کار میبرند. با این وجود، مشکل این رویکرد انتزاعی بودن انتخاب نسبتهایی است که به احتمال زیاد نشاندهنده تقلب هستند (هوگان[xxv] و همکاران، 2008). تکنیکهای دادهکاوی برای کشف مفاهیم مذکور که قبلاً ناشناخته بودند کاملا کاربردیاست، (لین و همکاران، 2015) با اینحال تا به امروز، استفاده از این تکنیکها درگزارشگری مالی متقلبانه محدود بوده است. بیشتر تکنیکهای دادهکاوی مورد استفاده در این زمینه تکنیک های هدایتی مانند رگرسیون لجستیک ، شبکه های عصبی ، درخت تصمیم گیری و استخراج متن هستند. (ابطحی و همکاران، 2017) از مدل طبقهبندی بیزین سیستمی که در آن تقلب در معاملات ساختگی بازار قراردادهای آتی قابل تشخیص است استفاده کردهاند. برچسبگذاریاولیةدادهها با استفادهاز خوشهبندیکاـمیانگین انجام گرفته است و آزمون مدل، نشان داد مدل پیشنهادی میتواند 55/94 درصد موارد تقلب را با دقت طبقهبندی کند. (ژان[xxvi]، 2018) 160شرکت (از جمله 40 شرکت متقلب) را برای ارزیابی چندین تکنیک دادهکاوی از جملهشبکه عصبی مصنوعیوماشین بردار پشتیبانمورد استفاده قرار داد. سپس چهار نوع درخت تصمیمگیری(Cart ، CHAID، C5.0، وQUEST ) استفاده شد. نتایج مطالعه نشان می دهد که ترکیب مدل ANN + Cart بهترین نتایج طبقه بندی را با دقت 83/90 درصد در کشف تقلب در اظهارات مالی ارائه می دهد. امیدی[xxvii] و همکاران (2019)، با استفاده از 18 نسبت مالی مدل مثلث تقلب به اثربخشیروشهایپیشبینیکنندهتقلبدرصورتهایمالی در شرکتهای بورسی کشور چین تقلب پرداختند. این مطالعه با بررسی خواص پنج رویکرد هدایت شده یعنی، شبکه عصبی پیشخور چند لایه، شبکه عصبی احتمال محور[xxviii]، دستگاه بردار پشتیبانی[xxix]، مدل چند جملهای خطی[xxx]، و تجزیه و تحلیل تفکیککننده[xxxi]، نشان داد کهشبکه عصبی پیشخور چند لایه بهترین نتایج را در تشخیص صورتهای مالی متقلبانه ارائه می دهد. در پژوهشهای مربوط به ایران نیز تاراسی و همکاران (1398) تواناییشبکههایعصبیمصنوعی درپیشبینی احتمالگزارشگریمالیمتقلبانهموردبررسیقراردادند. در آن تحقیق، شبکه های بسیاری باترکیبهای مختلف توابع انتقال طراحی شد ومشخص گردید که در خصوص مسئلهی پیش بینیاحتمال وقوع گزارشگری مالی متقلبانه با 17 ورودی و 7خروجی، شبکهی عصبی دو لایه با توابع انتقال پایهشعاعی و خطی از صحت4/97 درصدبرخوردار بوده و بهترین تخمین تابع و پیش بینی راانجام می دهد. با بررسی دقت پیش بینی مدیریت سود با استفاده از از شبکه عصبی پیشخور تعمیم یافته و درخت تصمیمگیری Cart ,C5.0و مقایسه آن بامدل خطیرگرسیون کمترین مربعات،صالحی و فرخی (1397)دریافتند روش شبکهعصبی و درخت تصمیم گیری در پیش بینی مدیریت سود نسبت به روشهای خطی دقیق تر ودارای سطح خطای کمتری است. در پژوهش آشتاب و همکاران (1396) نیزدقتمدلهایپیشبینیبحرانمالیورویکردهـای مدیریتسودمورد بررسی قرار گرفت. بدینمنظوربرایپیشبینیبحران مالی،مدلهاییادگیریماشینومدلهایآماریبایکدیگرمقایسهشدندوبهکمکآزمـونمقایسـة میانگین،مشخصشدکهازنظرپیشبینیبحرانمالی،مدلهاییادگیریماشـیننسـبتبـه مدلهایآماریدقتبیشتریدارند. در پژوهش دیگر، خواجوی و ابراهیمی (1396) با بهکارگیری تکنیکهای دادهکاوی مدلی را برای کشف تقلب در صورتهای مالی ارائه کردند. یافتههای پژوهش بیانگر وجود شواهدیدال بر عملکرد مناسب مدلهای پیشنهادی و برتری الگوریتم جنگل تصادفی و شبکه بیزین در مقایسه با شبکه عصبی مصنوعی برایپیشبینی تقلب در صورتهای مالی بود. کاردان و همکاران (1396) با بررسی دقت الگوریتمهای خطی وغیرخطی در پیشبینی مدیریت سود نشان دادند الگوریتمهای غیرخطی از دقت بیشتری نسبت به الگوریتمهای خطی برخوردار بوده و الگوریتمرگرسیون پشتیبان، مدیریت سود را بهتر از سایر الگوریتمها پیشبینی میکند. همچنین الگوریتمخطی در پیشبینی سود نتایج تقریباً مشابهی را از خود نشان داد. روششناسی پژوهش در این پژوهش برایپیشبینیبحرانمالی،از27 مدلمختلفشامل 8 مدلآمـاریو19 مـدلیـادگیری ماشین بهصـورتمقایسـهای استفادهشدهاست. در این پژوهش برای تجزیه و تحلیل دادهها در و انجام آزمونهای آماری از نرمافزارهایEviews 9, SPSS 22 وMiniTab 18 و همچنین نرمافزارهای دادهکاوی RapidMiner و SPSS Modeler استفاده شده است. ویژگی بارز نرمافزارSPSS Modeler در این است که پردازش دادههای خود را با استفاده از گرههایی که به یکدیگر متصل شدهاند و قالب یک جریان را بهوجود میآورند، انجام میدهد. بهعلاوه، پس از اتمام فرایند دادهکاوی، دادههای مصور شده را به کاربر ارائه میدهد. الگوریتمهای یادگیری ماشین مورد استفاده در این پژوهش بهشرح زیر است: الگوریتم ماشین بردار پشتیبان:ماشین بردار پشتیبان، یکی از قویترین و دقیقترین الگوریتمهای یادگیری ماشین است که جهت طبقهبندی و تفکیک گروهها بهکار میرود. این الگوریتم روشهای آماری و یادگیری ماشین را باهم ترکیب میکند. بنابراین، اساس نظری آن برپایه تئوری یادگیری آماری قرار دارد (باستی[xxxii] و همکاران، ۲۰۱۵). با مشخص شده دادههای پژوهش، مدل ماشین بردار پشتیبان دادهها را به گروههای متمایزی تقسیم میکند. این مدلها دارای خواص کلی طبقهبندی دادهها با حداکثر قابلیت تعمیم، رسیدن به نقطه بهینه تفکیک دادهها، تعیین خودکار ساختار بهینه برای طبقهبندی کننده و امکان مدل کردن دادههای غیرخطی با استفاده از تجزیه و تحلیل اجزای اصلی هستند (فلاح شمس و همکاران، ۱۳۹۱). ماشین بردار پشتیبان الگوریتمی است که نوع خاصی از مدلهای خطی را مییابد که موجب حداکثر شدن تفکیک بین طبقات میشود. بردارهای پشتیبان در واقع نزدیکترین نقاط به حاشیه ابرصفحه هستند و تنها از این بردارها (نقاط) برای مشخص کردن مرز بین طبقات استفاده میشود. این الگوریتم از تئوری بهینهسازی برای طبقهبندی استفاده میکند و براساس تئوری یادگیری آماری، خطای طبقهبندی را به حداقل میرساند (اسماعیلی و همکاران، ۱۳۹۷). الگوریتم درخت تصمیمگیری: روش مبتنی بر درخت تصمیم، یکی از ابزارهای قوی برای دستهبندی و اعتباردهی محسوب میشود. درخت تصمیم از نظریه اطلاع و مقدار آنتروپی جهت انتخاب بهترین متغیر شروع پیمایش استفاده میکند. هر راس درخت بهعنوان یک کلاس یا قاعده، نمایشگر یک آزمایش یا تصمیم یکتاست. یالهای هر راس، متناظر با احتمالهای حاصل از آزمایش روی راس است. پیشامد دادهها را به چندین زیرمجموعه افراز میکند که توسط برگهای این درخت شناخته میشود. درخت تصمیم برخلاف سایر فنون به تولید قانون میپردازد و پیشبینی خود را در قالب قوانین توضیح میدهد، در حالی که در سایر فنون، پیشبینی نهایی بدون چگونگی اجرا بیان میشود (مفاخری، ۱۳۹۷). رایجترین الگوریتمهای درخت تصمیم شامل CHAID، C4.5،C5، CART وQUEST هستند (باستی و همکاران، ۲۰۱۵). یکی از پرکاربردترین درختهای تصمیم، C5 است، چرا که این الگوریتم با توجه به اریب کمتر نسبت به الگوریتمهای مشابه برای دادههایی که دارای نویز هستند، مناسب بوده و استفاده از روش بوستینگ[xxxiii] باعث افزایش عملکرد آن میشود. مدل درخت تصمیم مزایای بسیاری همانند قابل فهم بودن قوانین ایجاد شده توسط درخت تصمیم، برخورداری از کارایی بالاتر، مناسب برای نمونههایی با حجم زیاد داده و دارا بودن دقت طبقهبندی بالاتر دارد (هان،[xxxiv] ۲۰۱۶). الگوریتم شبکه بیزین: شبکههای بیزین جزو دستهبندی کنندههای آماری هستند و میتوانند ردیف تعلق دادهها را مشخص کنند و در آن صفات دادههای ورودی از هم مستقل بوده و بر روی هم تاثیر ندارند. از این روش تحت عنوان تکلیف هدایت شده یاد میشود. مبنای ردهبندی در الگوریتم بیزین، احتمالات است. در واقع ردهبندی بیزین چیزی جز احتمالات شرطی نیست. اما ویژگی بسیار مثبت الگویتم بیز این است که امکان اثبات بهینگی دارد (مفاخری، ۱۳۹۷).
مدل پژوهش سیر تکاملی مدلهای تقلب در صورتهای مالی در شکلهای 1-3 آورده شده است. بر این اساس، مدل اندازهگیری و کشف مثلث تقلب ابتدا به مدل لوزی (الماس تقلب) و نهایتا مدل پنتاگون بسط و توسعه یافته است. با توجه به مسئله اصلی این تحقیق مبنی بر تاثیر ساختار کنترلهای داخلی در کشف تقلب، مدل بسط یافته پنتاگون در شکل 4 نشان داده شده است. شکل 5 نیز مدل مفهومی پژوهش را با جزئیات ارائه میکند.
منبع: یافته های پژوهشگر
شکل 5. مدل مفهومی پژوهش منبع: یافته های پژوهشگر
جامعه آماری این پژوهش کلیه شرکتهای پذیرفته شده در بورس اوراق بهادار تهران هستند که در بازه زمانی 1388 تا ۱۳۹7 فعالیت کردهاند.جدول ۱ روند انتخاب نمونه آماری پژوهش را نشان میدهد.
جدول ۱. روند انتخاب نمونه آماری پژوهش
منبع: یافته های پژوهشگر با اعمال شرایط فوق، تعداد 166 شرکت از شرکتهای پذیرفته شده در بورس اوراق بهادار تهران، جهت برآورد مدلها و آزمون فرضیههای پژوهش انتخاب شد. فرضیههای تحقیق به شرح زیر در نظر گرفته شدند.
متغیرهای پژوهش گزارش مالی متقلبانه به عنوان متغیر وابسته که با استفاده از مدل(1) F-Score مورد سنجش قرار گرفت (دیچو و همکاران،[xxxv]2011)که به شرح زیر است:
Predicted Value = +7.893 – 0.790*Rsst-acc + 2.518*Chrec + 1.191*Chinv + 1.979*Softassets+ 0.171*Chcs - 0.932*Chroa + 1.029*Issue + ε+
برای محاسبه F-Score، احتمال پیشبینی شده از طریق تقسیمe(VALUE) / (1+ e(VALUE)) بر احتمال غیر شرطی تقلب (0.0037) بدست میآید که در آن PV ارزش پیشبینی بدست آمده از الگوی (1) میباشد. بر اساس پژوهش دیچو و همکاران (2011)، در این پژوهش مشاهدات دارای F-Score بالاتر از 85/1 به عنوان شرکتهای با ریسک بالای گزارشگری متقلبانه شناسایی میشوند. در این مطالعه متغیرهای خارجی یا مستقل شامل شش متغیرپنهانیعنی فشار، فرصت، عقلانی، قابلیت و تکبر و ساختار کنترل داخلی است.هریک از فرایندها به شرح زیر است(توفیق اکبر ، 2017):
جدول 2. تعریف عملیاتی متغیرهای پژوهش
منبع: یافته های پژوهشگر
تحلیل یافتهها آمار توصیفی متغیرهای پژوهش در جدول زیر آورده شده است.
جدول 3. آمار توصیفی متغیرهای پژوهش
منبع: یافته های پژوهشگر
آمار استنباطی: این تحقیق از روش F-score در دادههای پانل به منظور شناسایی شرکتها به دو گروه متقلب و غیرمتقلب استفاده میکند. جهت بررسی روابط میان متغیرها از مدلهای لاجیت، پروبیت و مدل ارزش حدی استفاده شده است. بدینترتیب که با استفاده مدلهای مذکور یک الگوی رگرسیون تخمین زده شده و مورد تجزیه و تحلیل قرار میگیرد ( جدول 4).
جدول 4. نتایج آزمون فرضیات اصلی و فرعی
*- تایید فرضیه با احتمال 90% ، **- تایید فرضیه با احتمال 95% و ***- تایید فرضیه با احتمال 99% منبع: یافته های پژوهشگر
نتایج بدست آمده از هر سه مدل مورد مطالعه برای متغیرهای اصلی پژوهش، نشان داد همه عوامل مدل توسعه یافتهی پنتاگون به جز تکبر تاثیر مثبت ومعناداری بر گزارشگری مالی متقلبانه در شرکتهای بورسی دارند. عوامل فشار، توجیه و ساختار کنترلهای داخلی با 99 % اطمینان، متغیر مستقل قابلیت با 95 % اطمینان و متغیر فرصت با 90 % اطمینان، تاثیر موثر و معنادار بر روی گزارشگری مالی متقلبانه دارند. با استفاده از مدل مقدار حدی تاثیر عامل فرصت نسبت به دو مدل دیگر با درصد اطمینان بیشتری (%95 ) تایید میشود (جدول 4). همچنین نتایج مدل نشان دهنده آن است که بین متغیرهای فرعی فشار شامل ثبات مالی با 99 % اطمینان و فشار خارجی و جریان نقدآزاد با 95 % اطمینان با احتمال تقلب رابطه معناداری وجود دارد. همچنین با توجه به ضرایب منفی بدست آمده برای متغیرهای فشار خارجی و جریان نقد آزاد میتوان نتیجه گرفت که یک رابطه منفی بین این متغیرها و گزارشگری مالی متقلبانه وجود دارد. علاوه بر اینها تعداد اعضای کمیته حسابرسی با 95 % اطمینان، اقلام تعهدی اختیاری با 99 % اطمینان و استقلال اعضای هیئت مدیره با 90 % اطمینان و نهایتا فرضیه اطلاعرسانی ضعفهای ساختار کنترلهای داخلی با 99 % اطمینان بر روی گزارشگری مالی متقلبانه تاثیر دارند.از سوی دیگر ارتباطی بین فرضیه فرعی عامل تکبر (دوگانگی وظایف مدیر عامل) و گزارشگری مالی متقلبانه مشاهده نشد (جدول 4). از آنجاییکه همه متغیرهای فرعی مدل نهایی باید معناداری لازم را داشته باشــند بنابراین متغیرهایی که معنادار نبوده از مدل حذف میشوند. در مرحله بعد، برای بررسی دقت پیشبینی مدلهای طبقهبندی، دادههای شرکتهای نمونه آماری بهعنوان ورودی وارد نرمافزار و نتایج پیشبینی برای مدلها محاسبه شد. برای ارزیابی همهجانبه توانمندی مدلها معیار دقت کل (بهصورت درصدی از اطلاعاتی که بهطور صحیح توسط مدل پیشبینی میشوند) محاسبه شد که این امر برای هریک از مدلها بهطور جداگانه محاسبه و در جدول 5 آورده شده است. بر این اساس، الگوریتمهای مدل درخت CHAID، درخت تصمیمگیری C5 و مدل درخت C&R به ترتیب دارای بالاترین دقت پیشبینی 31/80، 30/80 و 24/80 % هستند. از سوی دیگر همانطور که در جدول 5 نشان داده شده است مدلهای آماری پروبیت و گامبیت هم دقت بالایی در حدود 80% داشتند که بیانگر کارایی نسبتا بالای این مدلهای آماری در پیشبینی گزارشگری مالی متقلبانه میباشد.
جدول 5. نتایج دقت پیشبینی برای مدلهای آماری و یادگیری ماشین
منبع: یافته های پژوهشگر
با توجه به این موضوع، مقایسه کلی بین مدلهای آماری و همچنین مدلهای یادگیری ماشین انجام شد. بر این اساس متوسط دقت پیش بینی مدل های آماری 64/70 % و برای مدل های یادگیری ماشین 65/73 % بدست آمد (جدول 6). همچنین نتایج آزمون مقایسه نسبتها برای مدلها با استفاده از مقدار آماره z (75/4-) نشان میدهد که دقت پیش بینی مدلهای آماری کمتر از مدلهای یادگیری ماشین بوده و با توجه به سطح معنیداری 000/0 این تفاوت از نظر آماری معنیدار است. به عبارت دیگر، دقت پیش بینی مدلهای یادگیری ماشین به صورت معنیداری از مدلهای آماری بیشتر است.
جدول 6. مقایسه دقت پیشبینی مدلهای آماری و یادگیری ماشین
منبع: یافته های پژوهشگر
در ادامه برای بهینهسازی پیشبینی تقلب در صورتهای مالی، ترکیب الگوریتمهای مدل درخت CHAID ، درخت تصمیمگیری C5 و مدل درخت C&Rکه بالاترین دقت پیشبینی را داشتند انجام شد. براساس نتایج طی فرآیند آموزش و آزمایش ، ترکیب این مدلها به ترتیب دقت پیشبینی 76/94% و 61/92 % بدست آمد (جدول 7).
جدول7. بهینه سازی سه مدل برتر یادگیری ماشین
منبع: یافته های پژوهشگر
بحث و نتیجهگیری گزارشهای مالی اطلاعات مفیدی در بازارهای مالی در مورد وضعیت فعلی و چشم انداز آتی شرکتها برای ذینفعان ارائه میدهد. صورتهای مالی متقلبانه، جعل عمدی صورتهای مالی با حذف ارزش عناصر معین در این صورتها به منظور گمراه کردن استفادهکنندگان است.اگر پاداش هیئت مدیره با درآمد و سود گزارش شده مرتبط باشد محرکهایانگیزشیکافیدر دستیابی به اهداف سود و منافع شخصی مانند ارتقاء، افزایش حقوق و دستمزد برایگزارشهایمالیمتقلبانهایجادمیشود. گاهی اوقات شرکتها صورتهای مالی دستکاری شده را برای دسترسی به تأمین اعتبار بدهی بلند مدت یا افزایش قیمت سهم ارائه میدهند. هر مورد تقلب در صورتهای مالی شرکتها، به ویژه شرکتهای بورسی، نه تنها ذینفعان، مانند سهامداران، سرمایهگذاران، سرمایهگذاران بالقوه، اعتباردهندگان، مشتریان را متضرر میکند، بلکه به بقا و عملکردهای پایدار و همچنین سلامت بازارهای مالی و توسعه پایدار شرکتها آسیب میرساند. حتی اگر حسابداران و حسابرسان صورتهای مالی شرکت را با رعایت قوانین و مقررات مربوطه در شناسایی و کشف رفتارهای تقلب آمیز مدیران مورد بررسی قرار دهند، همواره ایراداتی در کشف تقلب وجود خواهد داشت.ایجاد یک مدل دقیق و مؤثر برای کشف تقلب در صورتهای مالی شرکتها میتواند تا حد زیادی تقلب در صورتهای مالی شرکتها و ریسک حسابرسی را به میزان زیادی کاهش دهد. این امر از یکسو مانعی اثرگذار در مدیریت سود شرکتها شده و از سوی دیگر به بنگاهها و بازارهای مالی کمک میکند تا توسعه پایدار را حفظ کنند. روشهای آماری و دادهکاوی میتواند تا حد زیادی یک سیستم پشتیبانی برای تصمیمگیری مدیران در کشف گزارشگری مالی متقلبانه ارائه دهد. از این رو، در این مطالعه انواع مختلف مدلهای آماری و یادگیری ماشین برای کشف تقلب توسعه داده شد. از میان این مدلها، مدلی با بالاترین کارایی و ضریب تاثیر انتخاب شد. برای این منظور از 20 متغیر در قالب پنج ضلعی تقلب با تاکید ساختار کنترلهای داخلی (فشار، فرصت، توجیه، قابلیت، تکبر و ساختار کنترلهای داخلی) در 166شرکت طی سالهای 1388 الی 1397 در شرکتهایپذیرفته شده در بورس اوراق بهادار تهران استفاده گردید. در مرحله اول مدل سازی، 27 مدل اعم از مدلهای آماری و یادگیریبرای بررسی دقت پیشبینی تقلب در صورتهای مالی مورد مطالعه قرار گرفت که نتایج نشاندهنده دقت بالای الگوریتمهای درخت تصمیمگیری C5، مدل درخت CHAID و مدل درخت C&R از زیرمجموعه مدلهای یادگیری ماشین و همچنین مدلهای پروبیت و گامبیت از زیر مجموعه مدلهای آماری بود (جدول 4). در ادامه مقایسه کلی و تحلیل صحت پیشبینی گزارشگری مالی متقلبانه توسط مدلهای یادگیری ماشین و همچنین مدلهای آماری صورت گرفت.نتایج بدست آمده از طریق آزمون مقایسه میانگینها برای مدلها نشان داد که دقت پیش بینی مدل های یادگیری ماشین به صورت معنیداری از مدلهای آماری بیشتر است. نتایج بدست آمده از این تحقیق با نتایج تحقیقات (آشتاب و همکاران، 1396)، ( صالحی و فرخی، 1397) و ( امیدی و همکاران، 2019) مبنی بر اینکه مدلهای یادگیری ماشین کارایی بالاتری نسبت به مدلهای آماری دارند، مطابقت دارد. همچنین دقت بالای پیشبینی (61/92 %) حاصل از ترکیب الگوریتمهای مدل درخت تصمیمگیری CHAID، C5 و C&R نشان میدهد روشهای دادهکاوی بر پایه مدلهای یادگیری ماشین و بویژه ترکیب آنها بطور موفقیتآمیزی میتواند در پیشبینی و کشف تقلب در در صورتهای مالی مورد استفاده قرار گیرد. این مطالعه همچنین پیشنهاداتی برای پیشگیری از تقلب در صورتهای مالی ارائه میدهد. اگرچه تکنیکهاواستراتژیهایمختلفمورداستفادهدرحسابداریبرایتشخیصتقلبمیتوانند تأثیرمثبتیدرپیشگیریوکنترلاینپدیدهداشتهباشند،بااینوجود،هوشیاریواحتیاطازطریقاطلاعرسانیحتما ضرورت دارد تادرکناراستفادهازبرنامههایمختلفضدتقلب،برایتحریکمسئولیتپذیریمدیرانوکارمنداندرمبارزهبااینپدیدهمخرببکارگرفتهشود. از سوی دیگر باید الزامات قانونی ناظران در مورد ایجاد سیستمهای کنترل داخلی و حسابرسی قوی توسط شرکتها و کمک به حسابداران و حسابرسان در اجرای آن اعمال شود. همچنین مطابق قوانین و مقررات باید شفافیت اطلاعات مالی توسط شرکتهای پذیرفته شده وجود داشته باشد تا مردم بتوانند به عنوان مکانیسم نظارت عمل کنند. شایان ذکر است مهمترین محدودیت در انجام این پژوهش مانند اغلب تحقیقات مربوط به حوزه تقلب در صورتهای مالی عدم وجود آرشیو غنی از اطلاعات معتبر و قابل اتکا در شناسایی و گزارش شرکتهای متقلب در بازار بورس و اوراق بهادار تهران بوده است.
1-گروه حسابداری، دانشگاه آزاد اسلامی، واحد ارومیه، ، ارومیه، ایران،assan.maleki.k@gmail.com 2-گروه حسابداری، دانشگاه آزاد اسلامی واحد ارومیه، ارومیه، ایران،j.bahri@iaurmia.ac.ir 3-گروه حسابداری، دانشگاه آزاد اسلامی واحد ارومیه، ارومیه، ایران،(نویسنده مسئول)s.jabbarzadeh@iaurmia.ac.ir 4-گروه حسابداری، دانشگاه ارومیه، ارومیه، ایران،a.ashtab@urmia.ac.ir
[i]. Sharma & Panigrahi [ii]. Association of Certified Fraud Examiners (ACFE) [iii]. Machine Learning [iv].Data mining [v] . Money laundering [vi]. E-commerce [vii]. Apparao [viii]. Chui [ix] . Pike [x] . Lin [xi]. clustering [xii] . association [xiii].Zhang &Zhou [xiv]. Supervised [xv].Unsupervised [xvi]. Min & Lee [xvii] .Chandola [xviii] .Sabau [xix].Zhou &Kapoor [xx]. Self-adaptive framework [xxi]. Response surface model [xxii].Sherma &Panigrahi [xxiii] .Cecchini [xxiv].Chen &Roco [xxv].Hogan [xxvi]. Jan [xxvii]. Omidi [xxviii]. Probabilistic neural network [xxix]. Support vector machine [xxx].Multinomial log-linear model [xxxi].Discriminant analysis [xxxii].Basti [xxxiii]. Boosting [xxxiv]. Han [xxxv]. Dechow and et al [xxxvi]. Tiffani & Marfuah [xxxvii]. Tessa & Harto [xxxviii]. chung [xxxix]. O’Keefe [xl]. Lowensohn [xli]. Reck [xlii]. Amaliah et al [xliii]. Indarto& Ghozali | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مراجع | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
یادداشتها
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
آمار تعداد مشاهده مقاله: 1,201 تعداد دریافت فایل اصل مقاله: 640 |