نوع مقاله : مقاله پژوهشی
نویسندگان
1 استادیار حسابداری دانشگاه پیام نور
2 مربی دانشگاه پیام نور
3 مدرس دانشگاه پیام نور
4 دانشجو کارشناسی ارشد دانشگاه آزاد واحد الکترونیک
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
The present study is aimed to assess whether earnings management can be discovered on the basis of Machine Learning methods, so models based on Machine Learning (Ant Colony Optimization Algorithm and Bacteria Foraging) are applied to forecast earnings management. To do this, 143 firms listed in Tehran Stock Exchange are examined over a period from 2009 to 2013. Furthermore, Particle Swarm Optimization (PSO) is utilized in order to distinguish significant variables of earnings management and finally, earnings management is forecasted through the application of Matlab Software. Findings achieved from the fitness of Bacteria Foraging and Ant Colony Optimization algorithms indicates that these two algorithms are capable of forecasting earnings management with the accuracy of %98. Results show that Ant Colony Optimization model is more successful (error: %0.97) than Bacteria Foraging (error: %1.19) in earnings management forecasting.
کلیدواژهها [English]
مقدمه
برای تکنولوژیهای سنتی حسابرسی مشکل است که زمان، منابع انسانی، مخارج و تأثیر رفتارهای غیرعادی بر اطلاعات مالی پیچیده و بزرگ را محدود نمایند. لذا توسعه مدل پیشبینی برای مدیریت سود برای حسابرسان نیز به منظور شناسایی درجه دستکاری در صورتهای مالی مفید است (چانگ و همکاران، 2005). پیشبینی از این نظر که عنصر بنیادین و کلیدی در تصمیمگیری استفادهکنندگان درون سازمانی و همچنین برون سازمانی محسوب میشود، مهم است. براین اساس، کارایی و اثربخشی نهایی هر تصمیم، به نتایج رویدادهایی بستگی دارد که به دنبال هر تصمیم روی میدهد. بدین ترتیب تصمیمی کارا و اثربخش خواهد بود که براساس پیش بینیهایی انجام گیرد که مبنای آن صحیح بوده باشد. یکی از این پیشبینیها، پیش بینی مدیریت سود میباشد. از نظر رونن و سادن (1981) مدیریت سود تلاش عمدی مدیریت جهت انتقال اطلاعات خاص به استفادهکنندگان صورتهای مالی تعریف میشود. شیپر (1989) دخالت هدفمند در فرآیند گزارشگری مالی برون سازمانی به منظور تحصیل منافع شخصی را مدیریت سود تعریف میکند. پیش بینیهای دقیق و به موقع مدیریت سود، موجب بهبود تصمیمگیری استفادهکنندگان از گزارشهای حسابداری می شود. چنانچه سرمایهگذاران گذشته را مبنایی برای آینده قرار دهند، آنها با استفاده از اطلاعات گذشته میتوانند حدس بزنند که در آینده وضعیت شرکت چگونه خواهد بود، ولی تنها این یک حدس است که بر اساس اطلاعات گذشته به دست آمده است؛ در حالیکه آینده ممکن است بسیار با گذشته تفاوت داشته باشد. در این رابطه نظریه نمایندگی بر اساس فرض تضاد منافع میتواند به بیان دلایل مدیریت سود بپردازد (حبیب زاده، 1389). بر اثر ایجاد تضاد منافع که از نتایج ایجاد شرکتهای سهامی بزرگ است، رابطه مالک - نماینده و نظریه نمایندگی شکل گرفته و وجود مکانیسم نظارتی موثر بر مدیریت، جهت اطمینان از اعمال مدیریت صحیح در جهت منافع سهام داران، ضرورت مییابد. در ساختار کسب و کار جاری، تفکیک مالکیت از مدیریت اجتنابناپدیر است و عدم وجود مکانیسم نظارتی موثر بر مدیریت در چنین شرکتهایی احتمال تخصیص ناکارآمد منابع و گسترش مشکلات سازمانی را افزایش میدهد و این امر غالباً منجر به صدور گزارشهای غیر شفاف و گمراهکننده برای پنهان کردن مشکلات از دید سهامداران میگردد (جوهاری و همکاران، 2008). در مدیریت سود، مدیریت قضاوت خود را در ارتباط با گزارشگری مالی یا سازماندهی رویدادها به منظور تغییر گزارشهای مالی به کار میگیرد. چه این کار به منظور گمراه کردن سهامداران در مورد عملکرد شرکت، یا به منظور تاثیر بر نتایج قراردادهای متکی به ارقام گزارش شده حسابداری باشد. صورتهای مالی نادرست تا زمانی که عدم صحت آنها معلوم شود متناوباً مدیران خوشبین را ترغیب به سرمایه گذاری میکند. تحت چنین شرایطی تلاش جهت دستیابی به ارزش مورد انتظار بازار سرمایه و اهداف سوددهی بالا، میتواند سرمایهگذاران، کارمندان، مشتریان و غیره را تحت تأثیر قرار دهد (خانی، 1382). عمل مدیریت سود با توجه به مدیریت کردن ادراک استفادهکنندگان از گزارشهای مالی، یک عمل غیراخلاقی به شمار میآید (جوهاری و همکاران، 2008). دیچاو و اسکینر (2000) بیان میکنند که حسابداران، مدیریت سود را به عنوان مشکلی میدانند که نیاز به یک عمل کنترلی فوری دارد. طبق نتایج تحقیق رافیک در سال 2002 که با استفاده از ابزار پرسشنامه انجام داده است، اکثریت پاسخدهندگان باور ندارند که دستکاری سود یک عمل اخلاقی است. از سوی دیگر، برخی نیز بر این عقیدهاند که مدیریت سود عملی است که به وسیله شرکتها در جهت منافع سرمایهگذاران صورت میپذیرد. هیلی و والن (1999) معتقدند که گزارشگری مالی میتواند ارزش شرکت را افزایش دهد. از اینرو، استانداردهای پذیرفته شده حسابداری باید برای مدیران جایگزینهای مورد نیاز را در روشها و به کارگیری قضاوت و برآورد در جهت گردآوری اطلاعات عملکرد شرکت، از قبیل به کارگیری مفروضات براساس اصول پذیرفته شده عمومی تشریح شده در استانداردها فراهم آورد.
از این رو دو عقیده کاملاً متضاد وجود دارد و این اختلاف نظر، کنترل اختیار مدیریت در انتخاب رویههای متنوع حسابداری را دشوار میسازد. در این ارتباط بلک (1998) معتقد است مدیران شرکتهایی که مالکان متعدد دارند و از سهامداران عمده برخوردار نیستند، انگیزه بیشتری برای مدیریت سود دارند. زیرا، هزینه پردازش اطلاعات برای سهامداران جزء توجیه اقتصادی ندارد. در نتیجه، آنها مجبورند به اطلاعات سود و زیان گزارش شده توسط مدیریت شرکتها اتکا کنند. دیچو و همکاران (1995) معتقدند شرکتهایی که تعداد اعضای هیأت مدیره آنها زیاد است و این اعضا نیز عمدتاً موظف هستند، در مقایسه با دیگر شرکتها، از مدیریت سود بیشتری استفاده میکنند. به اعتقاد پورتر (1992) در شرکتهایی که سرمایهگذاران نهادی بخش عمده مالکیت شرکت را به عهده دارند، به دلیل این که آنان بر سودهای نزدیک به سودهای پیش بینی شده تاکید میکنند، احتمال انجام مدیریت سود در مقایسه با دیگر شرکتها بیشتر است. ماتسوموتو (2002) به این نتیجه رسید شرکتهایی که عمده سهام آنها متعلق به سرمایهگذاران نهادی است، با احتمال بیشتری از مدیریت سود برای دستیابی به شاخص از پیش تعیین شده (سود) استفاده میکنند. فرانکل و همکاران (2002) نسبت بازده داراییها را به عنوان شاخص اندازهگیری عملکرد شرکت در نظر گرفتند و به این نتیجه رسیدند که نسبت مزبور بر مدیریت سود موثراست. مک نیکولز (2000) و بارتون و سیمکو (2002) شاخص اندازهگیری عملکرد را نسبت بازده حقوق صاحبان سهام و میزان فروش شرکت انتخاب کردند و به این نتیجه رسیدند که هر دو شاخص مزبور با مدیریت سود رابطه دارند. دیچو و دیچو (2002) اعتقاد دارند میزان فروش بر مدیریت سود موثر است. نجاری و همکاران (2014) با استفاده از متغیرهای نسبت جاری، نسبت وجه نقد عملیاتی به داراییها، نسبت جاری، نسبت بدهی به حقوق صاحبان سهام، اهرم مالی، مالکان نهادی، هزینههای سیاسی، تغییرات سود، ساختار مالکیت، تغییرات حسابرس و نوع صنعت مدلی را ایجاد کردند که با دقت 94 درصد میتوانست به پیشبینی مدیریت سود بپردازد. بداغی و بزاززاده (1387) کیفیت افشا را به عنوان متغیری موثر بر مدیریت سود معرفی کردند. کردستانی و آشتاب (1388) از سود هر سهم برای پیشبینی مدیریت سود استفاده نمودند. چالاکی و یوسفی (1391) با استفاده از درصد مالکیت سهامداران نهادی، نسبت بدهی، اندازه شرکت، مالیات بردرآمد، تغییر پذیری فروش، تغییرپذیری سود، وجوه نقد حاصل از فعالیتهای عملیاتی، نسبت کیفیت سود، گردش مجموع داراییها، بازده فروش، بازده سرمایهگذاری و بازده حقوق صاحبان سهام مدلی را با استفاده از درخت تصمیم ایجاد نمودند که دقت 74 درصدی در پیشبینی مدیریت سود داشت.
هدف این پژوهش معرفی متغیرهای موثر بر مدیریت سود وهمچنین ارائه الگو وکشف مدیریت سود با استفاده از الگوریتم کلونی مورچهها وغذایابی باکتری میباشد.
فرضیههای تحقیق
طبق نتایج مطالعات تسی و چیو (2009) نه تنها میتوان با استفاده از مدلهای ریاضی، مدیریت سود را کشف نمود، بلکه مدلهای مبتنی بر رگرسیون خطی در کشف مدیریت سود در مقایسه با مدلهای مبتنی یادگیری ماشین، دارای قدرت توضیحدهندگی کمتر (یا خطای بیشتر) است. در این پژوهش با استفاده از دو الگوریتم کلونی مورچهها و غذایابی باکتری اقدام به پیشبینی مدیریت سود گردیده است. لذا فرضیههای این تحقیق به شرح زیر طراحی و آزمون شده است:
فرضیه1: کشف مدیریت سود بر اساس الگوریتم کلونی مورچهها، امکانپذیر است.
فرضیه 2: کشف مدیریت سود بر اساس الگوریتم غذایابی باکتری، امکانپذیر است.
مروری بر پیشینه
سوکوچیپ و همکاران (2013) به بررسی اثر متغیرهای مرتبط با هیاتمدیره بر مدیریت سود پرداخت. نتایج تحقیق رابطه معنیداری را بین متغیرهای اندازه هیاتمدیره، جلسات هیاتمدیره و دوگانگی نقش مدیرعامل با مدیریت سود نشان نمیدهد. سلیمان و رجب (2013) به بررسی عوامل موثر بر مدیریت سود در بورس اوراق بهادار مصر پرداختند. این تحقیق به بررسی اثر استقلال هیاتمدیره، دوگانگی نقش مدیرعامل و اندازه هیاتمدیره بر مدیریت سود پرداخته است. نتایج تحقیق رابطه معنیداری بین متغیرهای مزبور با مدیریت سود نشان نداده است. چی و همکاران (2014) در تحقیق خود به بررسی تأثیر مالکیت بلندمدت و کوتاهمدت صندوقهای سرمایهگذاری با توجه به انواع مختلفی از مدیریت سود در چین پرداخته است. نتایج نشان میدهد که مدیریت سود در صندوقهای سرمایهگذاری تحت کنترل دولت کمتر از شرکتهای غیردولتی میباشد. فیلیپ و رافورنیر در سال 2014 به بررسی بحران مالی بر رفتار مدیریت سود شرکتهای اروپایی پرداختهاند. نتایج نشان میدهد که مدیریت سود بطور قابل توجهی در سالهای بحران مالی کاهش یافته است. اندرینی و یانگ در سال 2014 ارتباط وضعیت رقابت در بازارهای فروش محصول و اقلام تعهدی مورد بررسی قرار دادهاند. نتایج نشان میدهد که شرکتهایی که در بازارهای با رقابت کمتر فعالیت دارند، تمایل بیشتر به مدیریت سود دارند. نجاری و همکاران (2014) در تحقیق خود اقدام به پیشبینی مدیریت سود نمودند. تحقیق مزبور بین سالهای 2004 تا 2010 در بورس اوراق بهادار تهران صورت پذیرفته است. مدیریت سود در این تحقیق با استفاده از اقلام تعهدی اختیاری اندازهگیری شده است و جهت پیشبینی مدیریت سود نیز از الگوریتم ماشین بردار پشتیبان استفاده شده است. نتایج تحقیق بیانگر آن است که الگوریتم مذکور توانایی مناسبی جهت پیش بینی مدیریت سود دارد.
اخگر (2015) به بررسی رابطه بین اظهارنظر حسابرس، مدیریت سود و مدیریت سود واقعی پرداخت. در این تحقیق جهت بررسی فرضیهها از 2818 سال-شرکت و از اقلام تعهدی جهت کمی نمودن مدیریت سود استفاده گردید. نتایج بیانگر رابطهای معنیدار بین اظهارنظر حسابرس و مدیریت سود میباشد؛ لکن رابطهای بین اظهارنظر حسابرس و مدیریت سود واقعی یافت نشده است.
حجازی و همکاران (1391) نشان دادند که روش شبکه عصبی و درخت تصمیم در پیشبینی مدیریت سود نسبت به روشهای خطی دقیقتر و دارای سطح خطای کمتری است. ضمناً مدیریت سود با متغیرهای اقلام تعهدی اختیاری و غیر اختیاری دوره قبل و عملکرد شرکت، اندازه، تداوم سود در هر دو روش دارای بیشترین ارتباط است. رحمانی و اربابی در سال 1393 نشان دادند که تفاوت مالیات ابرازی و تشخیصی با مدیریت سود رابطه معناداری دارد و مدلهای مختلف مدیریت سود در تبیین این رابطه تفاوت چندانی ندارند.
روش پژوهش
در تحقیق حاضر مدیریت سود با استفاده از الگوریتمهای کلونی مورچهها و غذایابی باکتری پیش بینی میشود. متغیر وابسته تحقیق حاضر مدیریت سود است. در این تحقیق، اقلام تعهدی اختیاری به عنوان نماینده مدیریت سود در نظر گرفته شده است. با توجه به این که براساس نتایج تحقیقات گذشته مدل تعدیل شده جونز (1991) قویترین مدل اندازهگیری اقلام تعهدی است (دیچاو و همکاران، 1995)، در تحقیق حاضر جهت تعیین اقلام تعهدی از این مدل استفاده شده است. در مدل مذکور، در مرحله اول میبایست کل اقلام تعهدی اندازهگیری شود. جمع اقلام تعهدی در تحقیق حاضر با استفاده از روش ترازنامه ای و به شرح مدل (1) محاسبه گردیده است:
مدل (1) |
TAt = (ΔCAt - ΔCasht) - (ΔCLt - ΔCPLt) - DEPt |
که در این رابطه:
TAt |
= |
جمع اقلام تعهدی در سال t |
ΔCAt |
= |
تغییر داراییهای جاری در سال t |
ΔCasht |
= |
تغییر وجه نقددر سال t |
ΔCLt |
= |
تغییر بدهی جاریدر سال t |
ΔCPLt |
= |
تغییر حصه جاری بدهی بلندمدتدر سال t |
DEPt |
= |
هزینه استهلاک داراییهای ثابت در سال t |
سپس اقلام تعهدی غیر اختیاری به تفکیک صنعت با استفاده از مدل (2) محاسبه میگردد:
مدل (2) |
که در این رابطه:
NDAt |
= |
اقلام تعهدی غیر اختیاری |
At-1 |
= |
کل داراییها در سال t-1 |
ΔREVt |
= |
تغییردر درآمد سالانه (مبلغ درآمد سال t منهای مبلغ درآمد سال قبل) |
ΔRECt |
= |
تغییردر حسابهای دریافتنی (حسابهای دریافتنی سال t منهای حسابهای دریافتنی سال قبل) |
PPEt |
= |
اموال و ماشینآلات همان سال |
α، 1β و2 β |
= |
پارامترهای خاص شرکت میباشد که با استفاده از مدل (3) بدست میآید: |
مدل (3) |
و در نهایت اقلام تعهدی اختیاری به عنوان نماینده مدیریت سود به مدل (4) محاسبه میگردد:
مدل (4) |
که در این رابطه:
DAt |
= |
اقلام تعهدی اختیاری (نماینده مدیریت سود) |
متغیرهای مستقل تحقیق شامل نسبتهای سودآوری، نسبتهای فعالیت، نسبتهای نقدینگی، نسبتهای بدهی و متغیرهای کیفی میباشند. تعریف عملیاتی و نحوه برآورد و اندازهگیری هر یک از متغیرهای مذکور به شرح زیر ارائه شده است.
نگاره (1): متغیرهای تحقیق
نام متغیر/روش محاسبه/منبع مورد استفاده |
حاشیه سود ناخالص: سود ناخالص به فروش خالص (نجاری و همکاران (2014) |
بازده دارایی: سود خالص به جمع داراییها (مردای و همکاران، 2012) |
بازده حقوق صاحبان سهام: سود خالص به حقوق صاحبان سهام (بارتون و سیمکو، 2002) |
سود هر سهم: سود خالص به تعداد سهام (کردستانی و آشتاب، 1388) |
هزینههای سیاسی: لگاریتم طبیعی تعداد کارکنان شرکت (نجاری و همکاران، 2014) |
تغییرات سود: تفاوت سود دوره جاری نسبت به دوره قبل تقسیم بر جمع داراییهای دوره قبل (نجاری و همکاران، 2014) |
نسبت گردش کل دارایی: درآمد حاصل از فروش به کل داراییها (چالاکی و یوسفی، 1391) |
تغییرات حسابرس: اگر حسابرس نسبت به دوره قبل تغییر کرده باشد از متغیر مصنوعی یک و در غیر این صورت متغیر مصنوعی صفر استفاده میشود (نجاری و همکاران، 2014) |
مالیات بردرآمد: هزینههای مالیات تقسیم بر سود قبل از مالیات (چالاکی و یوسفی، 1391) |
نسبت کیفیت سود: جریانات نقدی ناشی از فعالیتهای عملیاتی بر سود عملیاتی (چالاکی و یوسفی، 1391) |
وجه نقد عملیاتی به داراییها: نسبت وجه نقد عملیاتی به جمع داراییها (نجاری و همکاران، 2014) |
نسبت جاری: دارایی جاری به بدهی جاری (نجاری و همکاران، 2014) |
بدهی به دارایی: نسبت جمع بدهیها به جمع داراییها (مردای و همکاران، 2012) |
بدهی به حقوق صاحبان سهام: نسبت بدهیها به حقوق صاحبان سهام (نجاری و همکاران، 2014) |
کیفیت افشا: امتیاز افشا گزارش شده توسط بورس اوراق بهادار (بداغی و بزاززاده، 1387) |
نقش دوگانه مدیرعامل: متغیر مصنوعی است و در صورتی که مدیرعامل و رئیس هیاتمدیره یک نفر باشند به آن عدد یک و در غیر این صورت عدد صفر اختصاص داده میشود (مردای و همکاران، 2012) |
اعضای غیرموظف هیاتمدیره: نسبت اعضای غیرموظف به کل اعضا (مردای و همکاران، 2012) |
مالکان نهادی: سهام متعلق به سهامداران بالای 5 درصد (پورتر، 1992) |
وجود حسابرس داخلی: متغیر مصنوعی است و در صورت وجود حسابرس داخلی به آن عدد یک و در غیر این صورت عدد صفر اختصاص داده میشود (حبیب زاده، 1389) |
نوع مالکیت: متغیر مصنوعی است و در صورتی که عمده سهام شرکت متعلق به بخش دولتی باشد به آن عدد یک و در غیر این صورت عدد صفر اختصاص داده میشود (نجاری و همکاران، 2014) |
جامعه آماری این تحقیق شامل تمامی شرکتهای پذیرفته شده در بورس اوراق بهادار تهران است که در دوره مورد بررسی تغییر دوره مالی نداشته باشند، شرکتهای سرمایهگذاری، واسطهگریهای مالی، بانک ولیزینگ نباشند و دادههای مورد نظر آنها در دسترس باشد. بر این اساس 143 شرکت طی سالهای 1388 تا 1392 به عنوان جامعه آماری انتخاب شده است.
تجزیه و تحلیل آماری
در این تحقیق جهت پیشبینی مدیریت سود از روشهای غذایابی باکتری2 و الگوریتم کلونی مورچهها3 استفاده شده است. پنج فرآیند در روش پیشنهادی وجود دارد که به ترتیب عبارت است از انتخاب دادهها، پاکسازی دادهها، تقسیم دادهها به مجموعههای آموزشی و ارزیابی، فرآیند آموزش مدل و ارزیابی مدل آموزش داده شده با دادههای ارزیابی که تاکنون توسط الگوریتمها مشاهده نشده است. مرحله اول، انتخاب دادهها است. در این مرحله دادههای مورد نیاز که شامل مدیریت سود و متغیرهای ورودی لیست شده در نگاره (1) است جمع آوری میگردد.
مرحله دوم، پاکسازی دادهها است. در این تحقیق جهت اجرای بخش دوم از رگرسیون گام به گام در انتخاب متغیرهای ورودی استفاده میگردد. انتخاب این متغیرها یکی از مهمترین اهداف در پیشپردازش دادهها است. این مساله شامل فرآیند تعیین ورودیهای مرتبط و حذف صفاتی که زائد بوده و اطلاعات اندکی فراهم میکنند، میباشد. انجام فرآیند انتخاب ورودیها قبل از به کارگیری یک الگوریتم یادگیری مزایای فراوانی دارد. با حذف تعداد زیادی از ورودیهای نامربوط، روشهای یادگیری آموزشی، هزینه محاسباتی و زمان کمتری را متحمل میشوند. همچنین مدل به دست آمده سادهتر میشود که غالباً تفسیر آن آسانتر و در عمل مفیدتر و سودمندتر میباشد. همچنین مدلهای ساده هنگامی که برای پیشبینی به کار میروند، دارای کلیت و عمومیت بهتری میباشند. بنابراین مدلی که دارای ورودیهای کمتری است، مزیتهای بیشتر و دقت بالاتری دارد. یکی از روشهایی که برای این منظور به کار میرود روش pso میباشد. روشpso در سال 1995 توسط دکتر ابرهارت و دکتر کندی ارائه شد و ایده اصلی آن از رفتار دسته جمعی ماهیها یا پرندگان به هنگام جستجوی غذا الهام گرفته شده است (دودا و همکاران، 2001). برای انتخاب مؤلفههای تأثیرگذار بر مدیریت سود از دو بردار به شرح زیر استفاده شده است:
بردار اول (S): یک بردار با مقادیر دودویی که مشخص میکند که آیا متغیر مستقل بر مدیریت سود تأثیرگذار است یا خیر.
بردار دوم (W): یک بردار با مقادیر واقعی که برای محاسبه وزنهای معادله خطی 1 استفاده میشود. این دو بردار در مدل (6) و (7) نشان داده شدهاند (دودا و همکاران، 2001).
مدل (5) |
|
مدل (6) |
|
مدل (7) |
با در نظر گرفتن این که تعداد کل است، مدل (5) تابعی است که الگوریتم PSO سعی در یافتن ضرایب دارد. برای وارد کردن این کدگذاری به PSO هر ذره PSO به صورت یک بردار دو قسمتی انتخاب کردیم. به این صورت که هر ذره دارای 2*n قسمت است که n قسمت اول برای بردار X که برای تأثیرگذار بودن یا نبودن متغیر در پیشبینی مدیریت سود است و n قسمت دوم برای Z است که هر مقدار آن متناظر با یکی از Xiها است. برای متغیرهایی که مقدار si انها برابر صفر است، wi تأثیری در مدل (5) ندارد؛ به این معنی که متغیر مربوطه در پیشبینی مدیریت سود تأثیرگذار نیست. مقدار n در این مقاله عدد 20 است؛ زیرا 20 متغیر مستقل وجود دارد. در نگاره زیر خطاهای مختلف در پیشبینی مدیریت سود برای دادههای آموزش، اعتبارسنجی و ارزیابی نشان داده شده است.
نگاره (2): خطای پیش بینی
Train |
Validation |
Test |
|
009/0 |
0128/0 |
0122/0 |
MSE |
5081/0 |
7128/0 |
6969/0 |
SMAPE |
4539/0 |
3576/0 |
4868/0 |
R2 |
در نگاره زیر متغیرهای انتخابی و وزن هر کدام از متغیرها با دقت 3 رقم اعشار برای مدل (5) نشان داده شده است. الگوریتم پیشنهادی 6 متغیر را از بین 20 متغیر انتخاب کرده است.
نگاره (3): لیست متغیرهای مستقل انتخابی
ردیف |
نام متغیر |
وزن متغیر |
ردیف |
نام متغیر |
وزن متغیر |
1 |
حاشیه سود ناخالص |
000/0 |
11 |
وجه نقد عملیاتی به داراییها |
000/0 |
2 |
بازده دارایی |
95/0- |
12 |
نسبت جاری |
775/0 |
3 |
بازده حقوق صاحبان سهام |
000/0 |
13 |
بدهی به دارایی |
000/0 |
4 |
سود هر سهم |
000/0 |
14 |
بدهی به حقوق صاحبان سهام |
000/0 |
5 |
هزینههای سیاسی |
000/0 |
15 |
کیفیت افشا |
000/0 |
6 |
تغییرات سود |
141/1 |
16 |
نقش دوگانه مدیرعامل |
000/0 |
7 |
نسبت گردش کل دارایی |
000/0 |
17 |
اعضای غیر موظف هیات مدیره |
000/0 |
8 |
تغییرات حسابرس |
000/0 |
18 |
مالکان نهادی |
214/0- |
9 |
مالیات بردرآمد |
000/0 |
19 |
وجود حسابرس داخلی |
088/0 |
10 |
نسبت کیفیت سود |
474/0- |
20 |
نوع مالکیت |
000/0 |
طبق نتایج نگاره فوق 6 متغیر بازده دارایی، تغییرات سود، نسبت کیفیت سود، نسبت جاری، مالکان نهادی و وجود حسابرس داخلی جهت ورود به مدل دادهکاوی تایید گردیده است. سایر متغیرها نیز به دلیل آنکه وزنی در مدل ندارند، وارد مدل دادهکاوی نمیگردند.
مرحله سوم تقسیم دادهها میباشد. یکی از معیارهایی که برای ارزیابی یک تخمینگر مورد استفاده قرار میگیرد، نرخ خطا4 است که انواع مختلفی دارد. بطور کلی نمیتوان با مقایسه خطای محاسبه شده روی دادههای یادگیری، قضاوت مناسبی در خصوص تواناییهای الگوریتمها انجام داد. معمولاً نرخ خطا روی دادههای یادگیری کمتر از نرخ خطا روی دادههایی است که در فرآیند یادگیری دیده نشدهاند. با این استدلال، نمیتوان از خطای یادگیری برای مقایسه دو الگوریتم استفاده نمود. دلیل این است که برای مدلهای پیچیدهتر، تخمینگرهایی که معمولاً دارای پارامترهای بیشتری هستند، دارای مرز پیچیدهتری هستند. این مرز پیچیده باعث کاهش خطا بر روی دادههای یادگیری در مقایسه با مدلهای سادهتر میشود. بنابراین علاوه بر مجموعه دادههای یادگیری، مجموعهای از دادهها برای ارزیابی5 مورد نیاز است. از دادههای آموزش برای یادگیری مدل و از دادههای ارزیابی به منظور محاسبه نرخ خطای الگوریتم روی دادههایی که تا کنون مشاهده نکرده است، استفاده میشود. البته برای اینکه ارزیابی مناسب باشد، یک بار اجرای الگوریتم کفایت نمیکند. معمولا الگوریتمها تمایل دارند که نرخ خطای تخمینی خود را به نرخ خطای واقعی نزدیک کنند و این امر با اجرای بارها و بارها فرآیند یادگیری و ارزیابی امکانپذیر است. بنابراین زمانی که یک مجموعه داده در اختیار گذاشته میشود، بایستی بخشی از آن را برای ارزیابی نهایی کنار گذاشت و از بقیه برای یادگیری استفاده کرد و مجدداً دو مجموعه را تغییر داده و دوباره مدل را ارزیابی کرد. یکی از روشهای معمول برای این منظور روش اعتبار سنجی دهگانه6 نام دارد (آلپایدین، 2010). در این روش مجموعه دادهها به قسمت مساوی، به صورت تصادفی تقسیم میگردد. زوج مجموعه به صورت تصادفی استخراج میشود که در آن متغیرهای مستقل و متغیر وابسته نمونه iام است. در اجرای اول قسمت اول از K قسمت به منظور ارزیابی،K-1 قسمت باقیمانده برای یادگیری استفاده میشود. در اجرای دوم قسمت دوم از K قسمت به منظور ارزیابی، k-1 قسمت باقیمانده برای یادگیری استفاده میشود. Y مرتبه الگوریتم به همین روال اجرا میگردد. مجموعه دادههای یادگیری و ارزیابی باید به اندازه کافی بزرگ باشند تا خطای تخمینی، به مقدار واقعی نزدیکتر باشد. در عین حال دادههای یادگیری و ارزیابی با دادههای یادگیری و ارزیابی سایر تکرارها، باید کمترین همپوشانی را داشته باشند تا به این وسیله تمام دادهها در فرآیند یادگیری و ارزیابی دخالت داده شوند. در این روش دو نکته وجود دارد. نکته اول اینکه نسبت مجموعه ارزیابی به یادگیری کوچک است. همچنین هر چقدر مقدار N (تعداد کل نمونههای مجموعه دادهها) افزایش یابد میتوان مقدار پارامتر K را کاهش داد و اگر مقدار N کوچک باشد، باید مقدار K را آنقدر بزرگ در نظر گرفت که تعداد نمونههای لازم برای عمل یادگیری فراهم باشد. چنانچه مقدار K برابر N در نظرگرفته شود، این روش به روش خارجی تبدیل میشود. در نمودار زیر چهار تکرار اول انتخاب مجموعه دادههای یادگیری و ارزیابی روش اعتبارسنجی دهگانه نشان داده شده است (آلپایدین، 2010).
نمودار (1): روش اعتبار سنجی ده گانه
در هر بار تکرار یک نرخ خطا برای دادههای یادگیری و ارزیابی محاسبه میگردد و در نهایت میانگین نرخهای خطای بدست آمده به عنوان نرخ خطا دادههای یادگیری و دادههای ارزیابی انتساب داده میشود. برای ارزیابی مدلهای پیش بینی از معیار ارزیابی با نام میانگین قدرمطلق خطا7 (MSE) استفاده شده است که با استفاده از مدل (8) محاسبه میگردند.
مدل(8)
که در آن مدیریت سود شرکت iام، مدیریت سود پیشبینی شده توسط الگوریتم هوشمند، n تعداد دادههای مجموعه مورد بررسی (آموزش، اعتبارسنجی، ارزیابی) است. میزان خطای پیشبینی را برای شرکت iام نشان میدهد. هر چه MSE نزدیکتر به صفر باشد، پیشبینی الگوریتمها به واقعیت نزدیکتر است (آلپایدین، 2010).
مرحله چهارم، فرآیند آموزش و ارزیابی مدلها در الگوریتمهای تحقیق است. پس از تقسیم نمونهها به دو دسته دادههای یادگیری و ارزیابی، با استفاده از دادههای آموزشی، مدل آموزش ایجاد میشود. برای حل مسئله ابتدا به معرفی مدل آن پرداخته میشود. رابطه زیر تابعی است که الگوریتم تحقیق سعی در یافتن ضرایب bi, i=1,…,m خواهد داشت.
مدل (9)
که در آن b0 عرض از مبدا و bi, i=1,…,m وزنهای هر کدام از متغیرها (xi) (ضرایب تخمینگر) است. xi مقدار متغیر مستقل iام است. biها توسط الگوریتم با استفاده از دادههای آموزشی محاسبه میگردند که اصطلاحا به آن آموزش مدل گفته میشود و سپس با استفاده از دادههای ارزیابی، به ارزیابی مدل پرداخته میشود. یعنی پس از محاسبه bi ها، دادههای ارزیابی به رابطه بالا وارد شده و مقدار MSE محاسبه میگردد (آلپایدین، 2010).
الگوریتم کلونی مورچگان
برای حل مسئله ابتدا به معرفی مدل این الگوریتم پرداخته میشود. مدل (10) تابعی است که الگوریتم کلونی مورچگان سعی در یافتن ضرایب خواهد داشت وقتی که m=7باشد.
مدل (10)
که در آن عرض از مبدا و وزنهای هر کدام از 6 متغیر ( ) (ضرایب تخمینگر) است. مقدار متغیر مستقل iام است. ها توسط الگوریتم ACO با استفاده از دادههای آموزشی محاسبه میگردند که اصطلاحا به آن آموزش مدل گفته میشود و سپس با استفاده از دادههای ارزیابی، به ارزیابی مدل پرداخته میشود. یعنی پس از محاسبه ها، دادههای ارزیابی به مدل (9) وارد شده و مقدار MSE محاسبه میگردد (ادلستین، 1999).
در ادامه به روند یافتن پارامترهای مدل (10) با استفاده از الگوریتم ACO و دادههای آموزشی پرداخته میشود. هنگامی که مورچهها بسوی منابع غذایی یا برعکس از منابع غذایی بسوی لانه حرکت میکنند مادهای بنام فرومن روی زمین ترشح میکنند. مورچهها میتوانند فرومن را بچشند و وقتی میخواهند راه خود را انتخاب کنند، احتمالاً راهی را انتخاب میکنند که دارای غلظت فرومن زیادتری است. هرچه غلظت فرومن بیشتر باشد علاقه مورچه به طی این مسیر بیشتر میشود. فرومن در اثر گذشت زمان تبخیر میشود و در نتیجه در مسیرهای که زیاد طی نشدهاند، فرومن کمتری انباشته میشود. با گذشت زمان کوتاهترین مسیر با حرکت مورچهها بدست میآید، این مسیر تقویت شده و مسیرهای دیگر تضعیف میشوند تا همه مورچهها از یک مسیر کوتاه رفت و آمد کنند (ادلستین، 1999).
مسئله یافتن پارامترها بهصورت مناسب میتواند در یک مساله ACO فرمولبندی شود. در گراف ACO، گرهها و یالهای بین آنها به ترتیب نشاندهنده متغیرهای مستقل و انتخاب متغیرهای مستقل توسط مورچه و پارامتر (bi) مربوط به متغیر مستقل است. گراف توسط یک مورچه برای پیدا کردن یک زیرمجموعه بهینه از متغیرهای مستقل تا جایی پیمایش میشود که تعداد حداقلی از گرهها ملاقات شوند. پیمایش یک مورچه زمانی متوقف میشود که به یک معیار توقف مشخص برسد. نمودار (2) نشاندهنده مسیر انتخاب شده دو مورچه است. متغیرهای مستقل توسط مورچه و پارامتر مربوط به متغیر مستقل (میزان فرمون) توسط مورچه را نشان میدهد. برای سازگار کردن مدل با مدل، مورچهها ابتدا از یک گره مجازی حرکت میکنند. شش گره که پنج تای آنها بیانگر متغیرهای مستقل و یکی بیانگر عرض از مبدا که مقدار آن همواره یک است (x0=1)، میباشد. حال با این نوع بیان مسئله میتوان آن را با الگوریتم ACO حل نمود (ادلستین، 1999).
نمودار (2): دو نمونه از حرکت یک مورچه.
تمایل اکتشافی حرکت مورچهها و میزان فرومن یالها با همدیگر قانون احتمال انتقال را تشکیل می دهند که در مدل (11) نشان داده شده است: (ادلستین، 1999).
مدل (11)
که در آن یک معیار اکتشافی، میزان فرومن بین گره iام و jام، k شماره مورچه است و t زمان (تکرار) است. و به ترتیب وزن فرومن و معیار اکتشافی هستند که در این تحقیق معادل عدد 0. 1 در نظر گرفته شده است. همسایگان گره iام برای مورچه kام را نشان میدهد که در اینجا نشاندهنده متغیرهای مستقلی است که هنوز انتخاب نشدهاند. ابتدا مورچهها در حالت اولیه قرار میگیرند. در هر گام از پیمایش، مورچه kام قانون احتمال انتقال را بهکار میبرد. احتمال اینکه مورچه kام در متغیر مستقل iام (گره xiام) باشد، متغیر مستقل jام (گره xjام) را در تکرار tام انتخاب کرده باشد از مدل (12) محاسبه میگردد.
بروز شدن فرومن بر اساس رابطه زیر انجام میشود.
مدل (12)
که در آن n تعداد مورچهها و میزان تبخیر فرومن را نشان میدهد. همچنین پارامتر برای جلوگیری از تراکم بیش از حد فرومن بکار برده میشود که در این تحقیق معادل عدد 0. 2 در نظر گرفته شد و الگوریتم را قادر می سازد که تصمیمات اشتباهی که قبلاً گرفته شده است، فراموش شوند. اگر یک یال بوسیله مورچهها انتخاب نشود، غلظت فرومن آن بطور تدریجی کاهش پیدا میکند. مقدار فرومنی است که مورچه kام در زمان t بر روی یالهایی که ملاقات کرده است، اضافه میکند و مقدار آن از مدل (13) بدست میآید (ادلستین، 1999).
مدل (13)
که در آن یک ثابت برای بروزرسانی فرومن است که معمولا یک در نظر گرفته میشود و میزان خطای تخمینگر MSE است. در هنگام محاسبه خطا چون همواره میزان فرمونها مثبت است و ضرایب biها میتوانند منفی نیز باشند، از فرمونها مقدار ثابت 30 کم گردید. این عدد با سعی و خطا بدست آمده است. در اینجا مجموعه دادهها به دو دسته دادههای آموزشی و ارزیابی تقسیم شدند. دادههای آموزشی برای یادگیری (بدست آوردن پارامترهای bi رابطه مدل 10) با استفاده از ACO استفاده میگردد. با استفاده از مقدار فرومن ترشح شده بین گرهها برای مورچه kام در زمان t، با استفاده از رابطه 4-2 برای دادههای آموزشی محاسبه میگردد. لازم به ذکر است که مربوط به مورچه kام در لحظه t، bها در مدل (10) است.
الگوریتم غذایابی باکتری:
ایده الگوریتم غذایابی باکتری بر این واقعیت استوار است که در طبیعت، جانداران با روش غذایابی ضعیف احتمال انقراض بیشتری نسبت به جاندارانی با استراتژی غذایابی موفق دارند. پس از نسلهای زیاد، جانداران با روش غذایابی ضعیف نابود شده و یا به حالت های بهتر تغییر شکل میدهند. باکتری E-coil که در روده انسان زندگی میکند، روش غذایابی دارد که بر چهار مرحله استوار است. این مرحله عبارتند از: حرکت، عملکرد گروهی، تولید مثل و حذف پراگندگی (بری و لینوف، 1997).
حرکت: در این مرحله باکتریها شروع به جنبش و شنا میکنند. در واقع بسته به چرخش دم باکتری، باکتری جست و خیز کرده و شروع به حرکت میکند ( جنبش). اگر در مسیر جدید مقدار غذا بهتر بود، باکتری شروع به حرکت در همان مسیر میکند ( شنا). فرض کنید میخواهیم مقدار حداقل را پیدا کنیم که در اینجا تابع هدف پرتفوی است. مکان باکتری (یا همان ها) و نشاندهنده مقدار غذا (مقدار تابع هدف) در مکان است. به ترتیب به این معنی میباشد که باکتری در مکان دارای غذای خوب، خنثی و بد است. برای انجام جنبش، یک بردار با طول واحد به نام تولید میشود. این بردار برای تعریف جهت جدید حرکت باکتری بعد از انجام جنبش، به کار میرود. مکان جدید باکتری به صورت زیر تعریف میشود.
که در آن نشاندهنده مکان باکتری iام در مرحله jام، تولید مثل k ام و نابودی و پخش l ام میباشد. C (i) اندازه حرکت باکتری در جهت حرکت میباشد. اگر اندازهJ(I, j, k, l) در کمتر از اندازه آن در باشد، آنگاه یک گام حرکت دیگر به اندازه C (i) در جهت انجام میشود و باکتری شروع به شنا کردن در جهت میکند. این شنا کردن تا زمانی که اندازه کاهش مییابد و حداکثر تا ماکزیمم تعداد مراحل مجاز شنا کردن، N ادامه مییابد و نشان میدهد که باکتری تا زمانی که در جهت حرکت خود محیط بهتری از لحاظ غذا بیابد، به حرکت در همان جهت ادامه خواهد داد (بری و لینوف، 1997).
عملکرد گروهی: وقتی که یک باکتری مسیر بهتری برای غذا پیدا میکند، باکتریهای دیگر را به سمت خود جذب کرده و باکتریها سریعتر به محل غذای اصلی میرسند. عملکرد دسته جمعی سبب حرکت گروهی باکتریها به سمت غذا میشود. اگر را مجموعه مکانهای باکتری فرض کنیم، عملکرد دسته جمعی به صورت مدل (14) میباشد.
مدل (14)
که بسته به حرکت همه باکتریها، تابعی وابسته به زمان بوده و به مقدار تابع هزینه، J (i,j,k,l) افزوده میشود. بنابراین، باکتریها شروع به تلاش برای پیدا کردن غذا نموده، از مکانهای بی غذا فرار کرده و در همان حین یکدیگر را جذب میکنند و در عین حال بیش از حد به هم نزدیک نمی شوند. ''S'' تعداد کل باکتریها بوده و ''P'' تعداد پارامترهایی است که باید بهینه شوند و به عنوان مختصات مکان باکتری در فضای p بعدی محسوب میشوند. ، ، ، ضرایبی هستند که باید مقدار مناسبی برای آنها بسته به مسئله مورد نظر انتخاب شود (بری و لینوف، 1997).
تولید مثل: نصف تعداد باکتریها که غذای خوبی پیدا نکردهاند، نابود شده و نصف دیگر شامل باکتریهای سالم هر یک به دو باکتری تقسیم شده که در همان مکان قبلی باکتری قرار میگیرند. این عمل، تعداد جمعیت باکتریها را ثابت نگه میدارد. (بری و لینوف، 1997).
حذف و پراکندگی: زندگی جمعیت باکتریها به مرور با مصرف غذا و یا ناگهان در اثر موارد دیگر دچار تغییر میشود. حوادث میتوانند موجب کشته شدن و یا پراکنده شدن باکتریها شوند. این عمل اگر چه در ابتدا ممکن است منجر به برهم خوردن مرحله حرکت به سمت غذا باشد، اما میتواند تأثیر مثبتی هم بر آن داشته باشد. زیرا پراکندگی باکتریها ممکن است آنها را در مکانهایی نزدیک به منابع غذایی خوب قرار دهد. مرحله حذف و پراکندگی از به دام افتادن باکتریها در نقطه بهینه محلی جلوگیری میکند. در هر مرحله حذف و پراکندگی، هر باکتری موجود در جمعیت با احتمال در معرض حذف و پراکندگی قرار میگیرد. برای ثابت نگه داشتن تعداد باکتریها، اگر یک باکتری نابود شود، باکتری جدیدی را به صورت رندم در محدوده فضای جستجو قرار میدهیم. در مسأله برنامهریزی تابع سعی در کاهش مقدار این حاصل جمع یا به عبارت دیگر سعی در افزایش تعداد صفرها در ضرایب دارد. پس از آموزش مدل با استفاده از دادههای آموزشی ضرایب ذخیره میگردد تا در مرحله ارزیابی از آن استفاده گردد (تیبشیرانی، 1996). در مرحله آخر مدل با توجه به طی کردن مراحل قبل مورد ارزیابی قرار خواهد گرفت و نتایج ارائه میگردد. ارزیابی مدل، آخرین مرحله است. نتایج حاصل از اعمال همه دادهها به صورت زیر است:
نگاره (4): نتایج تحقیق
Fold |
الگوریتم کلونی مورچه ها |
الگوریتم غذایابی باکتری |
||
خطای داده یادگیری |
خطای داده ارزیابی |
خطای داده یادگیری |
خطای داده ارزیابی |
|
1 |
924/0 |
025/1 |
23/1 |
025/1 |
2 |
895/0 |
905/0 |
125/1 |
115/1 |
3 |
002/1 |
012/1 |
352/1 |
651/1 |
4 |
981/0 |
812/0 |
986/0 |
052/1 |
5 |
091/1 |
088/1 |
211/1 |
231/1 |
6 |
121/1 |
014/1 |
024/1 |
029/1 |
7 |
025/1 |
963/0 |
036/1 |
214/1 |
8 |
782/0 |
892/0 |
912/0 |
989/0 |
9 |
891/0 |
988/0 |
252/1 |
422/1 |
10 |
14/1 |
012/1 |
004/1 |
191/1 |
میانگین |
985/0 |
971/0 |
113/1 |
192/1 |
نتیجهگیری
مدیریت سود زمانی رخ میدهد که مدیر برای گزارشگری مالی از قضاوت شخصی خود استفاده میکند. اقلام تعهدی سود از یک سو به مدیران اجازه میدهند تا سود را طوری محاسبه کنند که گویای ارزش واقعی بنگاه اقتصادی باشد و از سوی دیگر این اقلام به مدیران اختیار میدهند تا از انعطاف پذیری روشهای و اصول پذیرفته شده حسابداری استفاده کرده و محتوای اطلاعاتی سود را مخدوش کنند. هدف این مطالعه ارزیابی این موضوع بود که آیا میتوان مدیریت سود را بر اساس روشهای مبتنی بر یادگیری ماشین کشف کرد. این تحقیق که با استفاده از اطلاعات مالی 143 شرکت بین سالهای 1388 الی 1392 انجام شده است، نشان میدهد که بین متغیرهای توان بازپرداخت بهره، نسبت سرمایه در گردش، گردش دارایی ثابت، مالکان نهادی، نسبت آنی، وجود حسابرس داخلی، نسبت گردش موجودیها و بازده دارایی با مدیریت سود، همبستگی وجود دارد. همچنین در این تحقیق با استفاده از الگوریتم غذایابی باکتری و کلونی مورچهها اقدام به پیشبینی مدیریت سود شده است که نتیجه پژوهش نشان میدهد هردو الگوریتم توانایی بالایی (بیش از 98%) جهت پیشبینی مدیریت سود دارند. این نتایج با نتیجه پژوهش هاگلوند (2012) تسی و چیو (2009) سازگار است.
این تحقیق با محدودیتهایی نیز همراه بوده است. از جمله این که نتایج حاصل از تحقیق حاضر فقط قابل تعمیم به شرکتهای پذیرفته شده در بورس است. لذا تعمیم نتایج به سایر شرکتها باید با احتیاط صورت پذیرد. با توجه به نتایج تحقیق پیشنهادهای زیر ارائه میشود:
همچنین برای تحقیقهای آتی پیشنهاد میگردد:
پی نوشتها
Bacterial Foragoing |
2 |
Jones |
1 |
Error Rate |
4 |
Adabost |
3 |
K-Fold Cross Validation |
6 |
Test |
5 |
Most Correlated |
8 |
Mean Absolute Error |
7 |
|
|
Convex |
9 |