تنظیم دادهها: مرتبسازی دادهها برای آمادهسازی تحلیل و نمایش
مرتبسازی: اولین گام برای ایجاد نظم در دادهها
مرتبسازی یعنی چیدن دادهها بر اساس یک یا چند معیار مشخص. این کار باعث میشود بتوانیم بزرگترین، کوچکترین یا الگوهای موجود در دادهها را سریعتر تشخیص دهیم. به عنوان مثال، فرض کنید نمرات امتحان ریاضی یک کلاس به صورت پراکنده ثبت شده است: 18, 15, 20, 12, 17. اگر این اعداد را به صورت صعودی (از کمترین به بیشترین) مرتب کنیم، به راحتی میتوانیم کمترین نمره (12) و بالاترین نمره (20) را پیدا کنیم. مرتبسازی میتواند به دو شکل اصلی انجام شود:
- صعودی مرتبسازی از کوچکترین به بزرگترین (برای اعداد) یا از الف به ی (برای حروف).
- نزولی مرتبسازی از بزرگترین به کوچکترین (برای اعداد) یا از ی به الف (برای حروف).
فیلتر کردن: تمرکز بر روی دادههای هدف
فیلتر کردن یعنی انتخاب بخشی از دادهها که دارای شرایط خاصی هستند و نادیده گرفتن بقیه. برای مثال، اگر از بین نمرات یک کلاس فقط بخواهیم نمرات قبولی (مثلاً بالاتر از 10) را بررسی کنیم، دادهها را فیلتر کردهایم. این کار به ما کمک میکند تا تحلیل خود را روی بخش مهمتری از دادهها متمرکز کنیم. فرض کنید در یک نظرسنجی، سن 50 نفر ثبت شده است. برای تحلیل نظر نوجوانان، میتوانیم دادهها را بر اساس شرط سن ≥ 13 و سن ≤ 19 فیلتر کنیم.
جدولبندی: ساختاریافتهترین شکل نمایش دادهها
یکی از بهترین روشها برای نمایش دادههای تنظیمشده، استفاده از جدول است. جدولها اطلاعات را در سطرها و ستونهایی با عناوین مشخص به ما نشان میدهند. برای مقایسه عملکرد دو دانشآموز در سه درس مختلف، یک جدول بسیار گویاتر از چند پاراگراف متن است. در زیر، نمونهای از یک جدول که دادههای فروش یک فروشگاه را پس از مرتبسازی نمایش میدهد، آمده است:
| نام محصول | دستهبندی | تعداد فروش (عدد) | وضعیت موجودی |
|---|---|---|---|
| دفترچه یادداشت ساده | لوازم التحریر | 150 | موجود |
| خودکار بیک | لوازم التحریر | 200 | موجود |
| ماژیک وایتبرد | لوازم التحریر | 75 | اتمام موجودی |
در جدول بالا، دادهها بر اساس ستون «تعداد فروش» به صورت نزولی مرتب شدهاند تا پرفروشترین محصول در بالای جدول دیده شود. همچنین وضعیت موجودی با یک برچسب رنگی مشخص شده است.
کاربرد عملی: تحلیل نتایج یک مسابقه علمی
فرض کنید نتایج یک مسابقه علمی بین دانشآموزان سه مدرسه به صورت زیر ثبت شده است (نام دانشآموز، مدرسه، امتیاز). دادهها به صورت تصادفی هستند و تشخیص برنده کلی یا برترین هر مدرسه دشوار است.
- علی - مدرسه الف - 85
- سارا - مدرسه ب - 92
- رضا - مدرسه الف - 78
- نازنین - مدرسه ج - 95
- حمید - مدرسه ب - 88
با مرتبسازی کل دادهها بر اساس ستون «امتیاز» به صورت نزولی، به راحتی متوجه میشویم که نازنین با 95 امتیاز، نفر اول مسابقه است. همچنین با فیلتر کردن دادهها برای هر مدرسه و سپس مرتبسازی، میتوانیم بهترین دانشآموز هر مدرسه را پیدا کنیم. برای مثال، پس از فیلتر کردن برای مدرسه ب، دادهها به صورت (سارا:92، حمید:88) نمایش داده میشوند و سارا به عنوان نفر برتر مدرسه ب معرفی میشود.
چالشهای مفهومی
چالش اول: تفاوت مرتبسازی با فیلتر کردن چیست؟
مرتبسازی، ترتیب نمایش دادهها را تغییر میدهد اما همه دادهها را نشان میدهد (مثلاً همه دانشآموزان را به ترتیب نمره لیست میکند). در مقابل، فیلتر کردن، برخی از دادهها را بر اساس یک شرط حذف کرده و فقط بخشی از دادهها را نمایش میدهد (مثلاً فقط دانشآموزانی که نمره بالای 90 دارند).
چالش دوم: اگر دادهها شامل حروف و اعداد باشند، مرتبسازی چگونه انجام میشود؟
مرتبسازی بر اساس نوع داده انجام میگیرد. دادههای عددی بر اساس مقدار عددی مرتب میشوند (1,2,3,...). دادههای متنی (رشتهای) بر اساس ترتیب حروف الفبا مرتب میشوند. اگر در یک ستون، اعداد به صورت متن ذخیره شده باشند (مثلاً "10", "2")، مرتبسازی ممکن است اشتباه انجام شود و "10" را قبل از "2" قرار دهد، چون از نظر حروف الفبا، کاراکتر "1" قبل از "2" است. بنابراین تشخیص نوع داده بسیار مهم است.
چالش سوم: چرا پس از مرتبسازی دادهها، گاهی اوقات مجبور به تکرار این کار میشویم؟
دادهها میتوانند پویا باشند. یعنی ممکن است دادههای جدیدی به مجموعه اضافه شود یا دادههای قبلی ویرایش شوند. برای مثال، اگر نمره جدیدی به لیست نمرات کلاس اضافه شود، ترتیب قبلی به هم میخورد و برای مشاهده دوباره رتبهبندی، باید دادهها را مجدداً مرتبسازی کنیم.
پاورقی
1 مرتبسازی (Sorting): فرایند چیدن آیتمها در یک توالی خاص بر اساس یک یا چند کلید.
2 فیلتر کردن (Filtering): فرایند انتخاب زیرمجموعهای از دادهها که معیارهای مشخصی را دارند.
3 تحلیل آماری (Statistical Analysis): فرایند جمعآوری، مدلسازی و تفسیر دادهها برای کشف الگوها و تصمیمگیری.
4 صعودی (Ascending): مرتبسازی از کوچکترین به بزرگترین یا از A به Z.
5 نزولی (Descending): مرتبسازی از بزرگترین به کوچکترین یا از Z به A.