داده: چراغ راه دنیای امروز
از مشاهده تا عدد: درک مفهوم بنیادی داده
فرض کنید هر روز صبح قبل از رفتن به مدرسه، دمای هوا را با یک دماسنج دیجیتال اندازه میگیرید و عدد 24 را میبینید. این عدد، یک داده است. داده، در سادهترین تعریف، یک ویژگی یا مقدار ثبتشده درباره یک پدیده، رویداد یا شیء است. این ثبت میتواند به صورت عدد، کلمه، صدا یا تصویر باشد. دادهها به خودی خود ممکن است معنای خاصی نداشته باشند؛ مانند یک لیست از اعداد: 18, 72, 160, 24. اما وقتی بدانیم این اعداد به ترتیب نشاندهنده سن، وزن (به کیلوگرم)، قد (به سانتیمتر) و دمای هوا هستند، کمکم نقشهای از یک وضعیت در ذهن ما شکل میگیرد.
داده (Data): حقایق خام و ثبتشده. مثال: نمرات تمام دانشآموزان یک کلاس در امتحان علوم.
اطلاعات (Information): دادههای پردازششده و معنادار. مثال: محاسبه میانگین نمره کلاس و مشخص کردن بالاترین و پایینترین نمره.
خرد (Wisdom): استفاده از اطلاعات برای تصمیمگیری و عمل. مثال: معلم با توجه به میانگین پایین کلاس، تصمیم میگیرد مبحث را با روش دیگری دوباره تدریس کند.
انواع داده: یک طبقهبندی کاربردی
برای کار با دادهها، باید بتوانیم آنها را در گروههای مناسب قرار دهیم. این طبقهبندی به ما کمک میکند روش صحیح جمعآوری، تحلیل و نمایش آنها را انتخاب کنیم.
| نوع داده | تعریف | مثالهای ملموس | قابل اندازهگیری با |
|---|---|---|---|
| کمی2 (عددی) |
دادهای که با اعداد بیان میشود و اعمال ریاضی روی آن معنا دارد. | قد: 175 cm، تعداد گوشیهای فروختهشده: 1200 دستگاه، دمای یخچال: 4 °C | خطکش، ترازو، دماسنج، شمارنده |
| کیفی3 (غیرعددی) |
دادهای که کیفیت، ویژگی یا دستهای را توصیف میکند. معمولاً به صورت کلمه است. | رنگ ماشین (سفید، قرمز)، نظر سنجی (راضی، بیتفاوت، ناراضی)، نوع رشته تحصیلی (ریاضی، تجربی) | پرسشنامه، مشاهده، مصاحبه |
| گسسته4 | داده کمی که فقط مقادیر مشخص و مجزایی میتواند بگیرد. معمولاً با شمردن به دست میآید. | تعداد اعضای خانواده (2,3,4,...)، تعداد دور برداشتن در مسابقه (1,2,3,...)، نتیجه پرتاب تاس (1,2,3,4,5,6) | شمارش |
| پیوسته5 | داده کمی که میتواند هر مقدار اعشاری در یک بازه را بگیرد. معمولاً با اندازهگیری به دست میآید. | قد (172.5 cm)، زمان دویدن (12.75 sec)، وزن یک سیب (0.15 kg) | خطکش مدرج، ترازوی دیجیتال، کرنومتر |
برای مثال، وقتی میخواهید یک موبایل جدید بخرید، با انبوهی از داده روبهرو میشوید: قیمت (کمی)، رنگ (کیفی)، مقدار حافظه داخلی (128 GB - کمی و گسسته)، اندازه صفحه نمایش (6.7 اینچ - کمی و پیوسته) و نظرات کاربران (کیفی). طبقهبندی این دادهها به شما کمک میکند تا مقایسهای سیستماتیک انجام دهید.
داده در عمل: از خانه هوشمند تا برنامهریزی شخصی
کاربرد داده فقط محدود به آزمایشگاهها یا شرکتهای بزرگ نیست. در زندگی روزمره ما نیز جاری است. یک ترموستات هوشمند را در نظر بگیرید. این دستگاه دائماً دادهای کمی و پیوسته مانند دمای اتاق را اندازهگیری میکند. سپس این دادهها را با مقدار دلخواهی که شما تنظیم کردهاید (مثلاً 22 °C) مقایسه میکند. بر اساس این مقایسه (پردازش داده) تصمیم میگیرد که بخاری را روشن یا خاموش کند. خروجی این فرآیند، اطلاعات مفیدی است: «دمای اتاق 20 درجه است، بنابراین سیستم گرمایشی روشن شد.».
حتی برای بهبود عملکرد درسی یا ورزشی میتوان از داده استفاده کرد. فرض کنید میخواهید در دوی 100 متر پیشرفت کنید. هر روز زمان دویدن خود را با کرنومتر ثبت میکنید (جمعآوری دادههای کمی پیوسته). بعد از یک ماه، این اعداد را در یک جدول یا نمودار میریزید (سازماندهی و نمایش). نمودار ممکن است نشان دهد که در هفتههای اول پیشرفت خوبی داشتید اما در دو هفته آخر زمانها ثابت ماندهاند (تولید اطلاعات). این اطلاعات به شما خرد میدهد: «شاید به تغییر در برنامه تمرینی یا استراحت بیشتر نیاز دارم». سپس بر اساس این خرد، عمل کرده و برنامه خود را اصلاح میکنید.
$\bar{x} = \frac{x_1 + x_2 + ... + x_n}{n}$
مثال: نمرات یک دانشآموز در چهار آزمون: 17, 15, 19, 17. میانگین برابر است با: $\frac{17+15+19+17}{4} = \frac{68}{4} = 17$
اشتباهات رایج و پرسشهای مهم
پاسخ: خیر. این اعداد، اگرچه به شکل عدد نوشته میشوند، اما داده کیفی از نوع اسمی6 هستند. چون شما نمیتوانید اعمال ریاضی معناداری روی آنها انجام دهید. میانگین گرفتن از کدهای ملی یا جمع زدن شماره پلاکها نتیجهای به ما نمیدهد. این اعداد صرفاً برای نامگذاری و شناسایی یکتا استفاده میشوند.
پاسخ: دو اشتباه شایع وجود دارد: اول، قضاوت زودهنگام و تصمیمگیری بر اساس یک یا دو داده محدود بدون پردازش و بررسی کلیت آنها. مثلاً بر اساس یک نظر منفی در میان صدها نظر مثبت، از خرید یک محصول صرفنظر کنیم. دوم، اشتباه گرفتن همبستگی7 با علتومعلول8. اگر دادهها نشان دهند با افزایش فروش بستنی، تعداد غرقشدگی در دریا نیز افزایش مییابد، به این معنی نیست که بستنی خوردن باعث غرق شدن میشود! هر دو ممکن است تحت تأثیر یک عامل سوم (مثلاً گرمای هوا و افزایش مراجعه به ساحل) باشند.
پاسخ: حیاتی است. دادههای نادرست یا با دقت پایین، منجر به اطلاعات گمراهکننده و در نهایت تصمیمهای اشتباه میشوند. این اصل به ورودی-خروجی9 معروف است: «ورودی بیارزش، خروجی بیارزش». اگر قد خود را با مترخی که کشیده شده است اندازه بگیرید، داده اولیه (178 cm) اشتباه خواهد بود و تمام محاسبات بعدی (مانند شاخص توده بدنی) نیز خطا خواهند داشت.
پاورقی
1داده (Data): به اطلاعات خام و ثبتشده اطلاق میشود. جمع آن در انگلیسی Datums یا Data sets است.
2داده کمی (Quantitative Data): دادهای که به صورت عددی بیان شده و قابلیت انجام عملیات ریاضی روی آن وجود دارد.
3داده کیفی (Qualitative Data): دادهای که به جای مقدار عددی، کیفیت، ویژگی یا مقولهای را توصیف میکند.
4داده گسسته (Discrete Data): داده کمی که فقط میتواند مقادیر مجزا و معمولاً صحیح بگیرد.
5داده پیوسته (Continuous Data): داده کمی که میتواند هر مقدار عددی در یک بازه پیوسته (اعم از اعشاری) را بگیرد.
6داده اسمی (Nominal Data): نوعی داده کیفی که صرفاً برای برچسبزنی و دستهبندی استفاده میشود و ترتیبی بین آنها وجود ندارد (مانند شماره پلاک).
7همبستگی (Correlation): رابطهای آماری بین دو متغیر که تغییر در یکی با تغییر در دیگری همراه است. لزوماً به معنای رابطه علّی نیست.
8علتومعلول (Causation): رابطهای که در آن تغییر در یک متغیر (علت)، مستقیماً منجر به تغییر در متغیر دیگر (معلول) میشود.
9ورودی-خروجی (Garbage In, Garbage Out - GIGO): یک اصل در علوم رایانه و پردازش داده که بیان میکود اگر دادههای ورودی نادرست یا بیکیفیت باشند، خروجی نیز بیاعتبار خواهد بود.
