این ارائه به صورت عمومی به تعریف داده کاوی، وظایف ان و کاربردها و چالشهای داده کاوی می پردازد. دادهکاوی (به انگلیسی: Data Mining) به مفهوم استخراج اطلاعات نهان و یا الگوها وروابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ است. بسیاری از مردم داده کاوی را مترادف واژه های رایج کشف دانش از دادهها (KDD) میدانند. دادهکاوی پایگاهها و مجموعههای حجیم دادهها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی (و نیمهماشینی) قرار میدهد. این گونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههای امروزین است که شیوههای ماشینی مربوط به یادگیری، مدلسازی، و آموزش را طلب مینماید.
در سال 1960 آماردانان اصطلاح “Data Fishing” یا “Data Dredging”به معنای “صید داده” را جهت کشف هر گونه ارتباط در حجم بسیار بزرگی از دادهها بدون در نظر گرفتن هیچگونه پیش فرضی بکار بردند. بعد از سی سال و با انباشته شدن دادهها در پایگاه داده اصطلاح داده کاوی در حدود سال 1990 رواج بیشتری یافت. اصطلاحات دیگری نظیر “Data Archaeology” یا “Information Harvesting” یا “Information Discovery” یا “Knowledge Extraction” نیز بکار رفتهاند.
[aparat id=”zr6Oc”]