Association Rules একটি গুরুত্বপূর্ণ কৌশল যা Data Mining এবং Machine Learning এ ব্যবহৃত হয়, বিশেষত Market Basket Analysis-এ। এটি এমন একটি পদ্ধতি যা ডেটার মধ্যে সম্পর্ক বা সংযোগ খুঁজে বের করে, যা বিভিন্ন আইটেম বা বৈশিষ্ট্যের মধ্যে ঘটে থাকে। সাধারণভাবে, এটি ডেটার মধ্যে প্যাটার্ন বা নিয়ম অনুসন্ধান করতে ব্যবহৃত হয়।
Association Rules মূলত দুটি প্রধান উপাদান নিয়ে গঠিত:
- Antecedent (LHS): যেটি "If" অংশ হিসেবে পরিচিত, এবং এটি একটি শর্ত বা পূর্বধারণা হিসেবে কাজ করে।
- Consequent (RHS): যেটি "Then" অংশ হিসেবে পরিচিত, এবং এটি অনুসন্ধান করা সম্পর্ক বা প্রেডিকশন যা শর্ত পূর্ণ হলে ঘটে।
Association Rules এর মাধ্যমে আমরা জানার চেষ্টা করি: যদি কোন একটি শর্ত পূর্ণ হয়, তবে কোন ঘটনা বা ফলাফল ঘটতে পারে।
Association Rules এর গঠন
Association Rules সাধারণত নিম্নরূপে লেখা হয়:
এখানে,
- A এবং B হল আইটেম বা বৈশিষ্ট্য।
- A → B নির্দেশ করে যে যদি A ঘটে, তবে B ঘটবে।
উদাহরণ: ধরা যাক, একটি সুপারমার্কেটের ডেটা বিশ্লেষণ করা হচ্ছে, যেখানে বিভিন্ন পণ্য একে অপরের সাথে কেনা হয়। এখানে একটি অ্যাসোসিয়েশন রুল হতে পারে:
এই রুলের অর্থ হলো, "যদি কেউ দুধ (Milk) কিনে, তাহলে সে সাধারণত রুটিও (Bread) কিনে।"
Association Rules এর তিনটি প্রধান পরিমাপ (Metrics)
Association Rules বিশ্লেষণ করতে কিছু পরিমাপ বা মেট্রিকস ব্যবহার করা হয় যা সম্পর্কের গুরুত্ব এবং শক্তি নির্দেশ করে। সবচেয়ে সাধারণ তিনটি পরিমাপ হলো:
- Support (সমর্থন):
- Support একটি মেট্রিক যা নির্দেশ করে যে কতবার নির্দিষ্ট আইটেম সেট বা সম্পর্কটি পুরো ডেটাসেটে ঘটেছে।
- Support(A → B) হিসাব করা হয়:
- Support আমাদের বলে দেয়, কতটা সাধারণ বা জনপ্রিয় একটি রুল।
- Confidence (বিশ্বাস):
- Confidence হল, একটি নির্দিষ্ট শর্ত পূর্ণ হলে কতটা সম্ভাবনা রয়েছে যে ফলস্বরূপ ঘটনাটি ঘটবে।
- Confidence(A → B) হিসাব করা হয়:
- Confidence একটি রুলের প্রেডিকশন ক্ষমতা পরিমাপ করে।
- Lift (উত্তোলন):
- Lift একটি পরিমাপ যা দুটি আইটেমের মধ্যে সম্পর্কের শক্তি নির্ধারণ করে, এবং এটি যে সম্পর্কটি সম্পূর্ণভাবে র্যান্ডম নয়, সেটি দেখতে সাহায্য করে।
- Lift(A → B) হিসাব করা হয়:
- Lift এর মান যদি 1 হয়, তাহলে অর্থাৎ, A এবং B একে অপরের উপর নির্ভরশীল নয়। Lift এর মান যদি 1 এর বেশি হয়, তাহলে সম্পর্কটি শক্তিশালী, এবং যদি এটি 1 এর কম হয়, তবে এটি দুর্বল।
Association Rules এর ব্যবহার:
- Market Basket Analysis (বাজার ট্রলি বিশ্লেষণ):
- এটি সবচেয়ে সাধারণ ব্যবহার। যেখানে ক্লায়েন্টের কেনাকাটার তথ্য বিশ্লেষণ করে দেখা হয় কোন পণ্যগুলি একসাথে কেনা হয়। এর মাধ্যমে ব্যবসা পণ্য সুপারিশ বা ক্রস-সেলিংয়ের জন্য কার্যকর কৌশল তৈরি করতে পারে।
- সোশ্যাল মিডিয়া বিশ্লেষণ:
- সোশ্যাল মিডিয়া প্ল্যাটফর্মে কি ধরনের পোস্ট বা কনটেন্ট একসাথে শেয়ার করা হয়, এই সম্পর্কগুলো খুঁজে বের করতে অ্যাসোসিয়েশন রুলস ব্যবহৃত হতে পারে।
- মেডিকেল ডায়াগনোসিস:
- মেডিকেল ডেটা বিশ্লেষণ করে, বিভিন্ন রোগের মধ্যে সম্পর্ক খুঁজে বের করা এবং রোগ নির্ণয় করতে অ্যাসোসিয়েশন রুলস ব্যবহার করা যেতে পারে।
- সাইট নেভিগেশন (Website Navigation):
- একটি ওয়েবসাইটের ব্যবহারকারীরা কি ধরনের পৃষ্ঠা একসাথে পরিদর্শন করে, এই সম্পর্কগুলো জানার জন্য অ্যাসোসিয়েশন রুলস ব্যবহার করা যেতে পারে।
উদাহরণ:
ধরা যাক, একটি সুপারমার্কেটের ডেটাসেট আছে যেখানে 100 টি ট্রানজেকশন বিশ্লেষণ করা হচ্ছে। এবং নিচের অ্যাসোসিয়েশন রুলটি তৈরি করা হয়েছে:
এর মানে হলো, "যদি কেউ ডায়াপার কেনে, তবে সে সাধারণত বিয়ারও কিনে।"
এই রুলের Support, Confidence, এবং Lift বের করার মাধ্যমে আমরা এই সম্পর্কটির শক্তি এবং গুরুত্ব বুঝতে পারি।
উপসংহার:
Association Rules একটি শক্তিশালী টুল যা ডেটার মধ্যে লুকানো সম্পর্ক বা প্যাটার্ন খুঁজে বের করতে ব্যবহৃত হয়। এটি বিভিন্ন ক্ষেত্রে, বিশেষ করে মার্কেটিং এবং ব্যবসায়িক বিশ্লেষণে কার্যকর। Support, Confidence, এবং Lift এর মতো মেট্রিক্সের মাধ্যমে, এটি সম্পর্কগুলির গুরুত্ব এবং প্রভাব পরিমাপ করতে সহায়ক।
Read more