Hadoop Cluster Management এবং Monitoring গাইড ও নোট

Big Data and Analytics - হাদুপ (Hadoop)

348

Hadoop Cluster Management এবং Monitoring দুটি অত্যন্ত গুরুত্বপূর্ণ দিক যা নিশ্চিত করে যে হাদুপ ক্লাস্টার দক্ষভাবে কাজ করছে এবং সমস্ত সিস্টেম উপাদান সঠিকভাবে কার্যকর হচ্ছে। সঠিকভাবে ক্লাস্টার পরিচালনা এবং পর্যবেক্ষণ না করলে, সিস্টেমে বিভিন্ন সমস্যা সৃষ্টি হতে পারে, যার ফলে কর্মক্ষমতা কমে যেতে পারে এবং ডেটার ক্ষতি হতে পারে। এই কারণে, হাদুপ ক্লাস্টারের সঠিক পরিচালনা এবং মনিটরিং গুরুত্বপূর্ণ।

Hadoop Cluster Management

1. Cluster Configuration and Resource Management

Hadoop ক্লাস্টার পরিচালনার প্রথম পদক্ষেপ হল cluster configuration এবং resource management। হাদুপ ক্লাস্টারের মধ্যে বিভিন্ন উপাদান থাকে, যেমন NameNode, DataNode, ResourceManager, এবং NodeManager, এবং প্রতিটি উপাদান সঠিকভাবে কনফিগার করা উচিত।

HDFS Configuration: NameNode এবং DataNode সঠিকভাবে কনফিগার করতে হবে যাতে ডেটা সঠিকভাবে সঞ্চিত এবং এক্সেসযোগ্য হয়। ডেটার ব্লক সাইজ, রেপ্লিকেশন ফ্যাক্টর এবং অন্যান্য পরামিতি নির্ধারণ করা প্রয়োজন।
YARN Configuration: ResourceManager এবং NodeManager এর সঠিক কনফিগারেশন নিশ্চিত করতে হবে, যাতে রিসোর্সগুলি সঠিকভাবে বরাদ্দ হয় এবং কর্মক্ষমতা বাড়ানো যায়।

2. Cluster Scaling

হাদুপ ক্লাস্টারের স্কেলিংয়ের প্রয়োজন হতে পারে যখন ক্লাস্টারের কর্মক্ষমতা বাড়ানোর জন্য আরও নোড যোগ করা প্রয়োজন। সিস্টেমের স্কেল এবং কাজের চাপ অনুসারে ক্লাস্টারের আকার বাড়ানো বা কমানো যেতে পারে। YARN বা HDFS ক্লাস্টারের মধ্যে আরও নোড যোগ করা বা নিষ্ক্রিয় করা যায়।

3. Cluster Security Management

হাদুপ ক্লাস্টারের সুরক্ষা নিশ্চিত করতে Kerberos authentication এবং Authorization কনফিগার করা প্রয়োজন। ডেটা এবং সিস্টেমকে অবাঞ্ছিত অ্যাক্সেস থেকে রক্ষা করার জন্য সুরক্ষা ব্যবস্থা নেওয়া উচিত।

Kerberos Authentication: এটি ক্লাস্টারের মধ্যে নিরাপদ যোগাযোগ এবং সিস্টেমের অ্যাক্সেস কন্ট্রোল করতে ব্যবহৃত হয়।
Access Control Lists (ACLs): ডেটা এবং রিসোর্সে অ্যাক্সেস নিয়ন্ত্রণ করতে ACLs ব্যবহার করা হয়।

Hadoop Cluster Monitoring

1. Monitoring Tools

Hadoop ক্লাস্টারের কার্যক্রম পর্যবেক্ষণের জন্য বেশ কিছু টুলস ব্যবহার করা হয়। এর মধ্যে কিছু জনপ্রিয় টুলস হল:

Apache Ambari: এটি একটি আধুনিক ব্যবস্থাপনা প্ল্যাটফর্ম যা হাদুপ ক্লাস্টারের সমস্ত সার্ভিস মনিটরিং এবং কনফিগারেশন প্রদান করে।
Cloudera Manager: এটি হাদুপ ক্লাস্টারের পরিচালনার জন্য একটি জনপ্রিয় প্ল্যাটফর্ম। এটি ক্লাস্টার মনিটরিং, কনফিগারেশন, এবং রিসোর্স ব্যবস্থাপনা প্রদান করে।
Ganglia: এটি একটি শক্তিশালী, স্কেলেবল, এবং কার্যকরী ক্লাস্টার মনিটরিং সিস্টেম যা হাদুপ ক্লাস্টারের পারফরম্যান্স ট্র্যাক করতে ব্যবহৃত হয়।
Nagios: এটি একটি ক্লাস্টার মনিটরিং এবং সতর্কীকরণ টুল যা ক্লাস্টারের স্বাস্থ্য এবং পারফরম্যান্স সম্পর্কে তথ্য প্রদান করে।

2. Key Metrics to Monitor

Hadoop ক্লাস্টারের মনিটরিং করার সময় কিছু গুরুত্বপূর্ণ মেট্রিক্স মনিটর করা প্রয়োজন:

HDFS Health: HDFS সঠিকভাবে কাজ করছে কিনা তা মনিটর করা উচিত। NameNode এবং DataNode এর স্বাস্থ্য পর্যবেক্ষণ করা প্রয়োজন।
- Disk Usage: ডেটা সঞ্চয়ের জন্য ব্যবহৃত ডিস্কের পরিমাণ মনিটর করুন।
- Block Replication: ব্লক রেপ্লিকেশন সঠিকভাবে হচ্ছে কিনা তা নিশ্চিত করুন।
YARN Resource Utilization: YARN ক্লাস্টারের রিসোর্স ব্যবহারের স্তর পর্যবেক্ষণ করা উচিত।
- CPU and Memory Usage: সঠিকভাবে CPU এবং মেমরি ব্যবহার হচ্ছে কিনা তা নিশ্চিত করুন।
- Queue Monitoring: YARN সিস্টেমের কাজের জন্য নির্ধারিত কিউয়ের সঠিক মনিটরিং করা উচিত।
Job Performance: হাদুপ জবের কর্মক্ষমতা এবং কার্যকারিতা ট্র্যাক করা উচিত।
- MapReduce Job Monitoring: সম্পন্ন হওয়া এবং চলমান জবের স্ট্যাটাস পর্যবেক্ষণ করুন।
Network Traffic: ক্লাস্টারের মধ্যে নেটওয়ার্ক ট্রাফিক পর্যবেক্ষণ করা উচিত, যাতে কোনো নেটওয়ার্ক বটলনেক সমস্যা শনাক্ত করা যায়।

3. Alerts and Notifications

Hadoop ক্লাস্টার ম্যানেজমেন্ট এবং মনিটরিং প্রক্রিয়ায় সতর্কীকরণ এবং বিজ্ঞপ্তি ব্যবস্থাও খুবই গুরুত্বপূর্ণ। যখন কোনো সিস্টেম বা পরিষেবা অপ্রত্যাশিতভাবে কাজ করা বন্ধ করে, তখন দ্রুত সতর্কতা পাঠানোর ব্যবস্থা করতে হবে। এর মাধ্যমে দ্রুত পদক্ষেপ গ্রহণ করা সম্ভব হয় এবং সিস্টেমের সমস্যা তাড়াতাড়ি সমাধান করা যায়।

4. Logs and Troubleshooting

Hadoop ক্লাস্টারের মনিটরিংয়ে log files গুরুত্বপূর্ণ ভূমিকা পালন করে। লগ ফাইলের মাধ্যমে ক্লাস্টারের সিস্টেমের সমস্ত কার্যক্রম ট্র্যাক করা যায় এবং কোনো ত্রুটি বা সমস্যা ঘটলে তা চিহ্নিত করা যায়।

Log Aggregation: সমস্ত নোডের লগ সংগ্রহ করা উচিত, যাতে সমস্যা দ্রুত চিহ্নিত এবং সমাধান করা যায়।
Log Analysis: লগ বিশ্লেষণের মাধ্যমে সিস্টেমের ব্যর্থতা এবং অপ্টিমাইজেশন ক্ষেত্র চিহ্নিত করা যেতে পারে।

সারাংশ

Hadoop Cluster Management এবং Monitoring দুটি অত্যন্ত গুরুত্বপূর্ণ দিক, যা হাদুপ ক্লাস্টারের পারফরম্যান্স এবং স্থিতিশীলতা নিশ্চিত করে। সঠিক কনফিগারেশন, রিসোর্স ম্যানেজমেন্ট, সিকিউরিটি এবং মনিটরিং টুলসের সাহায্যে ক্লাস্টারের কর্মক্ষমতা এবং কার্যকারিতা বাড়ানো যায়। এছাড়া সঠিক alerts, logs, এবং troubleshooting প্রক্রিয়ার মাধ্যমে ক্লাস্টারের স্বাস্থ্য এবং কার্যক্ষমতা নিরীক্ষণ করা সম্ভব। হাদুপ ক্লাস্টারের সঠিক পরিচালনা এবং মনিটরিংয়ের মাধ্যমে ডেটা প্রক্রিয়াকরণ দ্রুত এবং দক্ষতার সাথে করা সম্ভব।

Content added By

Rezwan Siddiki Tamim

Hadoop Cluster Setup এবং Configuration Management

365

Hadoop Cluster Setup এবং Configuration Management হাদুপ সিস্টেমের সফল কার্যক্রম নিশ্চিত করার জন্য অপরিহার্য। এই প্রক্রিয়াগুলির মাধ্যমে হাদুপের উপাদানগুলি (যেমন, HDFS, YARN, MapReduce) একটি সঠিকভাবে কনফিগারড এবং স্কেলেবল ক্লাস্টারে একত্রিত হয়, যা বড় ডেটা প্রক্রিয়াকরণকে কার্যকরী এবং দ্রুত করে তোলে।

Hadoop Cluster Setup

হাদুপ ক্লাস্টার সেটআপের মাধ্যমে একাধিক সার্ভারে হাদুপ ইনস্টল করা হয়, যেখানে ডিস্ট্রিবিউটেড ফাইল সিস্টেম (HDFS) এবং রিসোর্স ম্যানেজমেন্ট (YARN) কাজ করে। সাধারণত একটি হাদুপ ক্লাস্টার দুই ধরনের সার্ভার নিয়ে গঠিত:

Master Node (নোড ম্যানেজার):
- এখানে হাদুপের মেটাডেটা সংরক্ষিত হয় এবং ক্লাস্টারের কাজের প্রধান নিয়ন্ত্রক হিসেবে কাজ করে।
- NameNode, ResourceManager, JobHistoryServer থাকে।
Slave Nodes (ওয়ার্কার নোড):
- এখানে ডেটা সংরক্ষিত হয় এবং প্রক্রিয়াকরণ করা হয়। এগুলোতে DataNode এবং NodeManager থাকে।

Step-by-Step Hadoop Cluster Setup

1. Requirements (প্রয়োজনীয়তা):

একটি সেন্টওএস (CentOS), উবুন্টু (Ubuntu), বা ডেবিয়ান (Debian) ক্লাস্টারে হাদুপ ইনস্টল করতে পারেন।
Java ইনস্টল থাকা উচিত। হাদুপ সাধারণত Java 8 বা পরবর্তী সংস্করণে চলে।

2. Hadoop Installation (হাদুপ ইনস্টলেশন):

প্রথমে হাদুপ ডাউনলোড করতে হবে Hadoop Official Site থেকে।
ইনস্টলেশনের জন্য আপনার সিস্টেমে Java ইনস্টল এবং কনফিগার করা থাকতে হবে।
হাদুপ ডাউনলোড এবং এক্সট্রাক্ট করতে পারেন:

wget https://downloads.apache.org/hadoop/common/hadoop-3.x.x/hadoop-3.x.x.tar.gz
tar -xvzf hadoop-3.x.x.tar.gz

3. Hadoop Configuration (হাদুপ কনফিগারেশন):

Hadoop Configuration Files:
- core-site.xml: হাদুপের সিস্টেম কনফিগারেশন ফাইল যেখানে ক্লাস্টারের মূল কনফিগারেশন রাখা হয়।
- hdfs-site.xml: HDFS-এর কনফিগারেশন সেট করা হয়।
- yarn-site.xml: YARN-এর কনফিগারেশন ফাইল।
- mapred-site.xml: MapReduce কনফিগারেশন ফাইল।

Configuring core-site.xml:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://namenode_host:9000</value>
    </property>
</configuration>

Configuring hdfs-site.xml:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
</configuration>

Configuring yarn-site.xml:

<configuration>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>resourcemanager_host:8032</value>
    </property>
</configuration>

4. Starting Hadoop Cluster:

Master এবং Slave নোডে HDFS এবং YARN সেবা চালু করতে হবে:
```
start-dfs.sh
start-yarn.sh
```
HDFS ফাইল সিস্টেমে ডেটা আপলোড করতে hadoop fs -put ব্যবহার করুন।

Configuration Management in Hadoop

Hadoop ক্লাস্টারের কনফিগারেশন ম্যানেজমেন্ট অত্যন্ত গুরুত্বপূর্ণ, কারণ এটি ক্লাস্টারের কার্যকারিতা এবং স্কেলেবিলিটি নিশ্চিত করে। কনফিগারেশন ফাইলের মাধ্যমে বিভিন্ন নোডে সঠিকভাবে সেটিংস বিতরণ করা হয়।

1. Manual Configuration vs. Automated Configuration

Manual Configuration:

ক্লাস্টারের প্রতিটি নোডে কনফিগারেশন ফাইলটি ম্যানুয়ালি কপি করা হয়। এটি ছোট ক্লাস্টারগুলির জন্য সহজ হতে পারে, তবে বড় ক্লাস্টারের জন্য এটি কঠিন এবং সময়সাপেক্ষ হতে পারে।

Automated Configuration:

Ansible, Chef, Puppet ইত্যাদি কনফিগারেশন ম্যানেজমেন্ট টুলস ব্যবহার করে Hadoop ক্লাস্টারের কনফিগারেশন স্বয়ংক্রিয়ভাবে ম্যানেজ করা যায়। এগুলোর মাধ্যমে কনফিগারেশন ফাইলগুলি দ্রুত, কার্যকরী এবং সঠিকভাবে প্রতিটি নোডে বিতরণ করা যায়।

2. Configuration Management Tools

Ansible:

Ansible একটি জনপ্রিয় কনফিগারেশন ম্যানেজমেন্ট টুল, যা সার্ভার সিস্টেমে হাদুপ কনফিগারেশন অটোমেট করতে ব্যবহৃত হয়।
Hadoop with Ansible: Ansible Playbook ব্যবহার করে Hadoop ক্লাস্টারের কনফিগারেশন এবং ইনস্টলেশন অটোমেট করা যায়। এটি একটি YAML ফাইলের মাধ্যমে কনফিগারেশন সেটিংস বিতরণ করে।

Ansible Playbook Example:

- hosts: hadoop_nodes
  tasks:
    - name: Install Hadoop
      yum:
        name: hadoop
        state: present

Chef:

Chef-এ হাদুপ কনফিগারেশন ম্যানেজমেন্ট সহজ। Chef সুক্সেসফুল হাদুপ ইনস্টলেশন ও কনফিগারেশন জন্য একটি বিশেষ কুকবুক প্রদান করে।
Chef Recipe Example:

package 'hadoop' do
  action :install
end

Puppet:

Puppet হাদুপ ইনস্টলেশন এবং কনফিগারেশন ম্যানেজমেন্টে সাহায্য করে। Puppet দিয়ে হাদুপ কনফিগারেশন অটোমেট করা যায়।
Puppet Manifest Example:

class hadoop {
  package { 'hadoop':
    ensure => installed,
  }
}

3. Version Control and Backup:

কনফিগারেশন ফাইলগুলোর জন্য Git ব্যবহার করে ভার্সন কন্ট্রোল ব্যবস্থা রাখুন, যাতে কোন পরিবর্তন হলে তার ইতিহাস ট্র্যাক করা যায়।
কনফিগারেশন ফাইলের নিয়মিত ব্যাকআপ রাখা অত্যন্ত গুরুত্বপূর্ণ, যাতে কোনো সমস্যা হলে পূর্ববর্তী সঠিক কনফিগারেশন ফিরিয়ে আনা যায়।

Hadoop Cluster Performance Tuning and Monitoring

1. Monitoring Tools:

Ambari বা Cloudera Manager ব্যবহার করে হাদুপ ক্লাস্টার মনিটরিং করা যেতে পারে। এটি ক্লাস্টারের বিভিন্ন সিস্টেম রিসোর্স যেমন CPU, মেমরি, ডিস্ক ব্যবহারের পরিসংখ্যান প্রদর্শন করে।
Ganglia এবং Nagios ক্লাস্টারের স্বাস্থ্য পর্যবেক্ষণ এবং সমস্যার সমাধানে সহায়ক।

2. Performance Tuning:

YARN ResourceManager এবং JobTracker কনফিগারেশন সেট করে টাস্কের পারফরম্যান্স উন্নত করা।
HDFS ব্লক সাইজ এবং replication factor কনফিগার করে ডিস্ক I/O অপ্টিমাইজেশন করা।
JVM heap size টিউন করে মেমরি ব্যবস্থাপনা উন্নত করা।

সারাংশ

Hadoop Cluster Setup এবং Configuration Management হাদুপ সিস্টেমের কার্যকারিতা এবং স্কেলেবিলিটির জন্য অত্যন্ত গুরুত্বপূর্ণ। ক্লাস্টারের প্রতিটি নোডের কনফিগারেশন সঠিকভাবে করার মাধ্যমে ডেটা প্রক্রিয়াকরণ আরও দ্রুত এবং কার্যকরী হয়। Ansible, Chef, Puppet ইত্যাদি কনফিগারেশন ম্যানেজমেন্ট টুলস হাদুপ ক্লাস্টারের কনফিগারেশন দ্রুত এবং কার্যকরীভাবে সম্পাদন করতে সাহায্য করে। হাদুপ ক্লাস্টারের পারফরম্যান্স অপ্টিমাইজেশন এবং মনিটরিংয়ের জন্য Ambari, Ganglia, Nagios ব্যবহৃত হতে পারে।

Content added By

Rezwan Siddiki Tamim

Ambari এবং Cloudera Manager দিয়ে Cluster Management

383

Hadoop Cluster Management হাদুপ ক্লাস্টারের কার্যকরী পরিচালনা, রক্ষণাবেক্ষণ, এবং মনিটরিং এর জন্য অত্যন্ত গুরুত্বপূর্ণ। হাদুপ ক্লাস্টারের পরিচালনা এবং তার সমস্ত কম্পোনেন্টের মনিটরিং করার জন্য Ambari এবং Cloudera Manager দুটি জনপ্রিয় টুল। এই দুটি টুল হাদুপ ক্লাস্টারের বিভিন্ন দিক যেমন, রিসোর্স ব্যবস্থাপনা, সার্ভিস ম্যানেজমেন্ট, স্কেলিং, এবং ডায়াগনস্টিক্সকে সহজতর করতে ব্যবহৃত হয়।

Ambari কী?

Ambari হল একটি ওপেন সোর্স হাদুপ ম্যানেজমেন্ট প্ল্যাটফর্ম যা ক্লাস্টার ইনস্টলেশন, কনফিগারেশন, ম্যানেজমেন্ট এবং মনিটরিং সহজ করে তোলে। এটি Apache দ্বারা নির্মিত এবং Hadoop ecosystem-এর জন্য একটি ড্যাশবোর্ড প্রদান করে, যেখানে ব্যবহারকারীরা সহজেই ক্লাস্টার পরিচালনা ও মনিটর করতে পারে।

Ambari এর প্রধান বৈশিষ্ট্য:

Clustering and Resource Management:
Ambari হাদুপ ক্লাস্টার ইনস্টল এবং কনফিগার করার জন্য একটি ব্যবহারকারী-বান্ধব ইন্টারফেস প্রদান করে। এটি HDFS, YARN, MapReduce, Hive, HBase, ZooKeeper এবং অন্যান্য হাদুপ কম্পোনেন্টের সহজ কনফিগারেশন এবং রিসোর্স ম্যানেজমেন্টের জন্য কাজ করে।
Web Interface for Management:
Ambari একটি ওয়েব-ভিত্তিক ইন্টারফেস প্রদান করে, যা ব্যবহারকারীদের ক্লাস্টারের সার্ভিস ম্যানেজমেন্ট, পর্যবেক্ষণ এবং ট্রাবলশুটিংয়ের জন্য সাহায্য করে।
Service Monitoring:
এটি ক্লাস্টারের প্রতিটি সার্ভিসের স্বাস্থ্য এবং পারফরম্যান্স মনিটর করতে সাহায্য করে। যেমন, ক্লাস্টারের CPU ব্যবহার, মেমরি, ডেটা স্টোরেজ, সার্ভিসের অবস্থা ইত্যাদি।
Security:
Ambari এর মাধ্যমে ক্লাস্টারের নিরাপত্তা কনফিগার করা যায়, যেমন Kerberos প্রটোকলের সাহায্যে সিকিউরড অথেনটিকেশন কনফিগার করা।
Scalability:
Ambari ক্লাস্টারের স্কেলিং এর জন্য উপযুক্ত টুল, যা সহজেই নতুন নোড যুক্ত করার সুবিধা প্রদান করে।

Cloudera Manager কী?

Cloudera Manager হল একটি প্রোফেশনাল হাদুপ ক্লাস্টার ম্যানেজমেন্ট টুল যা Cloudera দ্বারা তৈরি। এটি হাদুপ ইকোসিস্টেমের সাথে সম্পূর্ণভাবে ইন্টিগ্রেটেড এবং ক্লাস্টারের ইনস্টলেশন, কনফিগারেশন, মনিটরিং, অপটিমাইজেশন এবং নিরাপত্তা ব্যবস্থাপনার জন্য প্রফেশনাল সমাধান প্রদান করে।

Cloudera Manager এর প্রধান বৈশিষ্ট্য:

Cluster Monitoring and Management:
এটি ক্লাস্টারের সার্ভিসগুলি যেমন HDFS, YARN, MapReduce, Hive, Impala, HBase, Kafka, ইত্যাদি পরিচালনা করতে ব্যবহৃত হয়। ক্লাস্টারের স্বাস্থ্য, কর্মক্ষমতা এবং নিরাপত্তা সম্পর্কে একটি সম্পূর্ণ মনিটরিং সিস্টেম প্রদান করে।
Centralized Administration:
Cloudera Manager একক প্যানেল থেকে সমস্ত সার্ভিস এবং নোডগুলি পরিচালনা করতে সাহায্য করে। ব্যবহারকারী ক্লাস্টারের সমস্ত অংশকে একটি সেন্ট্রাল ড্যাশবোর্ড থেকে দেখতে এবং কনফিগার করতে পারে।
Performance Optimization:
এটি ডেটাবেস এবং হাদুপ ক্লাস্টারের পারফরম্যান্স অপটিমাইজেশনের জন্য উন্নত ফিচার সরবরাহ করে। যেমন, নেটওয়ার্ক ব্যবহারের পর্যবেক্ষণ, ডেটা সঞ্চয় কৌশল, কাস্টম কনফিগারেশন ইত্যাদি।
Security Management:
Cloudera Manager ক্লাস্টারের নিরাপত্তা ম্যানেজমেন্টের জন্য শক্তিশালী টুল প্রদান করে। এটি Kerberos authentication, authorization এবং audit সক্ষম করতে পারে, এবং ক্লাস্টারে ব্যবহৃত ডেটার সুরক্ষা নিশ্চিত করে।
Scalability and High Availability:
এটি ক্লাস্টারের স্কেলেবিলিটি এবং উচ্চ প্রাপ্যতা (High Availability) নিশ্চিত করার জন্য সহজ সলিউশন প্রদান করে। এছাড়া, Cloudera Manager auto-scaling সুবিধা সহ সহজেই ক্লাস্টার প্রসারিত করতে সহায়ক।

Ambari এবং Cloudera Manager এর মধ্যে পার্থক্য

বিষয়	Ambari	Cloudera Manager
ভাষা	ওপেন সোর্স (Apache)	বাণিজ্যিক (Cloudera)
ইনস্টলেশন	সহজ এবং সরল ইনস্টলেশন	ইনস্টলেশন একটু জটিল, কিন্তু শক্তিশালী টুল
কনফিগারেশন	সহজ কনফিগারেশন এবং কাস্টমাইজেশন	উন্নত কনফিগারেশন এবং রিকভারি ফিচার
স্কেলেবিলিটি	বড় ক্লাস্টার সমর্থন করে	উচ্চ স্কেলেবিলিটি, তবে প্রফেশনাল সাপোর্ট প্রয়োজন
মনিটরিং	সিম্পল এবং সহজ মনিটরিং	উন্নত মনিটরিং, সম্পূর্ণ রিকভারি ফিচার
সিকিউরিটি	Kerberos সিকিউরিটি সাপোর্ট	শক্তিশালী সিকিউরিটি ম্যানেজমেন্ট
কস্ট	ফ্রি এবং ওপেন সোর্স	প্রফেশনাল সাপোর্টের জন্য প্রিমিয়াম পেইড
ইন্টিগ্রেশন	সহজ ইন্টিগ্রেশন সুবিধা	আরও উন্নত ইন্টিগ্রেশন এবং কাস্টম সলিউশন

Ambari এবং Cloudera Manager দিয়ে Cluster Management

Ambari দিয়ে Cluster Management

Ambari ব্যবহার করে সহজেই হাদুপ ক্লাস্টারের নোড ইনস্টল এবং কনফিগার করা যায়।
এটি ক্লাস্টারের স্বাস্থ্য, পারফরম্যান্স এবং লোগস মনিটর করতে সহায়ক।
Ambari Web UI ব্যবহারকারীদের একটি সেন্ট্রালাইজড প্যানেল থেকে ক্লাস্টারের সকল সার্ভিস এবং রিসোর্স পরিচালনা করতে সক্ষম করে।

Cloudera Manager দিয়ে Cluster Management

Cloudera Manager ব্যবহারের মাধ্যমে, ক্লাস্টারের সমস্ত সার্ভিসগুলোর জন্য একক প্যানেল থেকে কনফিগারেশন এবং অপটিমাইজেশন করা যায়।
এটি ক্লাস্টারের পারফরম্যান্স ট্র্যাকিং এবং ডেটা সুরক্ষার জন্য শক্তিশালী ম্যানেজমেন্ট টুল সরবরাহ করে।
এটি auto-scaling, high availability, এবং disaster recovery ম্যানেজমেন্টের জন্য উন্নত ফিচার সরবরাহ করে।

সারাংশ

Ambari এবং Cloudera Manager দুটি শক্তিশালী টুল যা হাদুপ ক্লাস্টারের পরিচালনা, মনিটরিং, এবং অপটিমাইজেশন জন্য ব্যবহৃত হয়। Ambari একটি ওপেন সোর্স সিস্টেম, যা ছোট এবং মাঝারি স্কেলের ক্লাস্টারের জন্য উপযুক্ত, এবং এটি সহজ এবং কার্যকরী। অন্যদিকে, Cloudera Manager একটি প্রফেশনাল সলিউশন, যা বৃহৎ এবং জটিল ক্লাস্টারের জন্য শক্তিশালী সাপোর্ট প্রদান করে। এটি উন্নত পারফরম্যান্স অপটিমাইজেশন, সিকিউরিটি, এবং উচ্চ প্রাপ্যতা নিশ্চিত করার জন্য আদর্শ।

Content added By

Rezwan Siddiki Tamim

Hadoop Jobs Monitoring এবং Resource Utilization

310

হাদুপ একটি বিতরণকৃত সিস্টেম, যেখানে বড় পরিসরের ডেটা প্রক্রিয়া করার জন্য অনেকগুলো কম্পিউটেশনাল টাস্ক বা Hadoop jobs সমান্তরালভাবে চলতে থাকে। Hadoop Jobs Monitoring এবং Resource Utilization খুবই গুরুত্বপূর্ণ, কারণ এগুলি সিস্টেমের পারফরম্যান্স এবং দক্ষতা বজায় রাখার জন্য প্রয়োজনীয়। সঠিক মনিটরিং এবং রিসোর্স ব্যবস্থাপনার মাধ্যমে সিস্টেমের কার্যক্ষমতা বৃদ্ধি করা সম্ভব।

Hadoop Jobs Monitoring (হাদুপ জব মনিটরিং)

Hadoop Jobs Monitoring হল হাদুপ ক্লাস্টারের মধ্যে চলমান MapReduce টাস্ক, YARN রিসোর্স ম্যানেজার এবং অন্যান্য প্রসেসের পর্যবেক্ষণ এবং ব্যবস্থাপনা। সঠিক মনিটরিংয়ের মাধ্যমে সিস্টেমের পারফরম্যান্স পর্যবেক্ষণ করা, ত্রুটি চিহ্নিত করা এবং রিসোর্সগুলির সঠিক ব্যবহার নিশ্চিত করা যায়।

Hadoop Jobs Monitoring এর উপকারিতা

পারফরম্যান্স ট্র্যাকিং: সিস্টেমের বিভিন্ন জব এবং তাদের কার্যকারিতা ট্র্যাক করা।
ত্রুটি শনাক্তকরণ: বিভিন্ন রকমের ত্রুটি যেমন টাইম আউট, ফেইলড টাস্ক ইত্যাদি দ্রুত শনাক্ত করা।
রিসোর্স ব্যবহারের অপ্টিমাইজেশন: হাদুপ ক্লাস্টারের রিসোর্স ব্যবহারের যথাযথ মনিটরিং এর মাধ্যমে অপটিমাইজেশন করা।

Hadoop Job Monitoring Tools

1. ResourceManager Web UI

YARN (Yet Another Resource Negotiator) হাদুপের রিসোর্স ম্যানেজমেন্ট ফ্রেমওয়ার্ক, যা বিভিন্ন রিসোর্স, যেমন CPU এবং RAM সহ সকল MapReduce টাস্কের কাজ পরিচালনা করে। ResourceManager Web UI এর মাধ্যমে, ব্যবহারকারীরা চলমান কাজের অবস্থা, প্রক্রিয়া, লোড এবং সম্পূর্ণতা ট্র্যাক করতে পারেন।

URL: http://<ResourceManagerHost>:8088/
এখানে আপনি দেখতে পারবেন:
- চলমান জব
- জবের অবস্থা
- সফল বা ব্যর্থ টাস্কের সংখ্যা
- রিসোর্স ব্যবহার (CPU, RAM)

2. JobHistory Server

হাদুপ JobHistory Server একটি অ্যাপ্লিকেশন যা MapReduce জবের ইতিহাস (যেমন টাস্কের সময়, সফল বা ব্যর্থ অবস্থান) ট্র্যাক করে। এটি পরবর্তী বিশ্লেষণের জন্য গুরুত্বপূর্ণ ডেটা প্রদান করে।

URL: http://<JobHistoryServer>:19888/
এটি ব্যবহারকারীদের পুরো হাদুপ জবের ইতিহাস পর্যালোচনা করতে সাহায্য করে।

3. Ganglia

Ganglia একটি স্কেলেবল মনিটরিং টুল যা হাদুপ ক্লাস্টারের নোডগুলির পারফরম্যান্স ট্র্যাক করে। এটি CPU, মেমরি, ডিস্ক এবং নেটওয়ার্ক ব্যবহারের মতো রিসোর্সগুলি মনিটর করে এবং গ্রাফিকাল রিপ্রেজেন্টেশন প্রদান করে।

এটি ক্লাস্টারের সিস্টেমের স্বাস্থ্য এবং কর্মক্ষমতা সহজে বুঝতে সাহায্য করে।

Resource Utilization (রিসোর্স ব্যবহার)

Resource Utilization হল হাদুপ ক্লাস্টারে ব্যবহার করা রিসোর্সগুলির (যেমন CPU, মেমরি, ডিস্ক স্পেস) যথাযথ ব্যবস্থাপনা। সঠিকভাবে রিসোর্স ব্যবস্থাপনা এবং ব্যবহারের মাধ্যমে হাদুপ সিস্টেমের কর্মক্ষমতা বৃদ্ধি করা যায়।

Hadoop Cluster Resource Utilization-এর প্রধান উপাদানসমূহ

CPU ব্যবহারের মনিটরিং:
হাদুপ জবের কার্যকারিতা নির্ভর করে CPU ব্যবহার ও লোডের ওপর। অতিরিক্ত CPU ব্যবহার বা কম্পিউটেশনের অভাব সিস্টেমের কার্যক্ষমতা কমিয়ে দিতে পারে।
- YARN Resource Manager এর মাধ্যমে CPU ব্যবহারের অবস্থা পর্যবেক্ষণ করা যায়।
Memory Management:
যথাযথ মেমরি ব্যবহারের মাধ্যমে MapReduce জবগুলো দ্রুত এবং দক্ষভাবে সম্পন্ন হতে পারে। অপ্রয়োজনীয় মেমরি ব্যবহার বা লোডের কারণে পারফরম্যান্স ক্ষতিগ্রস্ত হতে পারে।
- YARN এবং JVM-এর মেমরি কনফিগারেশন অপ্টিমাইজ করে মেমরি ব্যবহারের পরিমাণ এবং রিসোর্সের ইফিশিয়েন্সি বাড়ানো যায়।
Disk I/O এবং Storage:
ডেটা প্রসেসিংয়ের সময় ডেটা ডিস্কে লেখা এবং পড়া হয়। সঠিকভাবে ডিস্ক ব্যবহারের মাধ্যমে ডেটা ট্রান্সফার এবং স্টোরেজ পারফরম্যান্স উন্নত করা যায়।
- HDFS-এর ব্যবস্থাপনা এবং তার পারফরম্যান্স ট্র্যাক করার জন্য মনিটরিং সরঞ্জাম ব্যবহার করা উচিত।

Monitoring and Resource Utilization Tools

1. YARN Resource Manager

YARN Resource Manager ব্যবহারকারীদের MapReduce জবগুলির রিসোর্স ব্যবহারের তথ্য প্রদান করে। এর মাধ্যমে আপনি দেখতে পাবেন কিভাবে রিসোর্সগুলি ব্যবহৃত হচ্ছে এবং যেসব টাস্ক চালানো হচ্ছে তাদের অবস্থা কী।

Memory and CPU Utilization: এটি মেমরি এবং CPU ব্যবহারের তথ্য প্রদান করে।
Queue Management: Resource Manager বিভিন্ন queue-এ জবগুলির রিসোর্স বরাদ্দ ট্র্যাক করে।

2. HDFS Disk Usage

HDFS (Hadoop Distributed File System) এ ডিস্ক স্পেস ব্যবহারের সঠিক মনিটরিং গুরুত্বপূর্ণ। হাদুপ সিস্টেমে ডেটার স্থানান্তর এবং স্টোরেজের জন্য ডিস্ক ব্যবহারের পরিমাণ সর্বদা পর্যবেক্ষণ করা উচিত।

hdfs dfs -df -h: এই কমান্ডটি HDFS-এ ব্যবহৃত এবং উপলব্ধ ডিস্ক স্পেস দেখাবে।

3. MapReduce Job Execution Times

MapReduce job execution times মনিটরিং করা নিশ্চিত করে যে, কোনো টাস্ক অতিরিক্ত সময় নিচ্ছে কি না। এটি পারফরম্যান্স অপ্টিমাইজেশনের জন্য গুরুত্বপূর্ণ তথ্য প্রদান করে।

Job duration: কাজের সঞ্চালন সময় ট্র্যাক করা এবং দীর্ঘ সময় নিচ্ছে এমন কাজগুলো চিহ্নিত করা।

Best Practices for Monitoring and Resource Utilization

ফাইল সিস্টেম এবং স্টোরেজ পারফরম্যান্স পর্যবেক্ষণ:
HDFS এবং লোকাল ডিস্কের ব্যবহারের উপর মনিটরিং রাখা উচিত, যাতে সঠিক স্টোরেজ এবং ডেটা ট্রান্সফারের জন্য রিসোর্স বরাদ্দ নিশ্চিত হয়।
রিসোর্স কনফিগারেশন অপ্টিমাইজ করা:
YARN এবং MapReduce টাস্কের জন্য যথাযথ রিসোর্স কনফিগারেশন করা। উদাহরণস্বরূপ, memory-per-cpu কনফিগারেশন এবং CPU/Memory এর রেশিও সমন্বয় করা।
Real-time Monitoring Tools ব্যবহার করা:
Ganglia, Ambari, এবং Cloudera Manager এর মতো রিয়েল-টাইম মনিটরিং টুলস ব্যবহার করুন, যা হাদুপ ক্লাস্টারের স্বাস্থ্য এবং রিসোর্স ব্যবহারের চিত্র প্রদান করে।

সারাংশ

Hadoop Jobs Monitoring এবং Resource Utilization নিশ্চিত করে যে হাদুপ ক্লাস্টার কার্যকরভাবে এবং দক্ষতার সাথে কাজ করছে। সঠিক মনিটরিং সরঞ্জাম এবং রিসোর্স ব্যবস্থাপনা কৌশল ব্যবহারের মাধ্যমে পারফরম্যান্স অপ্টিমাইজেশন, ত্রুটি শনাক্তকরণ এবং সিস্টেমের রিলায়েবিলিটি নিশ্চিত করা যায়। YARN, ResourceManager Web UI, এবং JobHistory Server এর মতো টুলস ব্যবহার করে কার্যক্রমের মনিটরিং এবং সঠিক রিসোর্স বরাদ্দ নিশ্চিত করা যায়।

Content added By

Rezwan Siddiki Tamim

Log Files এবং Hadoop Debugging Techniques

470

Hadoop একটি বিস্তৃত ডিস্ট্রিবিউটেড সিস্টেম, যেখানে অনেক কাজ সমান্তরালভাবে চলে এবং বিভিন্ন কম্পোনেন্টের মধ্যে সম্পর্ক থাকে। যখন Hadoop jobs ঠিকমতো কাজ করে না বা ত্রুটি দেখা দেয়, তখন log files এবং debugging techniques ব্যবহৃত হয় সঠিক সমস্যা চিহ্নিত এবং সমাধান করার জন্য।

Hadoop Log Files

Log files হল Hadoop এর প্রধান ডিবাগিং টুল। এসব লগে সমস্ত প্রক্রিয়া এবং কার্যকলাপের বিবরণ থাকে, যা ত্রুটি শনাক্তকরণে এবং সিস্টেমের কার্যকারিতা বিশ্লেষণে সহায়ক। Hadoop এর বিভিন্ন কম্পোনেন্ট যেমন MapReduce, YARN, HDFS, এবং ZooKeeper তাদের নিজ নিজ লগ ফাইল তৈরি করে, যা ডিবাগিং ও মনিটরিংয়ের জন্য খুবই গুরুত্বপূর্ণ।

1. Job Logs

Job Logs হল MapReduce jobs এর সম্পর্কিত লগ। এই লগ ফাইলগুলো বিস্তারিত তথ্য প্রদান করে, যেমন:

Map Task এবং Reduce Task এর execution details
job-এর status (success/failure)
প্রতিটি task-এর input/output এবং time taken

Job Logs দেখতে:

Job Tracker UI (যেমন: http://<jobtracker_host>:50030) এর মাধ্যমে
History Server Logs: Hadoop job history server থেকেও logs চেক করা যায়।

2. TaskTracker / NodeManager Logs

যখন কোন job ক্লাস্টারে রান হয়, তখন এটি TaskTracker অথবা NodeManager এ রান হয়। এই কম্পোনেন্টগুলো গুরুত্বপূর্ণ লগ ফাইল ধারণ করে যা job-এর execution, node-level errors এবং resource allocation সম্পর্কে তথ্য দেয়।

TaskTracker Logs: প্রাথমিকভাবে MapReduce job-এর task status মনিটর করা হয়।
NodeManager Logs: YARN-এর NodeManager এর মাধ্যমে worker nodes এর resource allocation এবং status ট্র্যাক করা হয়।

3. ResourceManager Logs

ResourceManager হাদুপের YARN সিস্টেমের কেন্দ্রীয় কম্পোনেন্ট। এটি সমস্ত ক্লাস্টারের কাজের জন্য রিসোর্স বরাদ্দ করে এবং প্রতিটি job-এর অবস্থা ট্র্যাক করে। ResourceManager logs এর মধ্যে job scheduling, container allocation, এবং task distribution সম্পর্কিত তথ্য থাকে। এই লগগুলি ক্লাস্টারের কর্মক্ষমতা বিশ্লেষণে সহায়ক।

4. HDFS Logs

HDFS (Hadoop Distributed File System)-এ DataNode এবং NameNode উভয়ের আলাদা লগ ফাইল থাকে।

NameNode Logs: এটি ক্লাস্টারের মেটাডেটা পরিচালনা করে, যেমন ফাইলের অবস্থান এবং ব্লক অ্যাক্সেস। NameNode লগে আপনি ফাইল সিস্টেমের কার্যকলাপ এবং ত্রুটির বিশদ দেখতে পারবেন।
DataNode Logs: এটি ফাইল ব্লকগুলির সঞ্চয় এবং প্রক্রিয়া করে। DataNode লগে ডেটার স্থানান্তর এবং স্টোরেজ সম্পর্কিত তথ্য থাকবে।

5. ZooKeeper Logs

ZooKeeper হাদুপ ক্লাস্টারের জন্য একটি ডিসট্রিবিউটেড সিস্টেম ম্যানেজমেন্ট সেন্টার হিসেবে কাজ করে। এটি হাদুপের সমস্ত কোঅর্ডিনেশন কাজ পরিচালনা করে, যেমন ক্লাস্টার স্থিতিশীলতা এবং অ্যাপ্লিকেশন কনফিগারেশন। ZooKeeper লগ ফাইল ক্লাস্টারের স্থিতিশীলতা এবং কোঅর্ডিনেশন সমস্যা ট্র্যাক করতে সহায়ক।

Hadoop Debugging Techniques

Hadoop ডিবাগিং প্রক্রিয়াটি শুরু হয় লগ ফাইলগুলির বিশ্লেষণ দিয়ে, কিন্তু বেশ কিছু বিশেষ কৌশল এবং টুলসও রয়েছে যা আপনার কাজের পারফরম্যান্স এবং ত্রুটি সমাধানে সহায়ক।

1. Examining Logs

Logs এর বিশ্লেষণ করতে হবে প্রধানত তিনটি জায়গায়:

Job Logs: Jave exceptions এবং error messages যেগুলি job-এর মধ্যে আসতে পারে।
YARN Logs: রিসোর্স ম্যানেজমেন্টের ত্রুটি চিহ্নিত করতে।
HDFS Logs: ডেটার সঞ্চয় এবং স্টোরেজ সম্পর্কিত সমস্যা সমাধান করতে।

Log Error Messages Interpretation

OutOfMemoryException: একাধিক map/reduce tasks ত্রুটি তৈরি করতে পারে যদি কোনো node পর্যাপ্ত memory না পায়।
Task Attempt Failure: একটি task একাধিকবার ব্যর্থ হলে এটি সার্ভার বা ডেটার সমস্যা হতে পারে।

2. Hadoop Counters for Debugging

Counters হল Hadoop এর একটি শক্তিশালী বৈশিষ্ট্য যা আপনার jobs এর পারফরম্যান্স এবং সঠিকতা ট্র্যাক করতে সাহায্য করে। আপনি job-এর বিভিন্ন পরিমাপ এবং উন্নত পারফরম্যান্সের জন্য MapReduce counters ব্যবহার করতে পারেন।

Common Counters to Monitor:

Input Records: কতটি রেকর্ড ইনপুট হয়েছে
Output Records: কতটি রেকর্ড আউটপুট হয়েছে
Map/Reduce Task Count: টাস্কের সফলতা এবং ব্যর্থতা

এটি নির্ধারণ করে যে কতগুলো রেকর্ড প্রসেস হয়েছে এবং কোথায় সমস্যা হচ্ছে। কাস্টম কাউন্টারও তৈরি করা যেতে পারে।

3. Using Hadoop’s Web UI for Debugging

Hadoop এর ওয়েব ইউআই ব্যবহার করে আপনি খুব সহজেই job-এর অবস্থা এবং task-এর সফলতা/ব্যর্থতা দেখতে পারেন। এখানে কিছু গুরুত্বপূর্ণ UI পেজ:

Job Tracker UI: job status এবং tasks overview দেখার জন্য
Resource Manager UI: YARN-এর সমস্ত রিসোর্সের বর্তমান অবস্থান দেখতে
History Server: পূর্ববর্তী jobs এর log এবং performance দেখতে

4. Memory and Disk Utilization

OutOfMemoryError বা Disk Full Error একটি সাধারণ সমস্যা হতে পারে। এই সমস্যাগুলির সঠিক কারণ চিহ্নিত করতে, আপনাকে memory এবং disk usage মনিটর করতে হবে।

JVM Logs: JVM এর লগগুলি মেমরি ব্যবহারের এবং গ্যারেজ কালেকশন সমস্যা চিহ্নিত করতে সাহায্য করতে পারে।
HDFS Usage: Disk space ব্যবহার সঠিকভাবে ট্র্যাক করা উচিত, বিশেষত NameNode এবং DataNode ব্লক স্টোরেজের জন্য।

5. Use of Debugging Tools

Apache Hive: SQL-like ব্যবহার করে ডেটা প্রক্রিয়া এবং জটিল query ট্র্যাক করার জন্য Hive ত্রুটির সমাধান করা যেতে পারে।
Apache Pig: ডেটা প্রক্রিয়া এবং স্ক্রিপ্টগুলো দ্রুত ডিবাগ করার জন্য Pig ব্যবহার করা যেতে পারে।
Hadoop Debugger: Hadoop এ ডিবাগging প্রক্রিয়া আরও সহজ করার জন্য কিছু বিশেষ ডিবাগিং টুল ব্যবহার করা যেতে পারে যেমন Eclim, Eclipse Hadoop Debugger।

সারাংশ

Hadoop এর log files এবং debugging techniques Hadoop job গুলোর কার্যক্ষমতা এবং সমস্যাগুলির সমাধানে অত্যন্ত কার্যকরী। Job logs, YARN logs, HDFS logs এবং ZooKeeper logs বিশ্লেষণ করে আপনি ত্রুটির সূত্র খুঁজে বের করতে পারেন। এছাড়া counters, Web UI, memory and disk utilization পর্যবেক্ষণ এবং debugging tools ব্যবহার করে সমস্যা দ্রুত সমাধান করা যায়। Hadoop সিস্টেমে সঠিক মনিটরিং এবং ডিবাগging প্রক্রিয়া কার্যকরী পারফরম্যান্স নিশ্চিত করতে সহায়ক।

Content added By

Rezwan Siddiki Tamim

Hadoop এর পরিচিতি Hadoop Architecture এবং Ecosystem HDFS (Hadoop Distributed File System) YARN (Yet Another Resource Negotiator) MapReduce এর মৌলিক ধারণা

Hadoop Cluster Management এবং Monitoring গাইড ও নোট

Hadoop Cluster Management

1. Cluster Configuration and Resource Management

2. Cluster Scaling

3. Cluster Security Management

Hadoop Cluster Monitoring

1. Monitoring Tools

2. Key Metrics to Monitor

3. Alerts and Notifications

4. Logs and Troubleshooting

সারাংশ

Hadoop Cluster Setup এবং Configuration Management

Hadoop Cluster Setup

Step-by-Step Hadoop Cluster Setup

1. Requirements (প্রয়োজনীয়তা):

2. Hadoop Installation (হাদুপ ইনস্টলেশন):

3. Hadoop Configuration (হাদুপ কনফিগারেশন):

4. Starting Hadoop Cluster:

Configuration Management in Hadoop

1. Manual Configuration vs. Automated Configuration

Manual Configuration:

Automated Configuration:

2. Configuration Management Tools

Ansible:

Chef:

Puppet:

3. Version Control and Backup:

Hadoop Cluster Performance Tuning and Monitoring

1. Monitoring Tools:

2. Performance Tuning:

সারাংশ

Ambari এবং Cloudera Manager দিয়ে Cluster Management

Ambari কী?

Ambari এর প্রধান বৈশিষ্ট্য:

Cloudera Manager কী?

Cloudera Manager এর প্রধান বৈশিষ্ট্য:

Ambari এবং Cloudera Manager এর মধ্যে পার্থক্য

Ambari এবং Cloudera Manager দিয়ে Cluster Management

Ambari দিয়ে Cluster Management

Cloudera Manager দিয়ে Cluster Management

সারাংশ

Hadoop Jobs Monitoring এবং Resource Utilization

Hadoop Jobs Monitoring (হাদুপ জব মনিটরিং)

Hadoop Jobs Monitoring এর উপকারিতা

Hadoop Job Monitoring Tools

1. ResourceManager Web UI

2. JobHistory Server

3. Ganglia

Resource Utilization (রিসোর্স ব্যবহার)

Hadoop Cluster Resource Utilization-এর প্রধান উপাদানসমূহ

Monitoring and Resource Utilization Tools

1. YARN Resource Manager

2. HDFS Disk Usage

3. MapReduce Job Execution Times

Best Practices for Monitoring and Resource Utilization

সারাংশ

Log Files এবং Hadoop Debugging Techniques

Hadoop Log Files

1. Job Logs

2. TaskTracker / NodeManager Logs

3. ResourceManager Logs

4. HDFS Logs

5. ZooKeeper Logs

Hadoop Debugging Techniques

1. Examining Logs

Log Error Messages Interpretation

2. Hadoop Counters for Debugging

3. Using Hadoop’s Web UI for Debugging

4. Memory and Disk Utilization

5. Use of Debugging Tools

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!