অ্যামাজন ইলাস্টিক ম্যাপরিডুসের পিছনে ডেটা প্রসেসিং ইঞ্জিন কী?
অ্যামাজন ইলাস্টিক ম্যাপরিডুসের পিছনে ডেটা প্রসেসিং ইঞ্জিন কী?

ভিডিও: অ্যামাজন ইলাস্টিক ম্যাপরিডুসের পিছনে ডেটা প্রসেসিং ইঞ্জিন কী?

ভিডিও: অ্যামাজন ইলাস্টিক ম্যাপরিডুসের পিছনে ডেটা প্রসেসিং ইঞ্জিন কী?
ভিডিও: অ্যামাজন ইএমআর কী এবং ডেটা প্রক্রিয়াকরণের জন্য আমি কীভাবে এটি ব্যবহার করতে পারি? 2024, ডিসেম্বর
Anonim

আমাজন ইএমআর এটি বিতরণ হিসাবে Apache Hadoop ব্যবহার করে ডেটা প্রসেসিং ইঞ্জিন . Hadoop একটি ওপেন সোর্স, জাভা সফ্টওয়্যার ফ্রেমওয়ার্ক যা সমর্থন করে তথ্য -বড় ক্লাস্টারে চলমান নিবিড় বিতরণ করা অ্যাপ্লিকেশন এর পণ্য হার্ডওয়্যার.

তাছাড়া, Amazon Elastic MapReduce কি?

আমাজন ইলাস্টিক ম্যাপরিডুস ( ইএমআর ) একটি আমাজন ওয়েব সার্ভিসেস ( এডব্লিউএস ) বড় তথ্য প্রক্রিয়াকরণ এবং বিশ্লেষণের জন্য টুল। আমাজন ইএমআর ভার্চুয়াল সার্ভারের একটি Hadoop ক্লাস্টার জুড়ে বড় ডেটা প্রক্রিয়া করে আমাজন ইলাস্টিক কম্পিউট ক্লাউড ( EC2 ) এবং আমাজন সহজ স্টোরেজ পরিষেবা ( S3 ).

উপরন্তু, Amazon EMR কি সম্পূর্ণরূপে পরিচালিত হয়? এটা একটা সম্পূর্ণরূপে পরিচালিত ডেটা লেক পরিষেবা যা কম্পিউট রিসোর্স থেকে ডেটা স্টোরেজ ডিক্যুল করতে পারে এবং পরিবর্তে কম্পিউট ক্লাস্টারগুলিকে মাপযোগ্য করে তোলে, চাহিদা অনুযায়ী ব্যবহার করার জন্য উপলব্ধ, এবং একাধিক ক্লাস্টারের জন্য একই ডেটাসেটগুলি একবারে অ্যাক্সেস করার ক্ষমতা অন্তর্ভুক্ত করে।

কেউ জিজ্ঞাসা করতে পারে, কিভাবে AWS EMR কাজ করে?

সাধারণত, যখন আপনি ডেটা প্রক্রিয়া করেন আমাজন ইএমআর , ইনপুটটি আপনার নির্বাচিত অন্তর্নিহিত ফাইল সিস্টেমে ফাইল হিসাবে সংরক্ষিত ডেটা, যেমন আমাজন S3 বা HDFS। এই ডেটা প্রক্রিয়াকরণের ক্রমানুসারে এক ধাপ থেকে পরের ধাপে যায়। চূড়ান্ত ধাপটি একটি নির্দিষ্ট স্থানে আউটপুট ডেটা লেখে, যেমন একটি আমাজন S3 বালতি।

ec2 এবং EMR এর মধ্যে পার্থক্য কি?

অপছন্দ ইএমআর , EC2 স্লেভ নোডগুলিকে মূল এবং টাস্ক নোডগুলিতে শ্রেণীবদ্ধ করে না। একটি নোড সরানো/হারানো হলে এটি HDFS ডেটা হারানোর ঝুঁকি বাড়ায়। EC2 s3-এ ডেটা অ্যাক্সেস করতে Apache লাইব্রেরি (s3a) ব্যবহার করে। অন্য দিকে, ইএমআর s3 এ দ্রুত অ্যাক্সেস পেতে AWS মালিকানা কোড ব্যবহার করে।

প্রস্তাবিত: