সুচিপত্র:

PySpark সংগ্রহ কি?
PySpark সংগ্রহ কি?

ভিডিও: PySpark সংগ্রহ কি?

ভিডিও: PySpark সংগ্রহ কি?
ভিডিও: ডাটাব্রিক্স ব্যবহার করে PySpark-এ সংগ্রহ এবং নির্বাচনের মধ্যে পার্থক্য | ডেটাব্রিক্স টিউটোরিয়াল | 2024, নভেম্বর
Anonim

সংগ্রহ করুন (ক্রিয়া) - ড্রাইভার প্রোগ্রামে একটি অ্যারে হিসাবে ডেটাসেটের সমস্ত উপাদান ফেরত দিন। এটি সাধারণত একটি ফিল্টার বা অন্য অপারেশনের পরে দরকারী যা ডেটার যথেষ্ট ছোট উপসেট প্রদান করে।

এই ভাবে, PySpark কি?

পাইস্পার্ক প্রোগ্রামিং। পাইস্পার্ক অ্যাপাচি স্পার্ক এবং পাইথনের সহযোগিতা। Apache Spark হল একটি ওপেন সোর্স ক্লাস্টার-কম্পিউটিং ফ্রেমওয়ার্ক, যা গতি, ব্যবহারের সহজতা এবং স্ট্রিমিং অ্যানালিটিক্সের চারপাশে তৈরি যেখানে পাইথন একটি সাধারণ-উদ্দেশ্য, উচ্চ-স্তরের প্রোগ্রামিং ভাষা।

এছাড়াও, PySpark এ মানচিত্র কি? স্পার্ক মানচিত্র রূপান্তর। ক মানচিত্র Apache Spark এ একটি রূপান্তর অপারেশন। এটি RDD এর প্রতিটি উপাদানের জন্য প্রযোজ্য এবং এটি নতুন RDD হিসাবে ফলাফল প্রদান করে। মানচিত্র N দৈর্ঘ্যের একটি RDD কে N দৈর্ঘ্যের অন্য RDD-তে রূপান্তরিত করে। ইনপুট এবং আউটপুট RDD-তে সাধারণত একই সংখ্যক রেকর্ড থাকবে।

এই ভাবে, PySpark এ SparkContext কি?

পাইস্পার্ক - স্পার্ক কনটেক্সট . বিজ্ঞাপন. স্পার্ক কনটেক্সট কোন প্রবেশ বিন্দু হয় স্পার্ক কার্যকারিতা আমরা যখন কোন রান স্পার্ক অ্যাপ্লিকেশন, একটি ড্রাইভার প্রোগ্রাম শুরু হয়, যার প্রধান ফাংশন আছে এবং আপনার স্পার্ক কনটেক্সট এখানে শুরু হয়। ড্রাইভার প্রোগ্রাম তারপর কর্মী নোডগুলিতে নির্বাহকদের ভিতরে ক্রিয়াকলাপ চালায়।

আমি কিভাবে PySpark সংস্করণ চেক করব?

2 উত্তর

  1. স্পার্ক শেল টার্মিনাল খুলুন এবং কমান্ড লিখুন।
  2. sc.version অথবা spark-submit --version।
  3. সবচেয়ে সহজ উপায় হল শুধুমাত্র কমান্ড লাইনে "spark-shell" চালু করা। এটি প্রদর্শন করবে.
  4. স্পার্কের বর্তমান সক্রিয় সংস্করণ।

প্রস্তাবিত: