Parquet ডেটা বিন্যাস কি?
Parquet ডেটা বিন্যাস কি?

ভিডিও: Parquet ডেটা বিন্যাস কি?

ভিডিও: Parquet ডেটা বিন্যাস কি?
ভিডিও: Apache Parquet একটি ভূমিকা 2024, মে
Anonim

অ্যাপাচি কাঠবাদাম একটি মুক্ত এবং ওপেন সোর্স কলাম-ভিত্তিক তথ্য স্টোরেজ বিন্যাস Apache Hadoop বাস্তুতন্ত্রের। এটি বেশিরভাগের সাথে সামঞ্জস্যপূর্ণ তথ্য Hadoop পরিবেশে প্রক্রিয়াকরণ কাঠামো. এটি কার্যকরী প্রদান করে তথ্য জটিল পরিচালনার জন্য উন্নত কর্মক্ষমতা সহ কম্প্রেশন এবং এনকোডিং স্কিম তথ্য প্রচুর পরিমাণে.

সহজভাবে তাই, parquet ফাইল বিন্যাস কি?

কাঠবাদাম , একটি ওপেন সোর্স ফাইলের বিন্যাস হাডুপের জন্য। কাঠবাদাম একটি সমতল কলামারে নেস্টেড ডেটা স্ট্রাকচার সঞ্চয় করে বিন্যাস . একটি ঐতিহ্যগত পদ্ধতির তুলনায় যেখানে ডেটা সারি-ভিত্তিক পদ্ধতিতে সংরক্ষণ করা হয়, কাঠবাদাম স্টোরেজ এবং কর্মক্ষমতা পরিপ্রেক্ষিতে আরো দক্ষ.

তদ্ব্যতীত, কাঠবাদাম কি জন্য ব্যবহৃত হয়? কাঠবাদাম Hadoop ইকোসিস্টেমের যেকোনো প্রকল্পের জন্য উপলব্ধ একটি ওপেন সোর্স ফাইল ফরম্যাট। অ্যাপাচি কাঠবাদাম CSV বা TSV ফাইলের মতো সারি ভিত্তিক ফাইলের তুলনায় ডেটার দক্ষ এবং কর্মক্ষম ফ্ল্যাট কলামার স্টোরেজ বিন্যাসের জন্য ডিজাইন করা হয়েছে।

উপরন্তু, কিভাবে parquet বিন্যাস তথ্য সংরক্ষণ করে?

ডেটা ব্লক প্রতিটি ব্লক কাঠবাদাম ফাইল হল সংরক্ষিত সারি গ্রুপ আকারে. তাই, তথ্য এ কাঠবাদাম ফাইলটি একাধিক সারি গ্রুপে বিভক্ত। এই সারি গোষ্ঠীগুলি এক বা একাধিক কলাম খণ্ড নিয়ে গঠিত যা একটি কলামের সাথে মিলে যায় তথ্য সেট দ্য তথ্য পৃষ্ঠা আকারে লেখা প্রতিটি কলাম খণ্ডের জন্য।

কাঠবাদাম কি মানুষের পাঠযোগ্য?

ওআরসি, কাঠবাদাম এবং অভ্রও মেশিন- পঠনযোগ্য বাইনারি ফরম্যাট, যার মানে হল যে ফাইলগুলি দেখতে অস্বস্তিকর মত দেখাচ্ছে৷ মানুষ . যদি তুমি চাও একজন মানুষ - পঠনযোগ্য JSON বা XML এর মতো বিন্যাস, তাহলে আপনি সম্ভবত কেন প্রথমে Hadoop ব্যবহার করছেন তা পুনরায় বিবেচনা করা উচিত।

প্রস্তাবিত: