প্রাইম নাম্বার – সিভ অফ এরাটস্থেনিজ (Prime Number – Sieve of Eratosthenes)

Standard

আগের পর্বঃ প্রাইম নাম্বার – বেসিক

প্রাইম নাম্বারের বেসিক কনসেপ্টগুলো নিয়ে আগের পর্বে আলোচনা করা হয়েছে। এই পর্বে আমরা কিভাবে 1 থেকে শুরু করে n পর্যন্ত সকল প্রাইম নাম্বার বের করতে পারি তার একটা এফিসিয়েন্ট এলগোরিদম নিয়ে আলোচনা করব। এই এলগোরিদমটির নাম হল ‘সিভ অফ এরাটস্থেনিজ’।

সিভ মানে হল ছাঁকনি। এই এলগোরিদমে কম্পোজিট নাম্বারগুলো থেকে প্রাইম নাম্বারগুলোকে ছেঁকে আলাদা করা হয়। আর গ্রিক গণিতবিদ এরাটস্থেনিজ (২৭৬ পূর্বাব্দ – ১৯৫ পূর্বাব্দ) এই এলগোরিদমের আবিষ্কারক বিধায় এলগোরিদমটির নাম দেওয়া হয়েছে ‘সিভ অফ এরাটস্থেনিজ’। দ্রুততার সাথে প্রাইম নাম্বার বের করার ক্ষেত্রে এলগোরিদমটি এতোটাই কার্যকর যে ২২০০ বছরের পুরোনো এই এলগোরিদম আজও কম্পিউটার বিজ্ঞানে ব্যবহার করা হয়! এর সাহায্যে ১০ মিলিয়নের মধ্যে অবস্থিত সকল প্রাইম নাম্বার অনায়াসেই বের করে ফেলা যায়।

প্রত্যেকটি কম্পোজিট নাম্বারকেই কতগুলো প্রাইম নাম্বারের গুণিতক হিসেবে প্রকাশ করা যায়। এটি নাম্বার থিওরির একটা বেসিক থিওরি। অর্থাৎ n যদি একটি কম্পোজিট নাম্বার হয় তাহলে,

n = p1 x p2 x p3 x … x pk ; এখানে p1, p2, p3, … , pk সকলেই প্রাইম নাম্বার

এখন এই প্রাইম ফ্যাক্টরগুলোর মধ্যে অন্তত একটি প্রাইম ফ্যাক্টর থাকবেই যেটি √n এর সমান বা ছোট হবে। অন্যভাবে বলা যায় যদি একটি প্রাইম ফ্যাক্টর √n এর থেকে বড় হয় তাহলে বাকিগুলোর থেকে অন্তত একটিকে অবশ্যই √n এর থেকে ছোট হতেই হবে। যদি তা না হয়, অর্থাৎ যদি দুটি প্রাইম ফ্যাক্টর √n এর থেকে বড় হয় তাহলে তাদের গুণফল n এর থেকে বড় হয়ে যাবে যেটি সম্ভব নয়। অতএব একটি নাম্বার যদি প্রাইম না হয়, অর্থাৎ কম্পোজিট নাম্বার হয় তাহলে তার বর্গমূলের সমান অথবা ছোট অন্তত একটি প্রাইম নাম্বার থাকবেই যাকে দিয়ে ঐ নাম্বারটিকে ভাগ করা যাবে। এই কনসেপ্টটাই ব্যবহার করা হয় সিভ অফ এরাটস্থেনিজে।

ধরা যাক আমাদেরকে 1 থেকে 120 পর্যন্ত সকল প্রাইম নাম্বার বের করতে হবে। সংজ্ঞানুযায়ী 1 প্রাইম নাম্বার না। তাই শুরুতেই এটিকে আমরা বাদ দিয়ে দিলাম। এখন আমরা ধরে নিব যে যতগুলো নাম্বার আছে, অর্থাৎ 2 থেকে 120 পর্যন্ত তাদের সবগুলোই প্রাইম। এবার আমরা ছোট থেকে শুরু করে একটা করে প্রাইম নাম্বার নিব এবং সেটিকে রেখে তার গুণিতক গুলোকে কেটে দিব কারণ সেগুলো কম্পোজিট। এরপর এর পরের প্রাইম নাম্বার অর্থাৎ যেটি কেটে ফেলা হয়নি সেটি নিয়ে তার সবগুলো গুণিতককে আমরা কেটে দিব। এরপর তার পরবর্তি প্রাইম নাম্বার নিব এবং এভাবে বার বার একই কাজ করতে থাকব।

এখন কথা হল কতক্ষণ আমরা এটা করব? আগেই বলা হয়েছে কম্পোজিট নাম্বারের বর্গমূলের সমান বা ছোট একটি প্রাইম ফ্যাক্টর থাকবেই। এখানে আমাদের সর্বোচ্চ নাম্বার হল 120। এটি যদি কম্পোজিট হয় তাহলে এর বর্গমূল √120 এর মধ্যে অবস্থিত যেকোন একটি প্রাইমের গুণিতক হিসেবে এটি কেটে বাদ পড়ে যাবে। ফলে আমরা √120 পর্যন্ত প্রাইম নাম্বারগুলো দিয়ে এই কাজ করতে থাকব। আর 120 এর থেকে ছোট সকল নাম্বারের বর্গমূলও √120 অপেক্ষা ছোট হবে। তাই √120 পর্যন্ত প্রাইম নাম্বার নিয়ে কাটতে থাকলে ওগুলো কম্পোজিট হলে এর মধ্যে এমনিতেই বাদ পরে যাবে।

এই কাজটিই এখন এনিমেশনের মাধ্যমে দেখা যাক। (উৎসঃ উইকিপিডিয়া)

Sieve of Eratosthenes

এই কাজটিকে এখন যদি আমরা কোডে লিখতে চাই তাহলে কিভাবে করব? যেহেতু আমরা একটা লিস্ট থেকে কিছু নাম্বার রাখছি আর কিছু নাম্বার বাদ দিচ্ছি, তাই আমরা পুরো কাজটির জন্য একটা অ্যারে নিব। সেই অ্যারের ইন্ডেক্স আমাদের নাম্বার নির্দেশ করবে, আর অ্যারেতে আমরা সত্য অথবা মিথ্যা রাখব। একটি দিয়ে আমরা বোঝাবো যে ইন্ডেক্সের নাম্বারটি প্রাইম, অন্যটি দিয়ে বোঝাবো প্রাইম না। যেহেতু আমরা অ্যারের এলিমেন্টে কেবল দুটি ভেলু রাখবো তাই শুধু শুধু ৩২ বিটের ইন্টিজার অ্যারে নিয়ে মেমরি নষ্ট করার কোন মানে নেই। আমরা bool বা char অ্যারে দিয়েই কাজটি করতে পারি। bool নিলে আমরা true/false রাখবো, আর char নিলে 1 বা 0 রাখবো। নিচে কোডটি দেখানো হল –

[code language=”cpp”]
#define MAX 1000001

char prime[MAX]; // 0 দিয়ে initialize করতে হবে

// prime[index] এ যদি 0 থাকে তাহলে index একটি প্রাইম নাম্বার
// আর যদি 1 থাকে তাহলে index প্রাইম না
void primeGenerator( int n ) // n পর্যন্ত প্রাইম বের করব
{
int x = sqrt( n );
prime[0] = prime[1] = 1; // 0 এবং 1 প্রাইম না
for( int i = 2; i <= x; i++ ) {
if( prime[i] == 0 ) { // i যদি মৌলিক সংখ্যা হয় তাহলে 2i
for( int j = i+i; j <= n; j += i ) // থেকে শুরু করে i
prime[j] = 1; // এর সকল গুণিতককে বাদ দিয়ে দিব
}
}
return;
}
[/code]

আশা করি কোডটি বুঝতে কারও সমস্যা হবে না। উপরের কথাগুলোকেই কোডে রূপান্তর করা হয়েছে। না বুঝলে উপরের লেখাগুলো আবার পড়তে অনুরোধ করব। সংক্ষেপে বললে, আমরা 2 থেকে √n পর্যন্ত লুপ চালাচ্ছি। যদি নাম্বারটি প্রাইম হয় তাহলে আরেকটি লুপ চালিয়ে তার গুণিতকগুলোকে কম্পোজিট হিসেবে নির্দেশ করছি। এই কোডটিকে আরেকটু এফিসিয়েন্ট করা যায়। আমরা i এর মান ১ করে না বাড়িয়ে শুরুতেই সবগুলো জোড় সংখ্যাকে বাদ দিয়ে দিতে পারি। তারপর i এর মান 3 থেকে শুরু করে 2 করে বাড়াতে পারি। কারণ এটি খুবই সহজবোধ্য একটা ব্যাপার যে কোন 2 ব্যতীত কোন জোড় সংখ্যা প্রাইম হতে পারবে না। তাই শুধু শুধু সেগুলোতে লুপ চালানোর কোন দরকার নেই।

[code language=”cpp”]
#define MAX 1000001

char prime[MAX]; // 0 দিয়ে initialize করতে হবে

void primeGenerator( int n ) // n পর্যন্ত প্রাইম বের করব
{
int x = sqrt( n );
prime[0] = prime[1] = 1; // 0 এবং 1 প্রাইম না
for( int i = 4; i <= n; i += 2 ) // জোড় সংখ্যাগুলোকে বাদ দিয়ে দিব
prime[i] = 1;
for( int i = 3; i <= x; i += 2 ) {
if( prime[i] == 0 ) { // i যদি মৌলিক সংখ্যা হয় তাহলে 2i
for( int j = i+i; j <= n; j += i ) // থেকে শুরু করে i
prime[j] = 1; // এর সকল গুণিতককে বাদ দিয়ে দিব
}
}
return;
}
[/code]

এখানে ভিতরের লুপটাতে j = i + i এর পরিবর্তে j = i x i লেখা যায়। অর্থাৎ আমরা চাইলে লুপটিকে আরেকটু বড় নাম্বার থেকে শুরু করে চালাতে পারি। i এর মান যখন অনেক ছোট তখন এটি তেমন কোন প্রভাব না ফেললেও বড় নাম্বারের জন্য রানটাইম একটু কমানো সম্ভব। তবে কেন i x i লিখলেও হবে সেটি নিজে থেকে চিন্তা করার দায়িত্ব থাকল।

এভাবে সিভ অফ এরাটস্থেনিজের মাধ্যমে আমরা খুব সহজেই এবং অনেক দ্রুত গতিতে অনেক বড় নাম্বার পর্যন্ত সীমার মধ্যে সবগুল প্রাইম বের করে ফেলতে পারি। এই এলগোরিদমের টাইম কমপ্লেক্সিটি O( n ( log n ) ( log log n ) ) যা আমাদের গত পর্বের এলগোরিদমের কম্পেক্সিটি O(n^2) অপেক্ষা অনেক ভালো। এছাড়াও আরো এফিসিয়েন্ট এলগোরিদম রয়েছে যেগুলো নিয়ে পরবর্তিতে আলোচনা করা হবে।

আমরা এখানে char টাইপের অ্যারে নিয়েছি। কিন্ত দেখাই যাচ্ছে আমরা একটা নাম্বারের জন্য কেবল 1 বা 0 রাখছি যা একটি বিট দিয়েই হয়ে যায়। শুধু শুধু ৮ বিটের মেমরির বাকি ৭ বিট নষ্ট হচ্ছে। 1000000 টি এলিমেন্টের জন্য 7000000 বিট নষ্ট হচ্ছে। এতোখানি মেমরি নষ্ট না করে আমরা বিট-ওয়াইজ সিভ ব্যবহার করে একটা নাম্বারকে একটা বিটের সাহায্যে প্রাইম নাকি কম্পোজিট তা নির্দেশ করতে পারি।

প্র্যাকটিস প্রবলেমঃ
১। UVa 543 – Goldbach’s Conjecture
২। UVa 686 – Goldbach’s Conjecture (II)
৩। UVa 10394 – Twin Primes
৪। UVa 10533 – Digit Primes

পরবর্তি পর্বঃ প্রাইম নাম্বার – বিট-ওয়াইজ সিভ

  • last code ar 9 number line a loop a x hoi ki korey………2 ar multiple gula bad ditey hobey so sqrt porjonto nischoi 2 ar multiple nah ar chey beshi. oi khaney money hoy n hobey…

  • prime[0] = prime[1] = 1;
    এই লাইনটা বুঝলামনা 🙁

    • prime[x] = 1 মানে x প্রাইম না। যেহেতু 0 এবং 1 প্রাইম নাম্বার না, সেহেতু শুরুতেই prime[0] এবং prime[1] এর মান 1 করে দেওয়া হয়েছে।

  • Pingback: প্রাইম নাম্বার জেনারেটর কোড রিপো (Sieve of Eratosthenes Algorithm) | রবিউলের রাফখাতা()

  • Pingback: প্রাইম নাম্বার জেনারেটর কোড রিপো (Sieve of Eratosthenes Algorithm) – রবিউলের রাফখাতা()

  • SHIMUL

    prime[i] == 0
    এই লাইনটা বুঝলামনা

    • prime[i] == 0 হলে i মৌলিক সংখ্যা। আর যদি prime[i] == 1 হয় তাহলে i মৌলিক না।

  • Shah Shishir

    ভাইয়া, জিরো দিয়ে ইনিশিয়ালাইজ করতে যদি memset ইউজ করি তাহলে হবে কি? 🙂

    • অ্যারে গ্লোবালি ডিক্লেয়ার করলে ০ দিয়েই ইনিশিয়ালাইজ হয়। সেটার উপর আবার মেমসেট করাটা অর্থহীন। তবে কোথাও যদি একবার অ্যারে ব্যবহার করা হয় এবং তারপর পরবর্তি কেসের জন্য পুরো অ্যারেতে আবার ০ বসাতে হয় সেখানে মেমসেট ব্যবহার করতে পারো।

      • Shah Shishir

        অসংখ্য ধন্যবাদ ভাইয়া !!! 😀