Seo বা সার্চ ইন্জিন অপটিমাইজেশন পর্ব 3 - Know and sharing site in Bangladesh

Breaking

Know and sharing site in Bangladesh

লেখাপড়া টিপস tipscountbd24.blogspot.com

কম খরচে ফেসবুকে এড দিতে!কল করুন:

+88 01776233093

Post Top Ad

কম খরচে ফেসবুকে এড দিতে!কল করুন:

+88 01776233093

Thursday, December 21, 2017

Seo বা সার্চ ইন্জিন অপটিমাইজেশন পর্ব 3



                                                               part 2
                                                               part 3
                                                               part 4
                                                               part 5

“robots.txt” ফাইল এমন একটি ফাইল যেটা সার্চ ইন্জিনকে বলে যে,সার্চ ইন্জিন একটা সাইটের কোন কোন্ পেজ crawl করবে আর কোন কোন পেজ crawl করবেনা।এই robots.txt ফাইলটি রুট ফোল্ডারে থাকে।

আপনার সাইটের কিছু পেজ সার্চ রেজাল্টে না দেখানো হোক আপনি হয়ত এটা চাইতে পারেন।কারন হতে পারে সেই পেজগুলির কাজ এখনও শেষ হয়নি বা অন্য যেকোন কারন।এজন্য আপনি একটি robots.txt ফাইল তৈরী করে সেখানে ঠিক করে দিতে পারেবন যে কোন্ কোন্ পেজ সার্চ ইন্জিন crawl করবেনা।আপনার যদি সাবডোমেইন থাকে এবং এর কিছু পেজ যদি সার্চ রেজাল্টে না দেখানো হোক এটা চান তাহলে এটার জন্য আলাদা একটা robots.txt ফাইল তৈরী করতে হবে।robots.txt ফাইলটি তৈরীর পর রুট ফোল্ডারে আপলোড করতে হবে।

robots.txt ফাইল তৈরী

robots.txt ফাইল দিয়ে সার্চ ইন্জিনের বট,ক্রাউলার এবং স্পাইডার সাইটের কোন্ কোন্ পেজ দেখবে এবং কোন্ কোন্ পেজ দেখবেনা এসব নিয়ন্ত্রন করা যায়।এই নিয়ন্ত্রনের পদ্ধতিকে বলা হয় রোবটস এক্সক্লুসন প্রটোকল (Robots Exclusion Protocol) বা রোবটস এক্সক্লুসন স্টান্ডার্ড (Robots Exclusion Standard) .এই ফাইল তৈরীর আগে এখানে ব্যবহৃত কিছু চিহ্ন চিনে নেয়া যাক
Robots.txt Protocol - Standard Syntax & Semantics
অংশ/চিহ্নবর্ননা
User-agent:নির্দেশ করে রোবট(সমূহ)কে
*Wildcard. User-agent: * এটার অর্থ সব রোবট
disallow:প্রতিটি লাইন disallow: দিয়ে শুরু হয়।এরপরে আপনি / দিয়ে URL path ঠিক করে দিতে পারেন।এতে করে ওই path বা ফাইল বা ওই পেজ আর রোবট ক্রাউল করবেনা।যদি কোন path না দেন অথ্যাৎ ফাকা থাকে তাহলে disallow  কাজ করবে allow এর।
#কমেন্ট করার জন্য।এটার পরে কোন লাইন এজন্য লেখা হয় যাতে এই লাইনটি পরে বোঝা যায় যে নিচের কোডগুলি কি বিষয়ক হবে।

Disallow ফিল্ড আংশিক বা পূর্নাঙ্গ URL উপস্থাপন করতে পারে।/ চিহ্নের পর যে path উল্লেখ থাকবে সেই path রোবট ভিজিট করবেনা।যেমন
Disallow: /help
#disallows both /help.html and /help/index.html, whereas

Disallow: /help/
# would disallow /help/index.html but allow /help.html

কিছু উদাহরন
সব রোবট অনুমোদন করবে করবে সব ফাইল ভিজিটের জন্য (wildcard “*” নির্দেশ করে সব রোবট)
User-agent: *
Disallow:

সব রোবট  কোন ফাইল ভিজিট করবেনা
User-agent: *
Disallow: /

গুগলবট এর শুধু ভিজিটের অনুমোদন থাকবে বাকি কেউ ভিজিট করতে পারবেনা
User-agent: GoogleBot
Disallow:
 
User-agent: *
Disallow: /

গুগলবট এবং ইয়াহুস্লার্প এর শুধু ভিজিটের অনুমোদন থাকবে বাকি কারো থাকবেনা
User-agent: GoogleBot
User-agent: Slurp
Disallow:
 
User-agent: *
Disallow: /

কোন একটা নির্দিষ্ট বটের ভিজিট যদি বন্ধ করতে চান তাহলে
User-agent: *
Disallow:
 
User-agent: Teoma
Disallow: /

এই ফাইলটি দ্বারা যদি আপনার সাইটের কোন URL বা পেজ crawl করা বন্ধ করে দেন তারপরেও কিছু সমস্যার কারনে এই পেজগুলি কোথাও কোথাও দেখাতে পারে।যেমন রেফারেল লগ এ URL গুলি দেখাতে পারে।তাছাড়া কিছু কিছু সার্চ ইন্জিন আছে যাদের এলগরিদম খুব উন্নত নয় ফলে এসব ইন্জিন থেকে যখন স্পাইডার/বোট crawl করার জন্য পাঠায় তখন এরা robots.txt ফাইলের নির্দেশনাকে উপেক্ষা করে আপনার সব URL crawl করে যাবে।

এসব সমস্যা এড়াতে আরেকটা ভাল পদ্ধতি হল এই সমস্ত কনটেন্টকে htaccess ফাইল দিয়ে পাসওয়ার্ড বা বন্ধ করে রাখা।

rel=”nofollow” এর ব্যাপারে সতর্ক থাকুন

কোন লিংকে rel এট্রিবিউট এ “nofollow” সেট করে দিয়ে গুগল বা সার্চ ইন্জিনকে বলে দিতে পারেন যে এই সমস্ত লিংক যেন সে crawl না করে।যদি আপনার সাইট কোন ব্লগ বা ফোরাম হয় যেখানে মন্তব্য করা যায় তাহলে কমেন্ট অংশকে এভাবে nofollow করে দিয়ে রাখতে পারেন।এতে করে আপনার ব্লগ বা ফোরামের খ্যাতি ব্যবহার করে নিজের সাইটের rank বাড়াতে পারবেনা।আবার অনেক সময় অনেকে আপত্তিকর সাইটের ঠিকানা আপনার সাইটে দিতে পারে ফলে যা আপনি চান না। এছাড়াও এমন সাইটের লিংক দিতে পারে যেটা গুগলের কাছে spammer, এতে করে আপনার সাইটের খ্যাতি নষ্ট হবে।
<a href="http://www.shadyseo.com" rel="nofollow">Comment spammer</a>
প্রতিটি লিংকে nofollow না দিয়ে robot মেটা ট্যাগেও nofollow দিলে একই কাজ করবে।
<html>
<head>
<title>Brandon's Baseball Cards - Buy Cards, Baseball News, Card Prices</title>
<meta content="Brandon's Baseball Cards provides a large selection of vintage and modern baseball cards for sale. We also offer daily baseball news and events in">
<meta content="nofollow">
</head>
<body>

বিখ্যাত সব সার্চ ইন্জিনে আপনার সাইটের ইউআরএল (URL) সাবমিট করুন
গুগলে সাইটের URL সাবমিট করার জন্যhttp://www.google.com/addurl/ এখানে যান,নিচে দুটি বক্স আসবে URL বক্সে সাইটের URL এবং comments বক্সে সাইট সম্পর্কে সংক্ষিপ্ত বর্ননা দিয়ে Add URL বাটনে ক্লিক করলেই গুগল আপনার সাইট crawl করা শুরু করবে।

                    url submission

ইয়াহুতে URLhttp://www.addurlyahoo.com/siteekle.aspএখানে গিয়ে category,subcategory সিলেক্ট করে URL সাবমিট করুন।

বিং সার্চ ইন্জিনে সাইট সাবমিটের জন্যhttp://www.bing.com/webmaster/SubmitSitePage.aspxএ গিয়ে সাইটের ঠিকানা টাইপ করে সাবমিট বাটনে ক্লিক করুন।
ওয়েবমাস্টারদের গুগল ওয়েবমাস্টার টুল এর ব্যবহার জানা অনেকটা অপরিহার্য।এখানে যেকোন সাইট যোগ করে দিতে পারেন একদম বিনামুল্যে।গুগলে আপনার সাইটের পেজগুলি কিভাবে দেখাবে এ বিষয়ে গুগল ওয়েবমাস্টার টুল বিস্তারিত বর্ননা প্রদান করে,এছাড়াও আরও অনেক কাজ আছে নিচে বিস্তারিত দেয়া হল
প্রথমে এই ঠিকানায় যেতে হবে,এখানে গেলেই আপনার জিমেইল একাউন্ট দিয়ে সাইন ইন করতে বলবে।আপনার যদি জিমেইল একাউন্ট না থাকে তাহলে একটা খুলে নিন কারন জিমেইল একাউন্ট ছাড়া গুগল ওয়েবমাস্টার টুল এর এই সেবা (সম্পূর্ন বিনামুল্যের)গ্রহন করতে পারবেননা।আর যদি থাকে তাহলে এখানে ইউজার নাম এবং পাসওয়ার্ড দিয়ে সাইন ইন করে ভিতরে ঢুকুন।
এবার গুগল ওয়েবমাস্টার টুলে আপনি এক বা একাধিক সাইট যুক্ত করতে পারেন।এজন্য Add a Site নামের বাটনে ক্লিক করে আগত বক্সে আপনি যে সাইটটি যোগ করতে চান তার নাম দিয়ে Continue বাটনে ক্লিক করুন।

              webmaster tool-add a site

এবার Verify ownership নামের একটি পেজ আসবে এখান থেকে গুগলকে বুঝাতে হবে যে ,সাইটটির প্রকৃত মালিক আপনি।সাইটের মালিকানা প্রমান করতে গুগল এখানে ৪টি পদ্ধতি অনমোদন করে,আপনি যেকোনটি ব্যবহার করে এটা প্রমান করতে পারেন।

এরমধ্যে ১ম পদ্ধতিটি খুব সহজ,Upload an HTML file to your server এই চেকবক্সটি চেক করে একটু নিচে স্ক্রল করে গিয়ে দেখুন একটা এইচটিএমএল ভেরিফিকেশন কোড এর ডাউনলোড লিংক আছে,ছোট এই ফাইলটি ডাউনলোড করে আপনার সাইটের রুট ফোল্ডারে আপলোড করুন।সিপ্যানেল যদি ব্যবহার করেন তাহলে আপনার public_html এ ফাইলটি আপলোড করুন।
এবার Verify ownership পেজে এসে http://www.iconictbd.com এই ধরনের একটা লিংক আছে এখানে ক্লিক করে ফাইলটি আপলোড নিশ্চিত করুন এবং শেষে verify বাটনে ক্লিক করে এই পর্ব শেষ করুন।

ভেরিফাই শেষ করলে এই ধরনের একটা পেজ আসবে,এখান থেকে আপনার সাইটটির লিংকের উপর ক্লিক করে ড্যাশবোর্ডে এ যান।

webmaster tool-dashboard

ড্যাশবোর্ডে বিভিন্ন ধরনের তথ্যের সারমর্ম থাকে যেমন Search queries এখানে আপনার সাইট খোজার জন্য গুগলে কোন কোন্ শব্দ ব্যবহার করা হয় এসব শব্দের তালিকা থাকে।
Crawl errors এখানে আপনার সাইট ক্রাউল করতে কোন সমস্যা হয়েছে কিনা এসব তথ্য থাকে।
Links to your site এখানে আপনার সাইটের লিংক আর কোন কোন সাইটে আছে এসব সাইটের তালিকা থাকে।
Keywords এখানে গুগলবট আপনার সাইট ক্রাউলিং এর সময় কোন শব্দগুলি বেশি পায় সেসব শব্দের তালিকা থাকে।
Sitemaps এখানে সাইটম্যাপ সাবমিট করেছেন কিনা বা করলে সাইটম্যাপের কতটি URL গুগলের ডেটাবেসে নেয়া হয়েছে ইত্যাদি তথ্য থাকে।

ড্যাশবোর্ডের বামদিকে Site Configuration মেনুর অধীনে প্রথম সাবমেনু sitemap.এখান থেকে গুগলে সাইটম্যাপ সাবমিট করতে হয়।এছাড়া এখানে সাইটম্যাপ সাবমিট করেছেন কিনা বা করলে সাইটম্যাপের কতটি URL গুগলের ডেটাবেসে নেয়া হয়েছে ইত্যাদি তথ্য থাকে।নতুন একটা সাইটম্যাপ সাবমিট করতে Submit a sitemap বাটনে ক্লিক করুন এতে একটি বক্স আসবে এখানে আপনার সাইটম্যাপটি যেখানে আছে তার ঠিকানা লিখে Submit Sitemap বাটনে ক্লিক করুন।উদাহরনস্বরুপ নিচের সাইটের কথা বিবেচনা করছি,এখানে আমি স্লাশ চিহ্নের পর sitemap.xml দিয়েছি কারন আমার সাইটের সাইটম্যাপটি রুট ফোল্ডারে আছে।

sitemap submission


আমি আগেই সাইটম্যাপ সাবমিট করেছি তাই উপরে দেখুন Sumitted URLs এ দেখাচ্ছে যে আমি ২০০ টি URL সাবমিট করেছিলাম এবং এখান থেকে গুগলের ডেটাবেসে ১৯৯ টি সেভ করা হয়েছে।



No comments:

Post a Comment