paint-brush
টাইটানিকের উপর একজনের বেঁচে থাকার সম্ভাবনা কতটা ছিল?দ্বারা@dotslashbit
3,535 পড়া
3,535 পড়া

টাইটানিকের উপর একজনের বেঁচে থাকার সম্ভাবনা কতটা ছিল?

দ্বারা Sahil12m2023/08/09
Read on Terminal Reader
Read this story w/o Javascript

অতিদীর্ঘ; পড়তে

শ্রেণী বৈষম্য কি সেই জাহাজে থাকা ব্যক্তিদের ভাগ্য নির্ধারণে, সুবিধা এবং বিপদের মধ্যে বিভাজন তৈরি করতে ভূমিকা পালন করেছিল? কীভাবে বয়স এবং লিঙ্গ প্রভাবিত করেছিল কারা বেঁচে ছিল এবং কারা নিরলস সমুদ্রে আত্মহত্যা করেছিল? বিশৃঙ্খলার মধ্যে, পরিবারের সদস্যদের উপস্থিতি কি সান্ত্বনা এবং সমর্থন প্রদান করেছিল, যাত্রীদের একসাথে ঝড়ের মুখোমুখি হওয়ার আহ্বান জানিয়েছিল? এবং যাত্রার বন্দর কি তাদের ভাগ্যকে প্রভাবিত করেছিল যারা বিভিন্ন স্থান থেকে চড়েছিল? সৌভাগ্যক্রমে, আমরা Kaggle এ উপলব্ধ টাইটানিক ডেটাসেট ব্যবহার করে এই প্রশ্নের উত্তর দিতে পারি। এটি ডুবে যাওয়ার একশো বছরেরও বেশি সময় পরে, আমরা ডেটা ব্যবহার করে বুঝতে পারি যে কীভাবে একটি টিকিটের মূল্য বেঁচে থাকার উপর প্রভাব ফেলতে পারে এবং কিছু কেবিন অবস্থানগুলি দুঃখজনক ঘটনার সময় আশ্রয় দিয়েছিল কিনা। এই এক্সপ্লোরেটরি ডেটা অ্যানালাইসিস (EDA) যাত্রীদের অভিজ্ঞতার অন্তর্দৃষ্টি প্রকাশ করবে, সেই দুর্ভাগ্যজনক রাতে তাদের সাহস এবং ক্ষতির গল্পের উপর আলোকপাত করবে।
featured image - টাইটানিকের উপর একজনের বেঁচে থাকার সম্ভাবনা কতটা ছিল?
Sahil HackerNoon profile picture
0-item
1-item

1912 সালে আরএমএস টাইটানিকের ডুবে যাওয়া ইতিহাসের সবচেয়ে মারাত্মক সামুদ্রিক বিপর্যয়গুলির মধ্যে একটি। জাহাজটি একটি আইসবার্গে আঘাত হানে এবং উত্তর আটলান্টিক মহাসাগরে ডুবে গেলে 1,500 জনেরও বেশি লোক প্রাণ হারিয়েছিল। পরবর্তী বছরগুলিতে, উচ্চ মৃত্যুর সংখ্যায় অবদান রাখার কারণগুলি বোঝার জন্য ব্যাপক গবেষণা পরিচালিত হয়েছে।


মাত্র 38% যাত্রী এই বিধ্বংসী ঘটনা থেকে বেঁচে গিয়েছিলেন, যা আমাকে সেই দুর্ভাগ্যজনক রাতে টাইটানিকের জাহাজে থাকা ব্যক্তিদের সম্পর্কে আশ্চর্য হতে প্ররোচিত করেছিল।


শ্রেণী বৈষম্য কি সেই জাহাজে থাকা ব্যক্তিদের ভাগ্য নির্ধারণে, বিশেষাধিকার এবং বিপদের মধ্যে একটি বিভাজন তৈরি করতে ভূমিকা পালন করেছিল? কীভাবে বয়স এবং লিঙ্গ প্রভাবিত করেছিল কারা বেঁচে ছিল এবং কারা নিরলস সমুদ্রে আত্মহত্যা করেছিল? বিশৃঙ্খলার মধ্যে, পরিবারের সদস্যদের উপস্থিতি কি সান্ত্বনা এবং সমর্থন প্রদান করেছিল, যাত্রীদের একসাথে ঝড়ের মুখোমুখি হওয়ার আহ্বান জানিয়েছিল? এবং যাত্রার বন্দর কি তাদের ভাগ্যকে প্রভাবিত করেছিল যারা বিভিন্ন স্থান থেকে চড়েছিল?


সৌভাগ্যক্রমে, আমরা Kaggle এ উপলব্ধ টাইটানিক ডেটাসেট ব্যবহার করে এই প্রশ্নের উত্তর দিতে পারি। এটি ডুবে যাওয়ার একশো বছরেরও বেশি সময় পরে, আমরা ডেটা ব্যবহার করে বুঝতে পারি যে কীভাবে একটি টিকিটের মূল্য বেঁচে থাকার উপর প্রভাব ফেলতে পারে এবং কিছু কেবিন অবস্থানগুলি দুঃখজনক ঘটনার সময় আশ্রয় দিয়েছিল কিনা। এই এক্সপ্লোরেটরি ডেটা অ্যানালাইসিস (EDA) যাত্রীদের অভিজ্ঞতার অন্তর্দৃষ্টি প্রকাশ করবে, সেই দুর্ভাগ্যজনক রাতে তাদের সাহস এবং ক্ষতির গল্পে আলোকপাত করবে।

প্রশ্ন/অন্তর্দৃষ্টি

এখানে কিছু অন্তর্দৃষ্টি রয়েছে যা আমরা বিশ্লেষণের সময় অন্বেষণ করব:


  1. টাইটানিকের যাত্রীদের সামগ্রিকভাবে বেঁচে থাকার হার কত?
  2. কিভাবে বেঁচে থাকার হার লিঙ্গ দ্বারা পরিবর্তিত হয়? পুরুষদের তুলনায় মহিলাদের বেঁচে থাকার সম্ভাবনা বেশি?
  3. টাইটানিকের যাত্রী বয়সের বন্টন কি? কোন উল্লেখযোগ্য নিদর্শন আছে?
  4. বিভিন্ন যাত্রী শ্রেণীর (1ম, 2য়, 3য়) যাত্রীদের বেঁচে থাকার হার আলাদা ছিল?
  5. বিভিন্ন বয়সের (যেমন, শিশু, প্রাপ্তবয়স্ক, বয়স্ক) মধ্যে বেঁচে থাকার হার কত?
  6. যাত্রার বন্দর কি বেঁচে থাকার সম্ভাবনাকে প্রভাবিত করেছিল?
  7. কিভাবে উপস্থিতি পরিবার বেঁচে থাকার হার প্রভাবিত করে?
  8. বেশি ভাড়ার যাত্রীদের কি বেঁচে থাকার ভালো সুযোগ ছিল?
  9. যাত্রী কেবিন অবস্থানের বন্টন কি? নির্দিষ্ট কেবিনে যাত্রীদের বেঁচে থাকার হার বেশি ছিল?

ডেটা

টাইটানিক ডেটাসেট হল 1912 সালে ডুবে যাওয়া আরএমএস টাইটানিকের যাত্রী ও ক্রুদের তথ্যের একটি সংগ্রহ। ডেটাসেটে প্রতিটি যাত্রীর নাম, বয়স, লিঙ্গ, টিকিটের শ্রেণী এবং তারা ডুবে বেঁচেছিল কিনা সে সম্পর্কে তথ্য রয়েছে। টাইটানিক ডেটাসেট মেশিন লার্নিং এবং ডেটা সায়েন্স প্রকল্পের জন্য একটি জনপ্রিয় ডেটাসেট। যাত্রীরা তাদের বৈশিষ্ট্যের উপর ভিত্তি করে ডুবে যাওয়া থেকে বেঁচে গেছে কিনা তা অনুমান করার জন্য এটি প্রায়শই মডেলদের প্রশিক্ষণের জন্য ব্যবহৃত হয়। টাইটানিক ডেটাসেট সামাজিক নেটওয়ার্ক এবং মানুষের আচরণ অধ্যয়ন করতেও ব্যবহৃত হয়।


টাইটানিক ডেটাসেট তৈরি করেছে কাগল, একটি ডেটা বিজ্ঞান সম্প্রদায়। ডেটাসেটটি Kaggle ওয়েবসাইটে বিনামূল্যে ডাউনলোডের জন্য উপলব্ধ।


আপনি এখানে ডেটাসেট পেতে পারেন

পূর্বশর্ত

  • পান্ডা
  • ম্যাটপ্লটলিব
  • সামুদ্রিক

ডেটা লোড হচ্ছে

আসুন প্রয়োজনীয় মডিউল এবং টাইটানিক ডেটাসেট লোড করে আমাদের বিশ্লেষণ শুরু করি

 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Load the Titanic dataset df = pd.read_csv('/kaggle/input/titanic/train.csv') df.head() 

টাইটানিক ডেটাসেট প্রথম 5 সারি

আপনি দেখতে পাচ্ছেন যে এই ডেটাসেটে প্রতিটি যাত্রী সম্পর্কে সমস্ত তথ্য রয়েছে যা আমি এই নিবন্ধের ভূমিকা বিভাগে আলোচনা করেছি।


এখন, পান্ডা ব্যবহার করে আমাদের বিশ্লেষণ শুরু করা যাক এবং matplotlib এবং seaborn ব্যবহার করে অন্তর্দৃষ্টিগুলি কল্পনা করা যাক।

অনুসন্ধানমূলক ডেটা বিশ্লেষণ

টাইটানিকের যাত্রীদের সামগ্রিকভাবে বেঁচে থাকার হার কত?

 # Calculate the overall survival rate survival_rate = df['Survived'].mean() * 100 # Create a bar plot to visualize the survival rate sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.countplot(x='Survived', data=df) plt.xlabel('Survived') plt.ylabel('Passenger Count') plt.title('Survival Rate: {:.2f}%'.format(survival_rate)) plt.xticks([0, 1], ['No', 'Yes']) plt.show() 

শতকরা সংখ্যক যাত্রী বেঁচে গেছে

বার প্লটটি টাইটানিকের যাত্রীদের সামগ্রিক বেঁচে থাকার হারের একটি স্পষ্ট এবং সংক্ষিপ্ত দৃশ্য উপস্থাপন করে। এটি প্রকাশ করে যে মাত্র 38% যাত্রী দুর্যোগ থেকে বাঁচতে পেরেছিলেন।


দণ্ডের উচ্চতা প্রতিটি বিভাগে যাত্রীর সংখ্যা প্রতিনিধিত্ব করে (অ-জীবিতদের জন্য 0 এবং বেঁচে থাকাদের জন্য 1)। বেঁচে থাকার হার, প্লটের শিরোনামে নির্দেশিত, মর্মান্তিক ঘটনা থেকে বেঁচে থাকা যাত্রীদের শতাংশকে তুলে ধরে।

কিভাবে বেঁচে থাকার হার লিঙ্গ দ্বারা পরিবর্তিত হয়? পুরুষদের তুলনায় মহিলাদের বেঁচে থাকার সম্ভাবনা বেশি?

 # Calculate the survival rate by gender survival_by_gender = df.groupby('Sex')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rate by gender sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.barplot(x=survival_by_gender.index, y=survival_by_gender.values) plt.xlabel('Gender') plt.ylabel('Survival Rate') plt.title('Survival Rate by Gender') plt.show() 

লিঙ্গ অনুসারে বেঁচে থাকা যাত্রীদের শতাংশ

আপনি দেখতে পাচ্ছেন যে সমস্ত বেঁচে যাওয়া যাত্রীদের মধ্যে 70% এর বেশি মহিলা। পুরুষদের তুলনায় মহিলাদের জন্য উল্লেখযোগ্যভাবে উচ্চ বেঁচে থাকার হার একটি আকর্ষণীয় পর্যবেক্ষণ।


এই বৈষম্যটি নির্দেশ করে যে টাইটানিক ট্র্যাজেডির সময় বেঁচে থাকার সম্ভাবনা নির্ধারণে লিঙ্গ একটি গুরুত্বপূর্ণ ভূমিকা পালন করেছিল।

টাইটানিকের যাত্রী বয়সের বন্টন কি? কোন উল্লেখযোগ্য নিদর্শন আছে?

 # Plot the distribution of passenger ages sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.histplot(data=df, x='Age', bins=20, kde=True) plt.xlabel('Age') plt.ylabel('Count') plt.title('Distribution of Passenger Ages') plt.show() 

যাত্রী বয়স বন্টন

KDE প্লট সহ হিস্টোগ্রাম টাইটানিকের যাত্রীদের বয়সের বন্টন চিত্রিত করে। ডেটা বাম-তরঙ্গিত বিতরণ দেখায়, যা নির্দেশ করে যে যাত্রীদের মধ্যে বয়স্ক প্রাপ্তবয়স্ক বা শিশুদের তুলনায় বেশি তরুণ প্রাপ্তবয়স্ক, বিশেষ করে 18 থেকে 35 বছর বয়সের মধ্যে ছিল।


যাত্রী বয়সের বন্টন বিশ্লেষণ করতে, আমরা KDE (কার্নেল ডেনসিটি এস্টিমেশন) প্লট সহ একটি হিস্টোগ্রাম ব্যবহার করেছি। x-অক্ষ বিভিন্ন বয়সের ব্যবধানের (বিন) প্রতিনিধিত্ব করে, যখন y-অক্ষ প্রতিটি বয়সের মধ্যে পড়া যাত্রীদের সংখ্যা প্রদর্শন করে। এই পদ্ধতিতে ডেটা ভিজ্যুয়ালাইজ করে, আমরা টাইটানিকের বয়স বন্টনের তির্যক প্রকৃতি বুঝতে সক্ষম হয়েছি, যা যাত্রীদের মধ্যে তরুণ প্রাপ্তবয়স্কদের ব্যাপকতা তুলে ধরে।


বিভিন্ন যাত্রী শ্রেণীর (1ম, 2য়, 3য়) যাত্রীদের বেঁচে থাকার হার আলাদা ছিল?

 # Calculate the survival rates by passenger class survival_by_class = df.groupby('Pclass')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by passenger class sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.barplot(x=survival_by_class.index, y=survival_by_class.values) plt.xlabel('Passenger Class') plt.ylabel('Survival Rate') plt.title('Survival Rate by Passenger Class') plt.show() 

যাত্রী শ্রেণীর দ্বারা বেঁচে থাকার হার

বার প্লট টাইটানিক ডেটাসেটে যাত্রীদের জন্য যাত্রী শ্রেণীর উপর ভিত্তি করে বেঁচে থাকার হারগুলি প্রদর্শন করে। প্লট থেকে এটা স্পষ্ট যে যাত্রী শ্রেণী যত বেশি, বেঁচে থাকার হার তত বেশি। এই পর্যবেক্ষণটি ঐতিহাসিক বোঝার সাথে সারিবদ্ধ করে যে উচ্চ শ্রেণীর (1ম শ্রেণী) যাত্রীদের লাইফবোট এবং সুরক্ষা ব্যবস্থাগুলিতে আরও ভাল অ্যাক্সেস ছিল, যা সম্ভবত তাদের বেঁচে থাকার উচ্চ সম্ভাবনাগুলিতে অবদান রেখেছিল। বিপরীতে, নিম্ন শ্রেণীর (৩য় শ্রেণী) যাত্রীরা উচ্ছেদ প্রক্রিয়া চলাকালীন আরও চ্যালেঞ্জের সম্মুখীন হয়, যা সম্ভাব্যভাবে সেই গোষ্ঠীর জন্য কম বেঁচে থাকার হারের দিকে পরিচালিত করে।


যাত্রী শ্রেণীর উপর ভিত্তি করে বেঁচে থাকার হার বিশ্লেষণ করতে, আমরা একটি বার প্লট তৈরি করেছি। প্রতিটি বার প্রতিটি শ্রেণীর (1ম, 2য় বা 3য় শ্রেণী) জন্য বেঁচে থাকা যাত্রীদের শতাংশের প্রতিনিধিত্ব করে। প্লটটি চাক্ষুষভাবে পরীক্ষা করে, আমরা বিভিন্ন যাত্রী শ্রেণীর মধ্যে বেঁচে থাকার হারে কোনো বৈষম্য সনাক্ত করতে সক্ষম হয়েছি। বারের উচ্চতা বেঁচে থাকার হার নির্দেশ করে, উচ্চ বার নির্দিষ্ট যাত্রী শ্রেণীর জন্য বেঁচে থাকার উচ্চ শতাংশ নির্দেশ করে।

বিভিন্ন বয়সের (যেমন, শিশু, প্রাপ্তবয়স্ক, বয়স্ক) মধ্যে বেঁচে থাকার হার কত?

 # Create age groups age_bins = [0, 12, 18, 30, 50, 100] # Define the age group boundaries age_labels = ['Child', 'Teenager', 'Young Adult', 'Adult', 'Elderly'] # Define the age group labels df['AgeGroup'] = pd.cut(df['Age'], bins=age_bins, labels=age_labels, right=False) # Calculate the survival rates by age group survival_by_age_group = df.groupby('AgeGroup')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by age group sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.barplot(x=survival_by_age_group.index, y=survival_by_age_group.values) plt.xlabel('Age Group') plt.ylabel('Survival Rate') plt.title('Survival Rate by Age Group') plt.show() 

বয়সের ভিত্তিতে বেঁচে থাকার হার

বার প্লটটি টাইটানিক ডেটাসেটে যাত্রীদের মধ্যে বিভিন্ন বয়সের জন্য বেঁচে থাকার হারকে চিত্রিত করে। এটি প্রকাশ করে যে নির্দিষ্ট বয়সের গোষ্ঠী, যেমন শিশু, প্রাপ্তবয়স্ক এবং বয়স্কদের দুর্যোগের সময় বেঁচে থাকার সম্ভাবনা বেশি ছিল। এই পর্যবেক্ষণটি ইঙ্গিত দেয় যে স্থানান্তর প্রক্রিয়া চলাকালীন এই দুর্বল বয়সের গোষ্ঠীগুলিকে অগ্রাধিকার দেওয়া হয়েছিল, যার ফলে তাদের বেঁচে থাকার হার বেশি হয়েছিল।


বয়সের ভিত্তিতে বেঁচে থাকার হার বিশ্লেষণ করতে, আমরা একটি বার প্লট তৈরি করেছি। প্রতিটি বার একটি নির্দিষ্ট বয়সের মধ্যে বেঁচে থাকা শতাংশের প্রতিনিধিত্ব করে। প্লটটি পরীক্ষা করে, আমরা বিভিন্ন বয়সের মধ্যে বেঁচে থাকার হারের তারতম্যগুলি পর্যবেক্ষণ করতে সক্ষম হয়েছি। এটি আমাদের অনুমান করার অনুমতি দেয় যে শিশু, প্রাপ্তবয়স্ক এবং বয়স্কদের মতো নির্দিষ্ট বয়সের গোষ্ঠীগুলি অগ্রাধিকার পেয়েছে এবং দুঃখজনক ঘটনার সময় বেঁচে থাকার আরও ভাল সম্ভাবনা ছিল। এখানে নিযুক্ত পদ্ধতিটি বেঁচে থাকার ফলাফলের উপর বয়সের প্রভাব সম্পর্কে মূল্যবান অন্তর্দৃষ্টি প্রদান করে, যা দুর্যোগের সময় সবচেয়ে ঝুঁকিপূর্ণ যাত্রীদের রক্ষা করার জন্য মানবিক প্রচেষ্টাকে প্রতিফলিত করে।

যাত্রার বন্দর কি বেঁচে থাকার সম্ভাবনাকে প্রভাবিত করেছিল?

 # Calculate the survival rates by port of embarkation survival_by_embarkation = df.groupby('Embarked')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by port of embarkation sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.barplot(x=survival_by_embarkation.index, y=survival_by_embarkation.values) plt.xlabel('Port of Embarkation') plt.ylabel('Survival Rate') plt.title('Survival Rate by Port of Embarkation') plt.show() 

যাত্রার বন্দর দ্বারা বেঁচে থাকার হার

বার প্লটটি টাইটানিক ডেটাসেটে যাত্রীদের জন্য যাত্রার বন্দরের উপর ভিত্তি করে বেঁচে থাকার হার প্রদর্শন করে। প্লটটি বিশ্লেষণ করে, আমরা স্পষ্টভাবে লক্ষ্য করতে পারি যে সর্বোচ্চ বেঁচে থাকার হার চেরবার্গ থেকে যাত্রা করা যাত্রীদের সাথে সম্পর্কিত, যেখানে সর্বনিম্ন বেঁচে থাকার হার সাউদাম্পটন থেকে যারা যাত্রা করেছিল তাদের সাথে যুক্ত।


এই ভিজ্যুয়ালাইজেশনটি বন্দরের বন্দরের উপর ভিত্তি করে বেঁচে থাকার হারের তারতম্য সম্পর্কে মূল্যবান অন্তর্দৃষ্টি প্রদান করে, সম্ভাব্য কারণগুলির পরামর্শ দেয় যা যাত্রীদের বেঁচে থাকার সম্ভাবনাকে প্রভাবিত করতে পারে।


বন্দরের উপর ভিত্তি করে বেঁচে থাকার হার বিশ্লেষণ করতে, আমরা একটি বার প্লট তৈরি করেছি। প্রতিটি বার যাত্রার প্রতিটি বন্দরের (চেরবার্গ, কুইন্সটাউন, সাউদাম্পটন) জন্য বেঁচে থাকা শতাংশের প্রতিনিধিত্ব করে। প্লটটি চাক্ষুষভাবে পরীক্ষা করে, আমরা বিভিন্ন যাত্রা বিন্দুর মধ্যে বেঁচে থাকার হারে উল্লেখযোগ্য পার্থক্য সনাক্ত করতে সক্ষম হয়েছি।

বেশি ভাড়ার যাত্রীদের কি বেঁচে থাকার ভালো সুযোগ ছিল?

 # Create fare groups fare_bins = [0, 50, 100, 150, 200, 300, 1000] # Define the fare group boundaries fare_labels = ['0-50', '50-100', '100-150', '150-200', '200-300', '300+'] # Define the fare group labels df['FareGroup'] = pd.cut(df['Fare'], bins=fare_bins, labels=fare_labels, right=False) # Calculate the survival rates by fare group survival_by_fare_group = df.groupby('FareGroup')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by fare group sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.barplot(x=survival_by_fare_group.index, y=survival_by_fare_group.values) plt.xlabel('Fare Group') plt.ylabel('Survival Rate') plt.title('Survival Rate by Fare Group') plt.show() 

ভাড়া দ্বারা বেঁচে থাকার হার

গ্রাফটি দেখায় যে সর্বোচ্চ ভাড়ার গ্রুপে (300+) যাত্রীদের বেঁচে থাকার হার সবচেয়ে বেশি ছিল, তারপরে দ্বিতীয় সর্বোচ্চ ভাড়ার গ্রুপ (200-300)। বিপরীতভাবে, ভাড়া গ্রুপ কমে যাওয়ায় বেঁচে থাকার হার কমে গেছে, সর্বনিম্ন ভাড়া গ্রুপের যাত্রীদের জন্য সর্বনিম্ন বেঁচে থাকার হার (0-50)।


এই বিশ্লেষণটি পরামর্শ দেয় যে প্রদত্ত ভাড়া টাইটানিকের বেঁচে থাকার সম্ভাবনা নির্ধারণে একটি গুরুত্বপূর্ণ ভূমিকা পালন করেছিল। যে সমস্ত যাত্রীরা উচ্চ ভাড়া প্রদান করে তাদের প্রথম শ্রেণীতে থাকার সম্ভাবনা বেশি ছিল, যার সামগ্রিকভাবে বেঁচে থাকার হার বেশি ছিল।


অতিরিক্তভাবে, এই উচ্চ অর্থ প্রদানকারী যাত্রীদের উদ্ধার প্রচেষ্টার সময় অগ্রাধিকার দেওয়া হতে পারে, যা তাদের বেঁচে থাকার উচ্চ হারে অবদান রেখেছিল৷ ভাড়া গোষ্ঠী এবং বেঁচে থাকার হারের মধ্যে সম্পর্ক বিশ্লেষণ করার জন্য, আমরা প্রতিটি ভাড়া গোষ্ঠীর জন্য বেঁচে থাকার শতাংশগুলি প্রদর্শন করে একটি বার প্লট তৈরি করেছি৷ গ্রাফটি আমাদের ভাড়া গোষ্ঠীর উপর ভিত্তি করে বেঁচে থাকার হারের প্রবণতা পর্যবেক্ষণ করার অনুমতি দিয়েছে, এটি প্রকাশ করে যে উচ্চ ভাড়া উচ্চ বেঁচে থাকার হারের সাথে যুক্ত।

যাত্রী কেবিন অবস্থানের বন্টন কি? নির্দিষ্ট কেবিনে যাত্রীদের বেঁচে থাকার হার বেশি ছিল?

 # Extract the cabin deck from the Cabin column df['CabinDeck'] = df['Cabin'].str.extract(r'([A-Za-z])') # Plot the distribution of passenger cabin locations sns.set(style='darkgrid') plt.figure(figsize=(10, 6)) sns.countplot(data=df, x='CabinDeck', order=sorted(df['CabinDeck'].dropna().unique())) plt.xlabel('Cabin Deck') plt.ylabel('Count') plt.title('Distribution of Passenger Cabin Locations') plt.show() # Calculate the survival rates by cabin deck survival_by_cabin_deck = df.groupby('CabinDeck')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by cabin deck sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.barplot(x=survival_by_cabin_deck.index, y=survival_by_cabin_deck.values) plt.xlabel('Cabin Deck') plt.ylabel('Survival Rate') plt.title('Survival Rate by Cabin Deck') plt.show() 

যাত্রী কেবিন অবস্থান বিতরণ

কেবিন ডেক দ্বারা বেঁচে থাকার হার

কেবিন ডেকের স্তর কমে যাওয়ায় গ্রাফটি স্পষ্টভাবে বেঁচে থাকার হারের হ্রাসের প্রবণতা প্রদর্শন করে, যেখানে A ডেকের যাত্রীদের জন্য সর্বনিম্ন বেঁচে থাকার হার পরিলক্ষিত হয়।


এই বিশ্লেষণটি পরামর্শ দেয় যে যাত্রীদের কেবিনের অবস্থান প্রকৃতপক্ষে টাইটানিকের তাদের বেঁচে থাকার সম্ভাবনার একটি গুরুত্বপূর্ণ কারণ ছিল। উচ্চতর ডেকের যাত্রীদের লাইফবোটে আরও ভাল অ্যাক্সেস থাকার সম্ভাবনা ছিল এবং আরও সহজে উদ্ধার করা হয়েছিল।


উপরন্তু, উদ্ধার অভিযানের সময় তাদের অগ্রাধিকার দেওয়া হতে পারে, তাদের বেঁচে থাকার উচ্চ হারে অবদান রাখা হয়েছে। কেবিন ডেকের স্তর এবং বেঁচে থাকার হারের মধ্যে সম্পর্ক বিশ্লেষণ করতে, আমরা প্রতিটি ডেকের জন্য বেঁচে থাকার শতাংশ প্রদর্শন করে একটি বার প্লট তৈরি করেছি। গ্রাফ পরীক্ষা করে, আমরা কেবিন ডেকের স্তরের উপর ভিত্তি করে বেঁচে থাকার হারের প্রবণতা সনাক্ত করতে পারি।

বয়স এবং লিঙ্গ অনুসারে বেঁচে থাকার হার

 # Create age groups age_bins = [0, 12, 18, 30, 50, 100] # Define the age group boundaries age_labels = ['Child', 'Teenager', 'Young Adult', 'Adult', 'Elderly'] # Define the age group labels df['AgeGroup'] = pd.cut(df['Age'], bins=age_bins, labels=age_labels, right=False) # Calculate the survival rates by age group and gender survival_by_age_gender = df.groupby(['AgeGroup', 'Sex'])['Survived'].mean() * 100 # Convert the survival rates into a pivot table for easier visualization survival_pivot = survival_by_age_gender.unstack() # Create a heatmap to visualize the survival rates by age group and gender sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.heatmap(data=survival_pivot, annot=True, cmap='coolwarm', fmt=".2f", cbar=True) plt.xlabel('Gender') plt.ylabel('Age Group') plt.title('Survival Rate by Age Group and Gender') plt.show() 

বয়স এবং লিঙ্গ দ্বারা বেঁচে থাকার হার

হিটম্যাপটি টাইটানিক ডেটাসেটে যাত্রীদের মধ্যে বিভিন্ন বয়সের গোষ্ঠী এবং লিঙ্গের বেঁচে থাকার হারের একটি দৃশ্যমান উপস্থাপনা প্রদান করে। হিটম্যাপ বিশ্লেষণ করে, আমরা বয়স এবং লিঙ্গের উপর ভিত্তি করে বেঁচে থাকার হারের নিদর্শন এবং প্রবণতাগুলি পর্যবেক্ষণ করতে পারি, যা আমাদের সনাক্ত করতে দেয় যে কোন বয়স এবং লিঙ্গ গোষ্ঠীর দুর্যোগের সময় বেঁচে থাকার সম্ভাবনা বেশি বা কম ছিল। হিটম্যাপে রঙের তীব্রতা একটি পরিষ্কার সূচক হিসাবে কাজ করে, গাঢ় রং উচ্চতর বেঁচে থাকার হার এবং হালকা রং কম বেঁচে থাকার হার নির্দেশ করে।


হিটম্যাপ থেকে, আমরা বেশ কিছু অন্তর্দৃষ্টি আঁকতে পারি। বয়স্ক মহিলা যাত্রীদের বেঁচে থাকার সম্ভাবনা সবচেয়ে বেশি ছিল, যখন বয়স্ক পুরুষ যাত্রীদের বেঁচে থাকার সম্ভাবনা সবচেয়ে কম ছিল। অতিরিক্তভাবে, হিটম্যাপটি প্রকাশ করে যে, সাধারণভাবে, মহিলাদের সমস্ত বয়সের শ্রেণীতে বেঁচে থাকার সম্ভাবনা বেশি ছিল। এই পর্যবেক্ষণগুলি এই ঐতিহাসিক ট্র্যাজেডির সময় যাত্রীদের বেঁচে থাকার ফলাফল নির্ধারণে বয়স এবং লিঙ্গের উল্লেখযোগ্য প্রভাবের উপর আলোকপাত করে।


বয়স এবং লিঙ্গের উপর ভিত্তি করে বেঁচে থাকার হার কল্পনা করতে, আমরা একটি হিটম্যাপ ব্যবহার করেছি। হিটম্যাপের প্রতিটি কোষ একটি নির্দিষ্ট বয়স এবং লিঙ্গ সমন্বয়ের জন্য বেঁচে থাকার হার (শতাংশ) উপস্থাপন করে। হিটম্যাপে রঙের তীব্রতা পরীক্ষা করে, আমরা বিভিন্ন বয়স এবং লিঙ্গ গোষ্ঠীর মধ্যে বেঁচে থাকার হারের পার্থক্য বুঝতে সক্ষম হয়েছি।

পরিবারের আকার অনুযায়ী বেঁচে থাকার হার

 # Calculate the total number of family members for each passenger df['FamilySize'] = df['SibSp'] + df['Parch'] + 1 # Calculate the survival rates by family size survival_by_family_size = df.groupby('FamilySize')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by family size sns.set(style='darkgrid') plt.figure(figsize=(10, 6)) sns.barplot(x=survival_by_family_size.index, y=survival_by_family_size.values) plt.xlabel('Family Size') plt.ylabel('Survival Rate') plt.title('Survival Rate by Family Size') plt.show() 

পরিবারের আকার দ্বারা বেঁচে থাকার হার

গ্রাফটি দেখায় যে বড় পরিবারের আকারের যাত্রীদের টাইটানিক ডুবে যাওয়ার সম্ভাবনা বেশি ছিল। পরিবারের সদস্য সংখ্যা বৃদ্ধির সাথে সাথে 1 থেকে 4 পর্যন্ত পরিবারের আকারের যাত্রীদের বেঁচে থাকার হার বেড়েছে।


এই অন্তর্দৃষ্টিটি তাৎপর্যপূর্ণ কারণ এটি টাইটানিকের উপর বেঁচে থাকার অন্যতম শক্তিশালী ভবিষ্যদ্বাণী হিসাবে পরিবারের আকারকে হাইলাইট করে। বৃহত্তর পরিবারের আকারের যাত্রীরা সম্ভবত একসাথে ভ্রমণ করছিল, তাদের উদ্ধার প্রচেষ্টার জন্য অগ্রাধিকার দিয়েছিল।


উপরন্তু, পরিবারের আরও সদস্য থাকার ফলে পারস্পরিক সহায়তার সুবিধা হতে পারে, যেমন খাদ্য এবং জলের মতো সংস্থানগুলি ভাগ করে নেওয়া, যা তাদের বেঁচে থাকার উচ্চ সম্ভাবনাগুলিতে অবদান রাখতে পারে।


পরিবারের আকার এবং বেঁচে থাকার হারের মধ্যে সম্পর্ক বিশ্লেষণ করতে, আমরা প্রতিটি পরিবারের আকার বিভাগের জন্য বেঁচে থাকার শতাংশ প্রদর্শন করে একটি বার প্লট তৈরি করেছি। গ্রাফটি চাক্ষুষভাবে পরীক্ষা করে, আমরা সনাক্ত করতে পারি কিভাবে পরিবারের আকার যাত্রীদের বেঁচে থাকার ফলাফলকে প্রভাবিত করে।

পোস্ট এমবার্কমেন্ট এবং প্যাসেঞ্জার ক্লাস দ্বারা বেঁচে থাকার হার

 # Calculate the survival rates by port of embarkation and passenger class survival_by_embark_class = df.groupby(['Embarked', 'Pclass'])['Survived'].mean() * 100 # Convert the survival rates into a pivot table for easier visualization survival_pivot = survival_by_embark_class.unstack() # Create a heatmap to visualize the survival rates sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.heatmap(data=survival_pivot, annot=True, cmap='coolwarm', fmt=".2f", cbar=True) plt.xlabel('Passenger Class') plt.ylabel('Port of Embarkation') plt.title('Survival Rate by Port of Embarkation and Passenger Class') plt.show() 

বন্দর এবং এমবার্কমেন্ট দ্বারা বেঁচে থাকার হার

গ্রাফটি বন্দর এবং যাত্রী শ্রেণীর উপর ভিত্তি করে বেঁচে থাকার হার সম্পর্কিত বেশ কয়েকটি গুরুত্বপূর্ণ নিদর্শন প্রকাশ করে। কুইন্সটাউন বা সাউদাম্পটনের তুলনায় চেরবার্গ থেকে যাত্রা করা যাত্রীদের বেঁচে থাকার হার বেশি ছিল।


এটি সম্ভবত Cherbourg কলের প্রথম বন্দর এবং সেখানে আরো প্রথম শ্রেণীর যাত্রীদের যাত্রার সম্ভাবনার কারণে। উপরন্তু, একটি ফরাসি বন্দর হিসাবে, ফরাসি যাত্রীদের বাঁচানোর প্রতি পক্ষপাতিত্ব থাকতে পারে।


উপরন্তু, গ্রাফটি নির্দেশ করে যে প্রথম শ্রেণীর যাত্রীদের বেঁচে থাকার হার দ্বিতীয় বা তৃতীয় শ্রেণীর তুলনায় বেশি ছিল। এটিকে দায়ী করা যেতে পারে প্রথম শ্রেণীর যাত্রীদের উদ্ধারের জন্য অগ্রাধিকার হিসাবে দেখা হচ্ছে এবং তাদের উচ্চ সামাজিক মর্যাদা এবং জীবন রক্ষার ব্যবস্থা গ্রহণের সম্ভাব্য ক্ষমতার কারণে লাইফবোটে আরও ভাল অ্যাক্সেস রয়েছে।


পরিশেষে, সমস্ত বন্দর জুড়ে একটি উল্লেখযোগ্য প্রবণতা হল যাত্রী শ্রেণী হ্রাসের সাথে সাথে বেঁচে থাকার হার হ্রাস। এটি পরামর্শ দেয় যে যাত্রী শ্রেণীটি টাইটানিকের বেঁচে থাকার একটি উল্লেখযোগ্য নির্ধারক ছিল, প্রথম শ্রেণীর যাত্রীদের বেঁচে থাকার সর্বোচ্চ সম্ভাবনা রয়েছে৷ বন্দর অবতরণ, যাত্রী শ্রেণী এবং বেঁচে থাকার হারের মধ্যে সম্পর্ক বিশ্লেষণ করতে, আমরা একটি হিটম্যাপ তৈরি করেছি৷ হিটম্যাপ পোর্ট অফ এমবার্কেশন এবং যাত্রী শ্রেণীর বিভিন্ন সমন্বয়ের জন্য বেঁচে থাকার হার শতাংশ উপস্থাপন করে। হিটম্যাপ পরীক্ষা করে, আমরা এই দুটি কারণের উপর ভিত্তি করে বেঁচে থাকার হারের নিদর্শন এবং প্রবণতা সনাক্ত করতে সক্ষম হয়েছি।