SMALL

2025/05/06 4

EDA - Titanic Dataset

EDA - Titanic Dataset Copyright(c) 2018-2021 Daniel Park All rights reserved.1912년 타이타닉 사고 데이터 EDA탐색적 데이터 분석 (EDA)를 통해 아래 목표를 달성해봅시다주어진 각 feature들의 분포 살펴보기, 생존자/사망자 별로 데이터 분리하여 살펴보기어떤 정보를 통해 생존율을 예측할 수 있을 지, 가설을 세우고 실제 그래프로 검증해봅시다. [ 데이터 설명 ]891명의 승객에 대한 데이터. 생존여부 / 좌석 등급 / 성별 / 나이 / 일행 / 자녀 / 운임 등의 feature # 라이브러리 임포트 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns..

Python 2025.05.06

Sentiment Analysis

IMDB 데이터를 이용하여 감성분석(sentiment analysis)을 다음과 같이 4가지 방법으로 수행하고 정확도 비교 1. Bag-of-words method: 텍스트를 TF-IDF를 이용하여 데이터로 전환한 뒤, logistic regression을 이용하여 감성분석을 수행2. Word embedding method: 텍스트를 word2vec을 이용하여 데이터로 전환한 뒤, 임베딩 벡터의 평균값을 이용하여 감성분석을 수행3. Neural network method: RNN 모형을 이용하여 감성분석을 수행 # 1. Environment Setup import pandas as pdimport numpy as npimport gensim as gsimport tensorflow_datasets as ..

Python 2025.05.06
LIST