삼성SDS 브라이틱스 서포터즈[Brightics studio] 노코드 AI 오픈소스 브라이틱스로, 광고 클릭 여부 예측하기 (마무리 ⑥)

안녕하세요! 벌써 프로젝트가
여섯번째 단계에 도착 했어요.
오늘은 광고 클릭 여부 예측의
마무리 과정을 밟아보려 합니다.
그동안 어떻게 분석을 진행했는지,
또 좋았던 점과 아쉬웠던 점을 생각해보며
포스팅을 갈무리 해보도록 할게요!
광고 클릭 여부 예측 프로젝트를 수행하기
위해서 총 다섯번의 포스팅을 진행했어요.
① 분석 개요
② 탐색적 데이터 분석ⅰ & 이상치 처리
③ 탐색적 데이터 분석ⅱ워드크라우드
④ 모델링ⅰ
⑤ 모델링ⅱ&평가
① 분석 개요
분석 개요 부분에서는 앞으로 어떤 식으로
분석을 진행할 것인지에 관해 다뤘어요.
분석 개요의 세부 항목은 아래와 같아요.
데이터 선정, 데이터 선정 배경,
분석 계획 짜기, 기대효과 작성
분석 개요를 어떻게 짜느냐에 따라서
프로젝트의 방향성이 되니,
프로젝트가 마무리 된 지금 시점에서
다시 한 번 개요 짜기의 중요성을 느껴요!
<분석 개요 바로가기>
https://blog.naver.com/yetenen896/222891887046
② 탐색적 데이터 분석ⅰ & 이상치 처리
다음으로는 EDA를 진행했어요.

다양한 형태의 그래프를 그려보며
변수의 특성을 파악했어요.

또 결측치와 이상치를 탐색해 데이터를
다듬어가는 과정을 거쳤습니다!
<EDA/이상치 처리 바로가기>
https://blog.naver.com/yetenen896/222897649518
③ 탐색적 데이터 분석ⅱ워드크라우드
다음은 두 번째 EDA 과정을 거쳤는데요.
텍스트 데이터를 알아보기 위해
워드크라우드를 이용해보았습니다.

아래 포스팅에 브라이틱스 내에서
워드크라우드를 사용할 수 있는 방법이
정리되어 있으니 궁금하신 분들이 있다면
확인해보세요.
<EDA-워드크라우드 바로가기>
https://blog.naver.com/yetenen896/222903935793
④ 모델링ⅰ
첫 번째 모델링 과정에서는
라벨인코딩과, 스플릿 데이터, 변수 선택
기능을 사용하였답니다.
특히 라벨 인코딩과 관련해서
아쉬움이 조금 남는데요!
바로 contry와 city 변수는 범주가 많은 변수임에도
무리하게 몽땅 라벨 인코딩을 진행했다는 점입니다.
대신, 이를 보완할 수 있는 아이디어를 생각해보면
외부 데이터를 활용해 각 국가를 대륙으로 대체한 다음,
인코딩을 진행하는 방법이 있을 것 같네욥.
<모델링ⅰ바로가기>
https://blog.naver.com/yetenen896/222910350806
⑤ 모델링ⅱ&평가
두 번째 모델링 과정에서는
여러가지 모델을 사용하며 클릭 여부
예측 모델을 만들어보았답니다.

또한 평과 과정을 진행하며
각 모델의 정확도를 파악하였어요.

짠 이렇게 전체 프로젝트
결과 정리를 해보았습니다!
마무리 포스팅을 진행할수록
막바지에 다다랐다는 게 느껴지네요.
ㅠ ㅠ
그럼 다음주에 다시 찾아올게요!
본 포스팅은 삼성SDS Brightics 서포터즈 3기 활동의 일환으로 작성하였습니다