-
[RecSys] 1. 추천시스템 Basic - 추천시스템이란인공지능/부스트캠프 Ai Tech 2022. 3. 10. 13:58728x90In [1]:
from IPython.core.display import display, HTML display(HTML("<style>.container { width:90% !important; }</style>"))
추천시스템이란¶
유저는 검색과 Query를 통해 원하는 아이템을 가져오게(Pull)된다.
이것과 다르게 추천시스템은 유저가 원하는 바를 검색하기전에 보여주게(Push) 된다.
추천 시스템은 유저도 잘 모르는 것들을 추천하게 된다.
추천시스템의 필요성¶
과거와는 달리 현대에는 다양한 상품과 컨텐츠가 너무 많고, 유저 스스로가 무엇을 원하는지 알지 못할 수도 있으며, 어떤 키워드로 검색해야 하는지 모를 수도 있다.
평소에 내가 원하는 추천시스템의 방향성이 이러한 것들이 였는데, 추천시스템의 필요성으로 언급되어서 강의를 들으면서 조금 놀랐다.
- Long-Tail Recommendation : 다양한 상품이 생김에 따라서, 인기있는 소수의 상품(Popular products)에 비해 인기가 상대적으로 적은 다수의 상품(Long Tail)이 많아졌다.
- Long-Tail Recommendation 사례 : 유튜브에서 조회수가 높지 않은 영상이지만 사용자가 좋아할 것 같은 영상을 추천해주는 경우(개인화), SNS의 수천은 수십억 명 유저들 가운데 내가 알만한 사람들을 추천
추천 시스템의 사용 데이터¶
- 유저 관련 정보 : 유저의 성별이나 나이와 같은 정보
- 아이템 관련 정보 : 아이템의 출시 년도나 카테고리와 같은 정보
- 유저-아이템 상호작용 정보 : 유저가 아이템에게 준 점수와 같은 정보
유저 관련 정보¶
- 유저 프로파일링 : 추천 대상 유저에 관련된 정보 구축하여 개별 유저 혹은 유저 그룹별로 추천, 이 데이터는 추천시스템이 아니여도 여러 서비스에 활용된다.
- 식별자(Identifier) : 유저 ID, 디바이스 ID
- 데모그래픽 정보 : 성별, 연령, 지역, 관심사, 유저로부터 직접 수집하는게 정확하지만 수집하기 어려운 경우는 추정하여 사용한다.
- 유저 행동 정보 : 페이지 방문 기록, 아이템 평가, 구매 등의 피드백 기록
아이템 관련 정보¶
- 추천 아이템의 종류 : 포탈(뉴스, 블로그 웹툰 등 컨텐츠), 광고/커머스(광고 소재, 상품 추천), 미디어(영화, 음악, 동영상 추천)
- 아이템 프로파일링(메타 데이터) : 아이템 ID , 아이템의 고유정보
- 영화 : 영화 장르, 출연 배우 및 감독 등
- 상품 : 상품 카테고리, 브랜드 등
- 음악 : 아티스트, 작곡가, 장르 등
컨텐츠 베이스 추천 시스템은 아이템 정보만을 활용해 추천을 해주기도 한다.
유저- 아이템 상호작용 정보¶
유저가 오프라인 혹은 온라인에서 아이템과 상호작용할 때 로그로 남는다.
- Explicit Feedback : 유저에게 아이템에 대한 만족도를 직접 물어본 경우
ex) 유저의 영화 평점
- Implicit Feedback : 유저가 아이템을 클릭하거나 구매한 경우, Explicit에 비해 압도적으로 많음
ex) 쿠팡에서 유저가 상품을 구매하면 Implicit Feedback = Y
추천 시스템의 목적¶
추천 시스템은 유저에게 적합한 아이템을 또는 아이템에게 적합한 유저를 추천해준다. 이 결과를 score 할 값은 무엇일까?
랭킹 : 유저에게 적합한 Top K개를 추천하는 문제¶
Top K개를 선정하기 위한 기준 혹은 스코어가 필요하지만, 유저(X)가 아이템(Y)에 가지는 정확한 선호도를 구할 필요는 없다.
- 평가 지표 : Precision@K , Recall@K, MAP@K, nDCG@K
예측 : 유저가 아이템을 가질 선호도를 정확하게 예측(평점 or 클릭/구매 확률)¶
- Explicit Feedback : 철수가 아이언맨에 대해 내릴 평점 값 예측
- Implicit Feedback : 영희가 아이폰 12를 조회하거나 구매할 확률 값을 예측 유저-아이템 행렬을 채우는 문제
- 평가 지표 : MAE, RMSE, AUC
'인공지능 > 부스트캠프 Ai Tech' 카테고리의 다른 글
[RecSys] 3-1. 추천 시스템 Basic - 추천 시스템 기법과 연관분석 (0) 2022.03.10 [RecSys] 2. 추천시스템 Basic - 평가지표와 인기도 기반 추천 (0) 2022.03.10 [Ai-Services] Docker (0) 2022.02.21 [Ai-Services] Linux (0) 2022.02.21 [DL Basics] 8. Sequential Models - Transformer (0) 2022.02.12