Rohdy
Rohdy의 study
Rohdy
전체 방문자
오늘
어제
  • 분류 전체보기 (32)
    • 석사 이야기 (0)
    • DL Study (17)
    • Pr4AI Study (1)
    • RecSys (3)
    • GraphMining (9)
    • 논문 (2)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 컨택
  • 정보대학원
  • IDGL
  • 대학원준비
  • 연세대
  • 대학원면접
  • ML
  • gnn
  • 대학원입시
  • 로지스틱
  • sigmoid
  • 대학원컨택
  • LinearRegression
  • 논문요약
  • logistic
  • 시그모이드
  • 2020
  • NeurIPS
  • GSDS
  • 대학원
  • KAIST
  • 데이터사이언스
  • gradientdescent

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Rohdy

Rohdy의 study

Collaborative Filtering Recommendation
RecSys

Collaborative Filtering Recommendation

2022. 9. 7. 16:20

KAIST GSDS 대학원 박찬영 교수님의 수업인 추천시스템 및 그래프 기계학습 수업을 필기입니다.

 

Collaborative Filtering(CF)

  • Approach
    • Use the "wisdom of the crowd" to recommend items
  • Basic assumption and idea
    • Users give ratings to items
    • Customers who had similar tastes in the past, will have similar tastes in the future(입맛 안변해)

[https://towardsdatascience.com/various-implementations-of-collaborative-filtering-100385c6dfe0]

 

Memory(Neighborhood) based - CF

  • Main idea
    • Similar users display similar patterns of rating behavior -> User-based CF
    • Similar items receive similar ratings -> Item-based CF
  • Input
    • Only a matrix of given user-item rating
  • Output types
    • A numerical prediction indicating to what degree(유저의 선호도 점수로)
    • A top-N list of recommended items
  • Representative methodology
    기본적으로 item-based CF가 더 연관성 있는 추천을 해준다. 왜냐하면 user의 rating을 이용하기 때문이다. 또한, item-based CF는 추천의 이유를 제공한다는 특징이 있다.
    • User-Based Collaborative Filtering: 특정 User를 기준으로 비슷한 다른 User의 선호도를 기반으로 Item을 추천
    • Item-Based Collaborative Filtering: 특정 Item을 기준으로 비슷한 Item을 추천
  • Pros
    • Requires miknimal knowledge (only rating/implicit feedback)
    • Produces good-enough results in most cases
  • Challenges
    • Sparsity / Cold-start problem: 충분한 users 확보와 새로운 user, item에 대해 취약(New user, item problem)
    • Scalability: item, users 수에 따라서 계산량이 증가하고 한 user가 item을 구매하면 다른 user나 item의 순위 영향
    • Diversity: 다양한 결과나 나오기 힘듬

 

Measuring user similarity

Implicit Feedback

  • Euclidean distance
    problem: euclidean distance favors small sets, even if the have few elements in common

  • Jaccard similarity
    problem: Jaccard similarity can only take care of binary relevance scores

  • Cosine similarity
    -1 ~ 1까지의 값을 따라서 선호, 비선호 추정가능 

Explicit Feedback

  • Pearson correlation
    Different users may provide ratings on different scales
    -> Subtract the average(평균에서 얼마나 차이나는지를 확인함, 사용자 v와 u의 공통된 item이 많이 필요)

 

Making Predictions

A common prediction function

  • User-based CF

  • Item-based CF

 

참조: https://kmhana.tistory.com/31?category=882777

'RecSys' 카테고리의 다른 글

Content-Based Recommendation  (0) 2022.09.01
Introduction to Recommender System  (0) 2022.08.31
    'RecSys' 카테고리의 다른 글
    • Content-Based Recommendation
    • Introduction to Recommender System
    Rohdy
    Rohdy

    티스토리툴바