블로그코리아에서 태그의 카테고리를 분류하는 방법

소셜 미디어 2008.11.06 23:36
블로그코리아는 수집되는 포스트를 '태그'를 기반으로 13개의 카테고리로 자동분류하고 있습니다.

하지만 카테고리가 분류되지 않은 글을 모아 둔 '미분류' 카테고리를 별도로 만들어 두고, 사용자들이 각 글의 카테고리를 분류할 수 있도록 만들어 놓았습니다. (물론 자신의 글에 대한 카테고리 분류는 마이페이지에서 할 수 있습니다.)

처음 만들때는 거의 내부 직원들만 이용하던 메뉴였지만, 최근에는 이용자들의 참여가 부쩍 늘어났습니다. 특히 몇 몇 분들은 블코에서 월급을 드려야하는 게 아닌가 싶을 정도로 열심히 참여하고 계셔서 너무 감사한 마음입니다. 보답이래야 블업 포인트 5점 충전해 드리는 게 전부지만요..

오늘은 그래서 미분류 카테고리 분류에 참여하고 계신 분들에게 한 가지 팁을 드리고자 합니다. 이왕이면 좀 더 효율적으로 하는 게 좋지 않을까 싶어서요^^;;

먼저 본격적인 내용에 앞서 블코의 카테고리 자동분류 로직을 잠깐(최대한 간단하게) 설명드리겠습니다.(제대로 설명할 수 있을지는 모르겠지만..)

우선 카테고리 분류는 태그사전을 바탕으로 합니다. 태그사전이란 카테고리별로 분류된 태그DB를 말합니다.
하나의 글이 수집되면 그 글에 입력된 태그를 태그사전과 비교해 가장 가중치가 높은 카테고리로 해당 글이 분류됩니다.

예) 블로그코리아(IT/게임), 태그(IT/게임), 장난(라이프/스타일) 이라는 3개의 태그가 입력돼 있다면 그 글은 IT/게임으로 분류됩니다.

물론 실제로는 이것보다 훨씬 다양한 케이스가 존재하기 때문에 태그 가중치 점수도 있고 해서 실제 시스템은 훨씬 복잡합니다.

어쨌든, 태그사전에 등재돼 있는 태그가 하나라도 입력돼 있다면, 그 글은 카테고리로 분류될 가능성이 99%에 가깝습니다.

태그를 입력했는데도 카테고리가 분류돼 있지 않다면 그 이유는
1. 입력한 태그 중 하나도 태그사전에 등재돼 있지 않은 경우
2. 포스트에는 태그를 입력했으나 RSS에 태그가 포함돼 있지 않은 경우
3. 1%정도의 확률이긴 하지만 태그 가중치가 두 개 이상의 카테고리에서 동점일 경우
4. 사용자가 의도적으로 자신의 글을 미분류 카테고리로 옮겨 놓은 경우
중의 하나입니다.

태그사전 역시 실시간으로 자동 업데이트됩니다.
태그사전에 없는 태그가 자동으로 태그사전에 등재되는 로직을 간단히 설명드리면,
T타임동안 동일한 태그가 N개 이상의 블로그에서 M회 이상 반복될 경우 해당 태그는 태그사전에 등록되며,
새로운 태그가 태그사전에 입력되면 태그사전은 해당 태그가 입력된 기존 포스트들의 카테고리 분포를 계산하여 새로운 태그의 카테고리를 지정하게 됩니다.

기계가 행한 이러한 시스템은 오류가능성을 늘 갖고 있기 때문에 운영자는 태그사전을 늘 모니터링하면서 카테고리 분류율을 높이고자 하고 있습니다.

서론이 매우 길어졌는데요..

본론으로 들어가서, 오늘의 팁이란, 블로그코리아의 미분류 카테고리에서 글을 분류할 때 태그사전 입력을 동시에 하는 방법을 말씀드리고 합니다.

예제로 오늘 미분류 카테고리에 있던 꼬날님의 글을 모셔왔습니다.
보시면 아시겠지만 꼬날님은 '블로터닷넷 이희욱 기자님', '엔써미' 등의 태그를 입력하고 포스트를 발행했지만, 이 태그들은 블코의 태그사전에 없는 단어이므로 카테고리가 분류되지 않았습니다.

사용자 삽입 이미지
일단 요기(↑)를 클릭하여 '미분류'로 돼 있는 것을 'IT/게임'으로 분류하고 '저장'을 클릭합니다.


사용자 삽입 이미지

일단 이 글의 카테고리는 분류하였습니다.
이제 이후에 이와 같은 태그를 가진 글이 자동으로 IT/게임으로 분류되도록 하려면 태그까지 입력해 주어야 합니다.

사용자 삽입 이미지

꼬날님이 입력한 태그중에 '엔써미'를 태그로 입력합니다.
이 때 왼 쪽의 카테고리가 IT/게임으로 이미 분류돼 있을 경우 '엔써미' 태그는 태그사전 등재 프로세스와 관계 없이 'IT/게임'태그사전에 입력됩니다.
따라서 이 다음에 수집되는 글의 경우 '엔써미'가 태그에 있을 경우 자동으로 IT/게임 카테고리로 분류될 것입니다.

사용자 삽입 이미지

솔직히 이러한 방식은 좀 복잡합니다. 쉽게 즐기면서 참여하고, 즐기는 과정에서 태그사전이 충실해 질 수 있는 태그게임의 개발은 계속 지연되고 있습니다만, 지금도 카테고리 분류에 열심히 참여하고 계신 분들을 위해서 조금이라도 참고하시라고 올려 보았습니다.

관련글:
블로그코리아 미분류를 이용하여 블UP 포인트 받기(벌새)
네이버 블로그의 주제분류와 블코 카테고리 연동(필로스)

블로거를 최대한 귀찮게 만드는 서비스
(easysun)
블로그에 태그(tag)를 다는 이유(필로스)

Trackbacks 2 : Comments 13
  1. Favicon of http://kkonal.com 꼬날 2008.11.07 00:07 Modify/Delete Reply

    오호~ 이사님, 좋은글에 저를 예제로 삼아 주셔서 감사합니다. ㅎㅎㅎ
    앞으로는 참고하여 블업 포인트 쌓도록 할게요.
    ^^;; 건강은 괜찮으시죠?

    • Favicon of http://philomedia.tistory.com 필로스 2008.11.10 21:25 Modify/Delete

      예제로 삼을 만만한? 글이 없어서요^^
      놀러오신다는 얘기는 들었습니다.
      놀러오지 말고 그냥 확 와버리시면 안될까요 ㅎ

  2. Favicon of https://hummingbird.tistory.com 벌새 2008.11.07 00:09 신고 Modify/Delete Reply

    잘 읽었습니다.^^

  3. Favicon of http://kyungseo.pe.kr/blog Mr.朴 2008.11.07 09:40 Modify/Delete Reply

    카테고리를 직접 분류할 수 있다는 것을 처음 알았습니다. ^^
    좋은 하루 되세욥~! :)

  4. Favicon of http://www.raytopia.net 레이 2008.11.07 10:21 Modify/Delete Reply

    가끔은 카테고리 찾는 것도 어렵더라고요. 그냥 카테고리 지정 없이 죽죽 써 내는 것도 괜찮을 듯 싶어요~ (이 글과 직접적인 연관이 있는 댓글인지는 판단이 잘 안서나! 어쨌든!) ㅋㅋ

    • Favicon of http://philomedia.tistory.com 필로스 2008.11.10 21:26 Modify/Delete

      사실 좀 그렇죠... 내 글이 꼭 카테고리로 분류돼야 하나 하는 생각도 듭니다.
      그냥 마음가는 대로 쓰면 그만인 것을...

    • 필로스 2008.11.14 18:34 Modify/Delete

      레이님아 토씨에서도 댓글 좀 달수있게 해주삼..

  5. Favicon of http://blog.naver.com/yang456 RAISON 2008.11.07 12:19 Modify/Delete Reply

    그런데, 카테고리 자체도 조금 더 세분화해야 하지 않을까도 싶습니다.
    제가 쓰는 포스트들은 대부분 라이프/스타일 쪽으로 분류해서 넣고는 있지만 아무래도 그쪽과는 딱 맞아 떨어지질 않는 부분이 더 많거든요.

    • Favicon of http://philomedia.tistory.com 필로스 2008.11.10 21:28 Modify/Delete

      좋고 나쁨을 떠나서, 현재는 카테고리를 세분화할 생각은 없습니다. 블코에서 카테고리는 보완재의 개념이 강하고요, 저희들은 태그 중심의 서비스를 만들고 싶은 욕망이 강해서요...(물론 아직 먼 얘기이긴 합니다만)

  6. Favicon of https://diarix.tistory.com 외계인 마틴 2008.11.09 05:52 신고 Modify/Delete Reply

    뢰종님 말씀처럼.. 세분화가 되었으면 좋겠네요.
    물론 비교하지는 건 아니지만 블로거뉴스가 꽤 상세하게 나눠져 있습니다.
    가끔 글을 어디로 분류해야할지 난감한 경우도 있네요.^^

    • Favicon of http://philomedia.tistory.com 필로스 2008.11.10 21:32 Modify/Delete

      위에 뢰종님께 댓글단 것과 마찬가지로, 효용성을 떠나서 카테고리를 세분화할 생각은 아직 없습니다. 블로거뉴스처럼 자체 블로그툴을 소유하고 있는 회사는 사실 마음먹은 대로 할 수 있는 기반이 있지만, 메타블로그는 블로그 툴과 관계없이 서비스를 제공해야 한다는 한계가 있기 때문이기도 하고, 또 궁극적으로는 카테고리 형태의 콘텐츠 소비보다는 태그 기반의 진정한 폭소노미 시스템을 구현해 보고 싶은 욕망이 남아있기 때문이기도 합니다.
      그리고 카테고리는 어떻게 만들더라고 완벽하지 않을 수 있기 때문에 궁극적으로는 카테고리 없는 서비스로 발전해 나가기를 원합니다.
      물론 아직은 희망사항일 뿐입니다.

Write a comment