[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]

[Burichan] [Foliant] [Futaba] [Greenhell] [Gurochan] [Photon] - [Home] [Manage] [Archive]

[Return]
Posting mode: Reply
Leave these fields empty (spam trap):
Name
Link
Subject
Comment
File
Verification
Password (for post and file deletion)
  • Supported file types are: GIF, JPG, PDF, PNG
  • Maximum file size allowed is 20480 KB.
  • Images greater than 200x200 pixels will be thumbnailed.

File: 1525521015001.png -(124377 B, 600x175) Thumbnail displayed, click image for full size.
124377 No.152893  

Привет, вот я это, необразованный, но предположим, есть сайт, контент которого оценивается лайками и дизлайками. Почему не делают сортировку по некоему вероятностному параметру, который я сейчас объясню?
Скажем, у контента Х 200 лайков и 1 дизлайк, а у контента Y 400 лайков и 30 дизлайков.
Очевидно, что вероятность того, что случайное распределение породило 200:1 значитально выше, чем 400:30. Чем выше "невероятность" (измеряемая жесткой численной переменной), тем выше место в едином однообразном рейтинге. Так можно легко вскрыть контент, который в иной (обычной) сортировке неочевиден. Например, на pouet можно будет увидеть редкие вины с 36:0:0 или им подобные.
Почему не юзается такая сортировка, раз. Кто сделает такой скрипт для поуэта, два.

>> No.152894  
> значитально выше

пардон, значительно ниже, разумется. *краснеет*

>> No.152896  

>>152893
Слишком нетривиальный и ресурсоемкий алгоритм получится.

>> No.152899  

>>152896
Поделить одно число на другое, ахуау, вот это алгоритм. Где там мой биг дата форест неуралнет.

>> No.152900  

>>152896
Да нэээ. Простая комбинаторика. Можно с экстраполяцией, в принципе. Не восьмидесятые на дворе. Мы же не сотни тысяч лайков обрабатываем; на поуэте максимум - 787 лайков.

Если кто-то сделает web ui для такого алгоритма, и еще с возможностью поиска по временным интервалам (например, dec 2016 - may 2018), я смело оплачу хвостинг и домен.

>> No.152901  

Насчет собственно оп-поста.

> вероятность 200:1 значительно [ниже], чем 400:30

Это не так. Это было бы верно для 20 000:1 и 40 000:3000.
Если у чего-то 200 лайков, это может означать, что контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут.
Но вообще такой алгоритм есть и если видео, например, на ютубе быстро набирает популярность, его показывают в популярных.

>> No.152903  

>>152899
А вот и не поделить. Поделить-метрика уже есть, она не решает.

>> No.152906  

>>152901

> контент предназначался для узкой тематики, которую прошаренные гуглят, а незнающие даже не найдут.

Давай спишем этот аспект на "при прочих равных" для условий этой задачи.

>> No.152921  

https://habr.com/company/darudar/blog/143188/ уже предлагали?

>> No.152930  
File: 1525543864951.jpg -(22082 B, 400x400) Thumbnail displayed, click image for full size.
22082

Начал что-то считать, порядочно запутался. Два возможных ответа, + и -. Возьмём ситуацию с 6 ответами, это 2^6=64 всего возможных пермутации. Теперь по формуле посчитаем количество сочетаний, формула - берем количество минусов за "х", 6!/(x!*(6-x)!).
01х ++++++
06х +++++-
15x ++++--
20х +++---
15х ++----
06х +-----
01х ------
То есть, ++++++ у нас появляется с частотой в 1/64, а +++--- уже 7/64 (складываем всё, что выше по рейтингу). 1/64 - это примерно 1,56%.

Теперь возьмём 23 ответа. Это 2^23=8388608 всего возможных пермутаций.
23л0д - 1
22л1д - 23
21л2д - 253
20л3д - 1771
19л4д - 8855 [еще раз, формула - 23!/(4!*(23-4)!)]
18л5д - 33649
17л6д - 100947
Итого для 17 лайков и 6 дизлайков метрика - (1+23+253+1771+8855+33649+100947)/8388608, или 145499/8388608, то есть 1,73%.

То есть 17 лайков и 6 дизлайков - примерно так же маловероятно по этим подсчётам, как 6 лайков и 0 дизлайков. Ничего не понимаю. Помогите мимо-гуманитарию (◕‿‿◕)

>> No.152932  

>>152930
Долго вчитывался в параметр, который ты пытаешься посчитать, но так и не смог понять его смысл.

>> No.152933  

>>152932
Ну смотри, возьмём произвольную пару значений "лайки-дизлайки". Если сравнивать её с нормальным распределением (50% к 50%), можно выявить параметр "вероятностной возможности", т.е. насколько такое соотношение лайков маловероятно. Далее из полученного значения "маловероятности" выстраивается рейндж, по которому можно сортировать всё множество контента. По идее, в топе будут в том числе и редкие вещи с высоким отношением лайков к дизлайкам.

>> No.152934  

>>152933
Тогда все логично, чем больше общее количество оценок, тем менее вероятно каждое из конкретных сочитаний.



Delete Post []
Password

[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]