impromptu: (Зарочка)
[personal profile] impromptu



Маск выпер всю команду, которая идентифицировала в Твиттере консервативных райт-вингеров. А вот интересно, как можно выуживать такой алгоритм? Ну понятно, в ФБ нас в кошачьем соо банят за выражение "fat cat", идиоты - бодипозитив должон быть в  отношении животных, вдруг Мурка прочтет, что хозяйка пишет о ней в сети. Или мы пишем pus@ycat, чтобы избегнуть сексуальных коннотаций, за пусси тоже дрючат. Это понятно, как написали. Но "оценку алгоритма" сложно ж как делать-то подобную.

Но как можно выуживать превалирование консервативного трепа, если не вручную мыкались теперича безработные?

И оценить превалирование? Ну, сегодня человек недоволен этим, а завтра тем. И как именно алгоритм Твиттера потакает правым? Вот как они эту оценку-то сделали уклонистскому алгоритму.  Вообще что в их понимании был этот алгоритм.
Page 1 of 5 << [1] [2] [3] [4] [5] >>

Date: 2022-11-05 02:06 am (UTC)
paserbyp: (Default)
From: [personal profile] paserbyp
Это очень простая задача для программирования так как создается база данных с примерами правой или левой или любой другой риторики. Затем алгоритм состоит в том, чтобы сравнивать образцы базы данных с текстом и самое главное обновлять базу данных новыми примерами риторики. На самом деле любая риторика включает в себя штампы или патерны по которым очень легко найти и определить принадлежность к крайне правой или крайне левой риторике. Например, поиск и нахождение любых паттернов связанных с конспирологическими теориями QAnon или отрицанием результатов выборов президента или скандирование лозунга MAGA говорит о наличии правой и протрампистской пропаганды.

Date: 2022-11-05 02:31 am (UTC)
paserbyp: (Default)
From: [personal profile] paserbyp
Математически нельзя добиться 100% уверенности, но получить 99% результат - вполне возможно. В 1% попадут сомневающиеся и другие примеры, например сарказм или провокации…

Вы начинаете с 75% правильности определения алгоритма и базы данных поисковых паттернов. По мере разрастания базы данных и совершенствования алгоритма со временем вы достигаете сначала 90%, а потом и 95% и т.д. Конечно 100% результат не возможен и ошибки всегда неизбежны.
Edited Date: 2022-11-05 02:35 am (UTC)

Date: 2022-11-05 02:50 am (UTC)
paserbyp: (Default)
From: [personal profile] paserbyp
Выловить сарказм или провокатора, который тролит или эзопов язык - это довольно сложная задача, но она и не стоит перед алгоритмом и базой данных. Если вы хотите бороться с сарказмом или эзоповым языком, то надо начинать создавать базу данных патернов и писать алгоритм поиска…конечно же это не совсем простая задача, но не сложнее задачи распознания образов для автомобиля, который управляется автопилотом.
Edited Date: 2022-11-05 02:51 am (UTC)

Date: 2022-11-05 04:53 am (UTC)
From: [personal profile] stumari
другой вопрос - я не уверен, что мы одинаково понимаем этот твит.
Мне кажется, что там написано, что Маск уволил не "команду, которая идентифицировала в Твиттере консервативных райт-вингеров"
а "команду, которая идентифицировала, что алгоритм Твиттера усиливает именно правый фланг, по сравнению со всеми остальными"

Date: 2022-11-05 06:07 am (UTC)
From: [personal profile] borisk
«Не в первый раз мы видим сотрудников (в особенности чернокожих), пострадавших за то, что они указали на то, как продукция их компании позволяет существовать и потворствует расизму»

Ко второму абзацу твита автор соскочил на привычную дорожку. Про то, что две ноги плохо, а четыре — хорошо.

Date: 2022-11-05 06:58 am (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Этих людей называют программистами? Ну потому что они черные, или что?

Date: 2022-11-05 07:00 am (UTC)
kondybas: (Default)
From: [personal profile] kondybas
Похожий алгоритм используется и для распознавания спама в почте. Определенные слова довольно однозначно метят весь текст. Вначале, конечно, нужно вручную собрать два больших массива писем, нормальных и спамовых. Затем сделать статанализ слов в них, и каждому слову назначить "вес" в баллах. Вес может быть как положительным, так отрицательным. Каждое сообщение проверяем на наличие слов-маркеров и суммируем их веса. Если ушли в плюс - спам. В минус - норм. Разумеется, около нуля из осторожности вердикт не выносим. Так удается отлавливать 99.99% спама, пропуская к получателю 1-2 спамовых письма на тысячу входящих.

Вышеописанное - старый алгоритм. Нынче появились более изощренные. Где оцениваются веса не отдельных слов, а их комбинаций, целых идиом, в разных словоформах. Например, если фильтр можно обмануть, написав fut cut или poossicat - это старый, т.н. "байесовский" фильтр. Новые нейросетевые фильтры могут гораздо больше. Но их тоже нужно учить, и для этого как раз и нужен штат людей, которые просматривают поток сообщений, вручную метят их штемпелем "фошызм" и скармливают нейросети для дообучения.

Date: 2022-11-05 07:39 am (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Про алгоритм просто - это слово употребляется пиэмами, чтобы обозначить важность и сложность задачи.

А как пришли - очень просто, Виджая велела придти, они и пришли.

Date: 2022-11-05 08:22 am (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Все под контролем. На то и конфиг-файлы, чтобы управлять тем, что программа делает.

Date: 2022-11-05 08:49 am (UTC)

Date: 2022-11-05 08:55 am (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
да никак, очевидно же. просто всех обиженных надо спасти, и если шоколодка несет хуйню - ее надо послушать, иначе сука нажалуется в эйчар и пизда твоей карьере, а нее её.

ну и вот.

вся эта левоватая пиздобратия выступает с идиотскими идеями, но все другие ссут их остановить, веть моргидж и тесла в лизинг.

и да, я не трампист, мне трамп глубоко неприятен, но боже сколько раз меня назвали расистом в энторнетах за то что я критиковал всю эту woke тусовку.

Все проще

Date: 2022-11-05 11:13 am (UTC)
python_regius: (keep stirring)
From: [personal profile] python_regius
https://www.theguardian.com/technology/2021/oct/22/twitter-admits-bias-in-algorithm-for-rightwing-politicians-and-news-outlets

"The social media platform examined tweets from elected officials in seven countries – the UK, US, Canada, France, Germany, Spain and Japan. It also studied whether political content from news organisations was amplified on Twitter, focusing primarily on US news sources such as Fox News, the New York Times and BuzzFeed.

The study compared Twitter’s “Home” timeline – the default way its 200 million users are served tweets, in which an algorithm tailors what users see – with the traditional chronological timeline where the most recent tweets are ranked first.

The research found that in six out of seven countries, apart from Germany, tweets from rightwing politicians received more amplification from the algorithm than those from the left; right-leaning news organisations were more amplified than those on the left; and generally politicians’ tweets were more amplified by an algorithmic timeline than by the chronological timeline."
Edited Date: 2022-11-05 11:29 am (UTC)

Date: 2022-11-05 01:39 pm (UTC)
paserbyp: (Default)
From: [personal profile] paserbyp
последний совковый отчет для партаппарата в ЦСУ СССР и в КГБ СССР составляли в 1991 году люди которые родились в один год с Путиным и им сегодня 70 лет, тем кто дожил конечно, а так как средняя продолжительность жизни для мужчин в России. где-то лет 65. То это очень наврядли, что они над этим работали, скорее всего проблема в другом…

Date: 2022-11-05 01:40 pm (UTC)
paserbyp: (Default)
From: [personal profile] paserbyp
——

скажи мне кто твой друг и я скажу кто ты?
Edited Date: 2022-11-05 01:41 pm (UTC)

Date: 2022-11-05 03:12 pm (UTC)
kondybas: (Default)
From: [personal profile] kondybas
Тут есть один тонкий момент :)

Сами алгоритмы распознавания - они собственного мнения не имеют. Они тупо всасывают образцы, помеченные, как "хорошие" или "плохие" и формируют некую модель, которая старается действовать точно так же, как люди, метящие образцы "хорошими" или "плохими". И по итогу оценка ставится не некая абстрактная, а максимально напоминающая поведение "учителей". И если учителя на всю голову ебанутые, и видят фошызм и альт-райт в слове "pussycat" - то и программный фильтр будет высерать эту ебанину.

Строго говоря, нет ничего плохого в фильтрации спама, или СР, или реального хейт-спича. Проблема лишь в том, кому доверено решать, каковы хорошие и плохие образцы, на которых будет учиться алгоритм. Если ебанутые ебанашки будут браковать все фото, где мужчин больше, чем женщин, то в итоге фильтр начнет браковать любое изображение мужчин. Не потому, что это плохо, а потому, что это считал плохим тот упоротый левачок, у которого сошиал джастис фивер случался по абсолютно любому поводу.

И чтобы все это исправить - нужно сбросить в ноль настройки фильтра, и выкинуть на мороз всю ту упоротую команду, которая этот фильтр засрала своими ебанутыми решениями.

Date: 2022-11-05 03:20 pm (UTC)
kondybas: (Default)
From: [personal profile] kondybas
А я нейтрально отношусь к Трампу.

Но видя, сколько лжи и клеветы на него вывалили, и как изо всех щелей поперло deep-state, за упоминание которого над ним насмехались, я понимаю, что весь, абсолютно весь корпус информации о Трампе в СМИ - это тщательно сконструированный образ пугала. Потому что ничего, из вменяемого ему в вину, доказано не было.

Date: 2022-11-05 03:24 pm (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
Слушай, ну то что он крайне неприятный тип, это очевидно. Причем было очевидно задолго до выборов.

Date: 2022-11-05 03:34 pm (UTC)
kondybas: (Default)
From: [personal profile] kondybas
Да пусть он хоть говном обмазывается. От него требовалось делать дело - он его делал. А что вся дем-левацкая шобла взвилась в едином порыве - свидетельствует о том, что он ударил в самую мякотку.
Page 1 of 5 << [1] [2] [3] [4] [5] >>

Profile

impromptu: (Default)
impromptu

January 2023

S M T W T F S
1 234567
891011121314
15161718192021
22232425262728
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 20th, 2026 03:50 am
Powered by Dreamwidth Studios