(no subject)
May. 18th, 2025 06:00 pmС некоторых пор я озадачилась вопросом: можно ли запрограммировать определение стихотворного размера? А то мне это кажется вполне возможным (поскольку я за всю жизнь написала программы этак полторы, на бейсике, в школе, больше 30 лет назад). Но почему-то реализовано только на примитивном уровне.
Вот по-вашему как, можно? Или мы исключительно на слух эти размеры определяем?
Вот по-вашему как, можно? Или мы исключительно на слух эти размеры определяем?
no subject
Date: 2025-05-18 12:59 pm (UTC)он умеет говорить с правильными удаарениями
проблема в том, что он галлюцинирует на таких вопросах. я думаю что платная версия с хорошим промтом должна уже справляться.
no subject
Date: 2025-05-18 01:02 pm (UTC)можно даже попросить того же гпт написать код на питоне. он знает где библиотечку взять.
no subject
Date: 2025-05-18 01:06 pm (UTC)"должен справляться" — то есть, ты представляешь себе алгоритм? Или почему должен?
no subject
Date: 2025-05-18 01:19 pm (UTC)заставить его меньше ошибаться можно попросив показывать промежуточные результаты.
вероятно grok справится с этим даже лучше чем чат гпт, но я с ним не работал.
no subject
Date: 2025-05-18 01:44 pm (UTC)no subject
Date: 2025-05-18 01:52 pm (UTC)думаю, что можно было бы научить сеть на большом корпусе стихов с известными размерами, но это не моя чашка чая.
no subject
Date: 2025-05-18 01:00 pm (UTC)Мы определяем на слух, потому что знаем, где у какого слова ударение. Стало быть, программе нужен словарь ударений.
no subject
Date: 2025-05-18 01:09 pm (UTC)Хотя, казалось бы, смещённых ударений в строке всегда меньше, чем правильных. И можно задать приоритет или что-то в этом роде.
no subject
Date: 2025-05-18 01:44 pm (UTC)Ну да. Стихотворение ведь не из одной строки состоит. Я себе представляю алгоритм так: программа получает стихотворный текст из стольких-то строк, а еще ей известно, где в какой последовательности букв может быть ударение (причем часто возможное место не единственное); на основе этого она строит возможные прочтения стихотворения (последовательности ударных и безударных слогов), сравнивает их с пятью существующими размерами и выбирает то прочтение и тот размер, которые расходятся меньше всего.
no subject
Date: 2025-05-18 01:54 pm (UTC)Между прочим, мы частенько можем, встретив в стихе незнакомое/сомнительное слово, определить его ударение по размеру стиха. Но это только благодаря тому, что у большинства слов мы знаем ударение. Программа, наверное, тоже так может. То есть ей достаточно знать ударение большинства слов, а не всех-всех-всех.
В наш человеческий алгоритм ещё подмешиваются всякие знания: например, что односложные служебные словы "так", "да", "вот" в одних контекстах бывают ударными, в других — безударными. Как этому программу обучить? Ввести какой-то статус неопределённости для таких слов?
no subject
Date: 2025-05-18 04:41 pm (UTC)Совсем не трудно. Берем строку «Я помню чудное мгновенье», приводим ее в форму ◌●○●○◌○●○, где белый кружок — слог заведомо безударный, черный — заведомо ударный, а пунктирный — пока неизвестно. Сравниваем ее с моделями пяти размеров от хорея — ●○●○●○●○● до анапеста — ○○●○○●○○●; обнаруживаем соответственно 7, 0, 3, 2 и 5 расхождений с хореем, ямбом, дактилем, амфибрахием и анапестом и выбираем наименьшее из этих чисел.
no subject
Date: 2025-05-18 04:55 pm (UTC)А как приводим в форму?
no subject
Date: 2025-05-18 05:06 pm (UTC)А для этого нам нужен словарь, где говорится, что у по́мню, чу́дное и мгнове́нье ударения именно такие, и правило, согласно которому односложное слово может быть ударным или безударным, а в других слог рядом с ударным будет безударным, а дальше, возможно, как придется.
Есть, конечно, одна трудность: существует и слово чудно́е, и нельзя исключить того, что в этой строке мы имеем дело с ним, тогда размер — амфибрахий. Тут-то пригодится парная строка: «Как мимолетное виденье» амфибрахием быть не может.
no subject
Date: 2025-05-19 05:40 pm (UTC)Попыталась нарочно придумать строки, на которых программа могла бы сбиться с панталыку.
я ведь не то, что всегда, я не так, как обычно
◌◌◌◌◌○●◌◌◌◌○●○
— нет расхождений как с дактилем, так и с хореем. Но не думаю, таких строк много.
no subject
Date: 2025-05-18 01:21 pm (UTC)понял.
тут надо писать код который пытается найти наилучший способ натяжки совы стиха на глобус размера.
объяснить это промтами уже сложнее. написать код на основе библиотеке ударений должно быть не слишком все еще сложно.
no subject
Date: 2025-05-18 01:32 pm (UTC)"не слишком все еще сложно" — со временем станет сложнее? Почему?
no subject
Date: 2025-05-18 01:39 pm (UTC)все еще не кажется слишком сложным, несмотря на усложнения требований.
no subject
Date: 2025-05-18 05:00 pm (UTC)У нас, носителей естественного языка, скорость обработки информации куда меньше. И мы привыкли общаться устно, поэтому пишем, невольно подразумевая интонацию. А железяке эта проблема неведома.
В конце концов, люди могут строго разделить устную и письменную речь, употреблять более точные выражения и лучше понимать друг друга. А уж разделить режимы творчества и поиска-обработки фактов для человека вообще нефиг делать. Почему железяка этого не делает? Нарочно? деньги дерут, а корицу жалеют?
no subject
Date: 2025-05-18 01:41 pm (UTC)У меня есть ещё догадка, что хороший олдскульный программист справился бы с такой задачей, но не имеет желания и/или возможности. А молодёжь попросту не умеет (и заодно не понимает, что такое стихи, размер и т.п.)
no subject
Date: 2025-05-18 01:57 pm (UTC)типа — в среднем столько ударений на столько слогов.
решаем двух или трехсложный.
далее смотрим как падает в парах тройках.
но да может сбиваться если посреди строки. тогда надо явно распознавать что происходит.
да начинает выглядеть как проект :-)