Написать программу, работающую в телеграмме и осуществляющую парсинг сообщений от пользователей в чатах (до 100 чатов, может больше). Программа должна уметь "читать" сообщения, обращая внимание на ключевые слова, и автоматически составлять и записывать данные в Google таблицы, разобрав каждое сообщение на:
1.Город;
2.Модель;
3.Цена;
4.Состояние (новый, б/у);
При этом в одном сообщении может быть несколько разных товаров (1-50∞).
В какой момент программа будет понимать что она распознала все модели? (как будете решать этот вопрос)
Наши варианты:
Найдены все пары ключевых слов (связка: модель+цена), т.е. если цена найдена, а модель не найдена, то Прога выводит сообщение админу;
Распознавание X% текста
Например, если распознано 70%, то считать сообщение обработанным, иначе нет.
Для корректной работы этого варианта необходимо игнорирование "специальных" символов: эмодзи и т.д. (подается с помощью таблицы или блокнота не принципиально "Слова-эмодзи").
На вход программы подаются ссылки на Google таблицы со списками:
Стоп-слова;
Слова-замена;
Слова-покупка;
Слова-эмодзи;
Ключевые слова – Модели.
На выходе должно быть 2 таблицы: таблица OUT-Продажа и таблица OUT-Покупка.
К таблице OUT-Продажа относится следующее:
Если программа увидела стоп-слово, она должна проигнорировать всё сообщение (например, слово "ремонт").
Если нет, программа прогоняет сообщение по ключевым словам (обращая внимание на пробелы, отступы и т.д.) и заносит распознанные модели в таблицу OUT.
Например, появляется сообщение: "Iphone 13 Pro Max 512GB. Цена: 110т.р. Новосибирск.". Программа должна определить, что:
1. "Новосибирск" – это город.
2. "Pro Max 512" – это модель;
3. "110т.р." – это цена, равная 110000;
Программа должна занести полученные слова в таблицу OUT-Продажа в строго отведенные для них столбцы (модель в столбец c моделями, цена в столбец с ценами и т.д.);
Помимо того, что программа должна уметь находить и определять слова, она должна записывать в таблицы, в каком чате было написано сообщение, дату публикации и город (если он написан в самом сообщении). Если город не указан, то устанавливается стандартный город чата, который указывается пользователем.
К таблице OUT-Покупка относится следующее:
В эту таблицу данные записываются в том случае, если в сообщении были обнаружены Слова-покупка.
Например, "КУПЛЮ Iphone 13 Pro Max 512GB". В данном случае, Слово-покупка – слово "КУПЛЮ". Следовательно, сообщение уходит в таблицу OUT-Покупка;
Как и в таблице OUT-Покупка, в данной таблице должны иметься данные: название чата, город (если не указан в сообщении, то устанавливается стандартный город чата), дата сообщения.
Должен производиться анализ таблицы OUT:
Очистка неактуальных и устаревших записей;
Формирование ТОПа по цене с дальнейшим вымещением товаров с самой высокой ценой.
У программы должно быть 3 режима работы:
Режим полного обучения (ЕСЛИ ЭТО ВОЗМОЖНО СДЕЛАТЬ, если нет, то упростим до обычного уведомления с подсветкой цве
Контакты
Контакты видны только пользователям с аккаунтом pro