Интересные задачи с фриланс-бирж Часть 1

Интересные задачи с фриланс-бирж

Личная подборка. Периодически обновляется.

1. Задача по математике.

Задачник содержит 300 задач, пронумерованных от 1 до 300. У учительницы есть магнитики с цифрами. В начале урока она прикрепляет их на доску так, чтобы образовались номера четырех задач, которые разбираются на уроке. Какое наименьшее число магнитиков должно быть у учительницы, чтобы она могла задать на уроке любые четыре задачи?

2. Распознавание номеров

Необходимо распознавать номера с табличек на форме спортсменов.
Номерные знаки прямоугольные, кол-во цифр на одной табличке варьируется от 2 до 6. Таблички на фотографиях могут быть искривлены и находится под разными углами. На фото может находиться как один так и несколько спортсменов. Пример фото:

3. Генерация описаний

Необходимо разработать систему, которая будет формировать описания для товаров на основе характеристик.
На входе - XML-файл яндекс маркета с характеристиками. На выходе - XML-файл с описаниями. Размер файла - до гигабайта (миллион товаров). Интерфейс состоит из 8-10 страниц. Должна быть админка для менеджеров, которые будут добавлять правила и формировать шаблоны. Так же внутри должен подключаться склонятор (сторонний сервис) через API. Плюс еще синонимайзер можно по api подключить.
Пример на входе:

Вид застежки: Пуговицы
Тип карманов: Втачные
Длина по внутреннему шву: 80 см
Крой по посадке: Slim
Дизайнерские эффекты: Эффект потертости
Конструктивные элементы: Шлевки
Декоративные элементы: Декоративные элементы
Сезон: демисезон
Пол: Мужской
Комплектация: джинсы

Пример на выходе:
Мужские джинсы на пуговицах, декорированные втачными карманами. Длинные брючины 80 см. Крой типа «слим» позволяет подчеркнуть вашу фигуру, а эффект потертости создает небрежный образ. Модель оформлена различными декоративными элементами, а так же втачками. Подходит на любой сезон.

4. Морфологический анализ объема данных

Нужен помощник-программист и энтузиаст data mining с научно-исследовательскими целями. Решается проблема нашего технократического общества, в котором технологии опережают реальные потребности людей.
Дано:
Собранный объем информации за определенный период в виде статей с таксономией.
Задача:
Сделать выводы и прогнозы, обнаружив закономерности и тренды
Решение:
Нужно проанализировать статьи на % повторяющихся слов и словосочетаний. Результат нужен в виде не просто отсортированных ключевых слов, а группы статей, объединенные по их типу. То есть это похоже на задачу кластеризации.
Основное, что требуется для ее решения, — написать функцию расстояния, которая на вход принимает пару заказов и на выходе дает число, показывающее, насколько они похожи. Например, 1, если это одна и та же задача, и 0, если между ними нет ничего общего. Если что-то общее есть, то какое-то значение где-нибудь между 0 и 1. Есть разные алгоритмы кластеризации, которые, используя эту функцию расстояния, смогут объединить близкие задачи в одну группу.
Чтобы такую функцию написать тоже может потребоваться перебрать несколько вариантов. Для начала можно смотреть на количество одинаковых слов в текстах статей. Слова можно взвешивать, чтобы часто употребляемые имели меньший вес (TF-IDF). Возможно, у текста статей есть какие-то особенности, которые помогут построить более точную функцию расстояния.

5. Создать сайт с возможность анонимно задавать вопросы

Нужен сайт с приватными комнатами в которых анонимно, без регистрации, можно задавать вопросы и получать ответы (вход по генерируемой ссылке аля Google.Диск)
Владелец комнаты проходит регистрацию с указанием email'a на которую получает ссылку для администрирования и ссылку для пользователей. Ссылки можно генерировать повторно в случае компрометации. Так же на email приходят уведомления о новых вопросах. Вопросы можно комментировать и оценивать (+/-). Требуется только пускать пользователей, у которых есть необходимая ссылка в комнату с возможностью создавать (не редактировать!), комментировать и оценивать вопросы.

6. Создание каталога. Есть сотни тысяч категорий и миллионы товаров которые создавали пользователи, без каких либо ограничений в названий и структуре. Категории и товары абсолютно любой направленности. Названия так же могут содержать ошибки и прочие символы. Необходимо их как-то объединить в один каталог.

Например, есть категории Асер, Acer, Ноутбуки Acer. Необходимо объединить в одну Acer. Или шины для грузовой техники, шины для сельхоз техники - в категорию Шины.

Товары могут быть вообще без категории или содержать в названии только модель устройства.

7. Разработка генератора логотипов

Требуется разработка PHP-скрипта для генерации логотипов. Скрипт должен работать через GD или ImageMagick. Генерация логотипа должна происходить в полностью автоматическом режиме, скрипт должен принимать запросы по HTTP , а на выходе выдавать путь к готовому изображению. Входными параметрами будут: стиль, шрифт, цвет текста, размер лого, тень. Стиль определяется группой категорий, каждая из которых имеет свой набор шрифтов и цветов. Остальные параметры (шрифт, цвет, тень) должны выбираться случайным образом. В качестве примера подобного скрипта, но с ручным управлением: http://logomaker.scriptsez.com. Срок: 1-2 недели.

8. Анализ сетчатки глаза

Создание программы для анализа и распознания стадий диабета на основе сетчатки глаза (ретинопатия).
Требования к проекту: OpenCV, C#, C++.
Программа должна иметь 4 "стадии" работы (возможность просмотра каждого).
а. Предварительная обработка изображения.
б. Выделение сосудов на кадре. На примере этой статьи: _habrahabr.ru/post/259017/
в. Нахождение пятен на кадре появляющиеся на сетчатке при разных стадиях заболевания
г. Выделение всех пятен и лопнувших сосудов и вывести стадию болезни. Стадия определяется по площади пораженного глаза.
Входными данными является изображение сетчатки глаза.
Выходными данными является выделение всех пятен и лопнувших сосудов и вывод стадию диабета

9. Софт по распознаванию автомобильных номеров

У нас есть автомойка. Нужно написать софт, который будет определять, сколько машин за сутки помылось и их госномера на основании камер видеонаблюдения.

10. Матрица

Опуская некоторые второстепенные подробности, имеется большая разреженная 2- или 3-мерная матрица. Насколько большая? Ну диапазон индексов (по каждому измерению) до нескольких миллионов. Общее количество реально занятых элементов (на всю матрицу) - тысячи, десятки тысяч.

С одной стороны, требуется иметь возможность быстрого доступа к элементу по индексу (a[i][j][k]). С дугой стороны, нужна возможность быстро обойти все непустые элементы и что-то с ними сделать (условно говоря, a.forEach(...)). Скорость очень важна.

Элемент матрицы - объект, поэтому типизированные массивы заведомо отпадают.

Вопрос в структуре данных.

11. Алгоритм формирования цены для аукциона

Рассчитать алгоритм формирования цены для аукциона. Аукцион - аналог аукциона на то, чью рекламу показывать в видео. Есть показатели число просмотров канала, минимальная стоимость показа рекламы, конкуренция между рекламодателями. Задача сформировать алгоритм формирования цены показа рекламы.

12. Cервис автоопределения тональности рецензий на кинофильмы.

Приложение, при получении списка рецензий на фильмы, должно формировать ответ с результатом определения тональности для каждой из рецензий (целочисленное значение в интервале от 1 до 10). Точность работы алгоритма анализа тональности: 85%. Скорость обработки рецензий: от 8 в сек.

13. Определение "похожести" текстов

Например, вот два названия товара:

HP 728 300-ml Cyan DesignJet Ink Cartridge
Hp 728 - Cyan - Original - Designjet - Blækpatron

Нужен инструмент, который с более-менее высокой вероятностью сможет понять, что это об одном и том же.
В целом задача такая: есть два списка названий, по-разному сформулированных, нужно найти соответствия между элементами списков.

14. Определение цвета

Есть база товаров (одежда), у каждого товара есть ссылка на его изображение. Необходим скрипт/модуль для определения основных цветов изображения и добавление полученных данных в бд.

Изображения в формате jpg, png. У большинства изображений светлый или прозрачный фон. Цвет фона не должен участвовать в определении основных цветов.

15. Определение человека на изображении

Необходимо на PHP написать функцию, в которую будет передан путь к картинке, после обработки картинки в ответе должно быть true(на картинке есть человек) или false(на картинке нет человека).

Вне зависимости от освещения и расположенных объектов на картинке. То есть надо определять что на картинке есть человек, какая бы это картинка не была.

16. Задача по анализу данных

Эксперимент с наценкой

Вводная

Есть сайт, продающий какие-то товары. Есть выделенная группа товаров, которые продаются с одной и той же фиксированной наценкой, например 100 руб. Есть конкуренты, которые продают те же товары со своей наценкой.

Задача

Необходимо провести эксперимент по изменению наценки с целью получения максимальной прибыли. Например, уменьшив наценку мы станем продавать гораздо больше или наоборот никто и не заметит увеличения.

Каким образом будет проводится эксперимент?

По каким метрикам будет определяться победитель?

Как отследить, что конкуренты поменяли свою наценку?

17. Нейронные сети и стихотворения

Цель - нейронная сеть для генерации стихотворных форм на основе загруженных тегов из API соцсетей.
На Git есть реализованные англоязычные аналоги.
Ищем спеца, с опытом в нейронных сетях, который возьмет полную ответственность за поставленную задачу.

18. 100,000,000 строк

Сделать .txt файл со 100,000,000 строк с числами в диапазоне от 0 до 99,999,999:

формат чисел - 8 нулей (1 = 00000001, 65535 = 00065535)
диапазон от 0 до 99,999,999
все числа в рандомном порядке:
- 00306453
- 99645283
- 70000021
- 06847127
без повторов (каждая строка - уникальное число)

19. Развернуть тяжелую базу >100млн записей + поиск по ней
Есть база из 100млн записей в csv – 4 колонки. Нужно поднять из этого MySQL базу и сделать поиск по ней. Также нужно найти способ по номеру телефона/e-mail или этой связке узнавать ID пользователя в ВК.

20. Текст на изображениях

Имеется 100 изображений на некоторых имеется текст. Определить наличие текста на изображениях. И отсортировать картинки на две папки ( с текстом и без текста)

Пример

21. Лотерейные билеты

Дано:

Массив / таблица из 5 000 лотерейных билетов:
id билета, выигрыш билета (от 0 до 100)

А также массив / таблица 20 пользователей:
id пользователя, кол-во билетов, желательная сумма выигрыша с билетов

Сумма выигрыша всех билетов == сумме желательной сумме выигрыша с билетов всех пользователей
Сумма всех билетов == сумме количества всех билетов всех пользователей

Нужно каждому билету присвоить пользователя так, чтобы выполнились условия:
- каждый пользователь получил указанное количество билетов
- сумма выигрыша со всех билетов каждого пользователя была максимально близка к значению желательная сумма выигрыша с билетов.
- желательно чтобы расчёт на десктопном компе i7 12гб озу прошёл не более чем за час

22. Расшифровка чисел

Есть база данных целых чисел

42498910
40522543
38356813
39343454
40724853
41975176
43487650
46448082
47105757
48291314
...

В них зашифровано RGB представление цвета

В интерфейсе программы принтскрином для того что бы можно было от чего то отталкнуться сняли некоторые цвета

33591293 ff9515
33591785 ec9615
37699777 c9453b
37707949 b2633e
49345525 f5f4f1
49081842 f3eeed

Нужно найти алгоритм шифровки / расшифровки
и на выходе получить HEX или RGB

23. Задача от VKTech

Реализовать бесстрашную систему выполнения заказов. Сценарий использования классический:

В системе есть заказчики и исполнители. Заказчик публикует заказ и указывает его стоимость.
Исполнитель видит список заказов, доступных для исполнения.
Исполнитель выбирает заказ для выполнения, при этом исполнителю на счёт зачисляется стоимость заказа за вычетом комиссии системы.
У одного заказа может быть только один исполнитель. Если заказ выполнен, он исчезает из списка.

Требования к реализации

Прочитали сценарий и готовы прислать результат через час? Стойте. Самое главное. Мы ищем тех, кто создавая лампочку помнит, что пользоваться ею будут на космическом корабле.

Ваша система должна быть способна пережить ядерную зиму. Нужно предусмотреть все возможные риски.

Мы хотим увидеть, как минимум:

Надёжность работы под действительно высокой нагрузкой.
Точность операций с деньгами.
Устойчивость к основным типам атак.
Возможность восстановить состояние системы при отказе оборудования.

Нам интересен Ваш собственный код, а не умение использовать готовые библиотеки. Поэтому предпочтительно использование PHP без ООП. Допустимо выполнение задания на python/javaбез чрезмерного использования сторонних наработок.

Основное хранилище — MySQL, вспомогательные — redis или memcached.

Мы ожидаем от Вас код, максимально приближенный к боевому. Следует предусмотреть вариант, когда каждая таблица располагается в отдельной БД (транзакции и JOIN — не вариант).

Клиентская сторона — SPA.

Отправка результата

Результат нужно отправить в сообщения сообщества VK Tech. Прикрепите к своему сообщению ссылку на GitHub и развёрнутое демо. Укажите, написан ли код индивидуально или в составе команды backend+frontend.

Критерии оценки

В первую очередь мы будем оценивать устойчивость кода — готовность к нагрузке, отказам оборудования, внешнему вмешательству. Удобство для пользователя и аккуратность оформления фронтенда также повлияют на оценку.

24. Нейронные сети для консультирования

Требования - мультиязычность, не надо переводить. надо использовать для генерации текста язык оригинала.

Требования по точности ответа - небольшие, то есть возможны не попадания, “кривые” фразы.

Есть множество текстовых коротких диалогов между консультантами по продажам и клиентом.

Количество консультантов - миллионы на всех языках мира. Каждый общается со своими клиентами

Они подаются заранее на вход нейронной сети для обучения.

Для каждого консультанта есть свой “язык” - набор наиболее часто используемых фраз, выражений и т.д.

Общий в рамках языка собирать необязательно, но может будет полезно для расширения “словаря”.

Задача такая - чтобы подав на вход новый вопрос, нейронная сеть выдала адекватный ответ именно за этого консультанта.

То есть это генерация текста, а не работа со словарем.

Идеально - чтобы дальше она дообучалась, когда человек дает в итоге отличный ответ от ответа нейросети.

Если необходимо для полноты - можем попросить консультантов заполнить какие-нибудь “любимые книжки” или “статьи”, на общечеловеческие темы типа любовь, деньги, свобода и т.д. чтобы загрузить их тексты и лучше представлять словарный запас человека.
Также можем заполнить профиль человека - рост, вес, возраст и т.д.
Нейронная сеть в идеале должна работать на мобильнике пользователя (если это возможно), если нет - то на сервере. К ней должно быть в таком случае API.
Технологии - open source или выдача исходного кода целиком.

25. Квест

Нужен хороший сценарий для квеста.
Требования:
- план-схема помещения
- 18 загадок (6 наших, 6 новых придумать)
- реализуемые загадки (обойдемся без левитирующих предметов, ходячих мертвецов и прочих безумств)
- блок-схема прохождения
- скетчи, схемы загадок (где необходимо)
- референсы внешнего вида загадок и интерьера

26. Нейронные сети для слов

Есть список 20 000 слов. Там много однокоренных и производных слов. Нужно отделить основные и однокоренные (производные) слова.
Пример: основное слово – interest, производные – interesting, interested, uninterested.

Вручную сделать не получается.

Нужно решение с помощью нейронных сетей.

смотрите Реальные задачи по php и Веселые заказчики

Репетитор по скайпу

Интересные заказы с фриланс-бирж

Интересные задачи с фриланс-бирж

Добавить комментарий Отменить ответ

Интересные задачи с фриланс-бирж

Смотрите:

Добавить комментарий Отменить ответ