Интересные заказы с фриланс-бирж

Интересные задачи с фриланс-бирж

онлайн

Личная подборка. Периодически обновляется.

1. Задача по математике.

Задачник содержит 300 задач, пронумерованных от 1 до 300. У учительницы есть магнитики с цифрами. В начале урока она прикрепляет их на доску так, чтобы образовались номера четырех задач, которые разбираются на уроке. Какое наименьшее число магнитиков должно быть у учительницы, чтобы она могла задать на уроке любые четыре задачи?
2. Распознавание номеров
Необходимо распознавать номера с табличек на форме спортсменов.
Номерные знаки прямоугольные, кол-во цифр на одной табличке варьируется от 2 до 6. Таблички на фотографиях могут быть искривлены и находится под разными углами. На фото может находиться как один так и несколько спортсменов. Пример фото:
3. Генерация описаний
Необходимо разработать систему, которая будет формировать описания для товаров на основе характеристик.
На входе - XML-файл яндекс маркета с характеристиками. На выходе - XML-файл с описаниями. Размер файла - до гигабайта (миллион товаров). Интерфейс состоит из 8-10 страниц. Должна быть админка для менеджеров, которые будут добавлять правила и формировать шаблоны. Так же внутри должен подключаться склонятор (сторонний сервис) через API. Плюс еще синонимайзер можно по api подключить.
Пример на входе:

  • Вид застежки: Пуговицы
  • Тип карманов: Втачные
  • Длина по внутреннему шву: 80 см
  • Крой по посадке: Slim
  • Дизайнерские эффекты: Эффект потертости
  • Конструктивные элементы: Шлевки
  • Декоративные элементы: Декоративные элементы
  • Сезон: демисезон
  • Пол: Мужской
  • Комплектация: джинсы

Пример на выходе:
Мужские джинсы на пуговицах, декорированные втачными карманами. Длинные брючины 80 см. Крой типа «слим» позволяет подчеркнуть вашу фигуру, а эффект потертости создает небрежный образ. Модель оформлена различными декоративными элементами, а так же втачками. Подходит на любой сезон.

4. Морфологический анализ объема данных

Нужен помощник-программист и энтузиаст data mining с научно-исследовательскими целями. Решается проблема нашего технократического общества, в котором технологии опережают реальные потребности людей.
Дано:

Собранный объем информации за определенный период в виде статей с таксономией.
Задача:
Сделать выводы и прогнозы, обнаружив закономерности и тренды
Решение:
Нужно проанализировать статьи на % повторяющихся слов и словосочетаний. Результат нужен в виде не просто отсортированных ключевых слов, а группы статей, объединенные по их типу. То есть это похоже на задачу кластеризации.
Основное, что требуется для ее решения, — написать функцию расстояния, которая на вход принимает пару заказов и на выходе дает число, показывающее, насколько они похожи. Например, 1, если это одна и та же задача, и 0, если между ними нет ничего общего. Если что-то общее есть, то какое-то значение где-нибудь между 0 и 1. Есть разные алгоритмы кластеризации, которые, используя эту функцию расстояния, смогут объединить близкие задачи в одну группу.
Чтобы такую функцию написать тоже может потребоваться перебрать несколько вариантов. Для начала можно смотреть на количество одинаковых слов в текстах статей. Слова можно взвешивать, чтобы часто употребляемые имели меньший вес (TF-IDF). Возможно, у текста статей есть какие-то особенности, которые помогут построить более точную функцию расстояния.

5. Создать сайт с возможность анонимно задавать вопросы

Нужен сайт с приватными комнатами в которых анонимно, без регистрации, можно задавать вопросы и получать ответы (вход по генерируемой ссылке аля Google.Диск)
Владелец комнаты проходит регистрацию с указанием email'a на которую получает ссылку для администрирования и ссылку для пользователей. Ссылки можно генерировать повторно в случае компрометации. Так же на email приходят уведомления о новых вопросах. Вопросы можно комментировать и оценивать (+/-). Требуется только пускать пользователей, у которых есть необходимая ссылка в комнату с возможностью создавать (не редактировать!), комментировать и оценивать вопросы.

6. Создание каталога. Есть сотни тысяч категорий и миллионы товаров которые создавали пользователи, без каких либо ограничений в названий и структуре. Категории и товары абсолютно любой направленности. Названия так же могут содержать ошибки и прочие символы.  Необходимо их как-то объединить в один каталог.

Например, есть категории Асер, Acer, Ноутбуки Acer. Необходимо объединить в одну Acer. Или шины для грузовой техники, шины для сельхоз техники - в категорию Шины.

Товары могут быть вообще без категории или содержать в названии только модель устройства.

7. Разработка генератора логотипов

Требуется разработка PHP-скрипта для генерации логотипов. Скрипт должен работать через GD или ImageMagick. Генерация логотипа должна происходить в полностью автоматическом режиме, скрипт должен принимать запросы по HTTP , а на выходе выдавать путь к готовому изображению. Входными параметрами будут: стиль, шрифт, цвет текста, размер лого, тень. Стиль определяется группой категорий, каждая из которых имеет свой набор шрифтов и цветов. Остальные параметры (шрифт, цвет, тень) должны выбираться случайным образом. В качестве примера подобного скрипта, но с ручным управлением: http://logomaker.scriptsez.com. Срок: 1-2 недели.
8. Анализ сетчатки глаза
Создание программы для анализа и распознания стадий диабета на основе сетчатки глаза (ретинопатия).
Требования к проекту: OpenCV, C#, C++.
Программа должна иметь 4 "стадии" работы (возможность просмотра каждого).
а. Предварительная обработка изображения.
б. Выделение сосудов на кадре. На примере этой статьи: _habrahabr.ru/post/259017/
в. Нахождение пятен на кадре появляющиеся на сетчатке при разных стадиях заболевания
г. Выделение всех пятен и лопнувших сосудов и вывести стадию болезни. Стадия определяется по площади пораженного глаза.
Входными данными является изображение сетчатки глаза.
Выходными данными является выделение всех пятен и лопнувших сосудов и вывод стадию диабета

9. Софт по распознаванию автомобильных номеров

У нас есть автомойка. Нужно написать софт, который будет определять, сколько машин за сутки помылось и их госномера на основании камер видеонаблюдения.
10. Матрица

Опуская некоторые второстепенные подробности, имеется большая разреженная 2- или 3-мерная матрица. Насколько большая? Ну диапазон индексов (по каждому измерению) до нескольких миллионов. Общее количество реально занятых элементов (на всю матрицу) - тысячи, десятки тысяч.

С одной стороны, требуется иметь возможность быстрого доступа к элементу по индексу (a[i][j][k]). С дугой стороны, нужна возможность быстро обойти все непустые элементы и что-то с ними сделать (условно говоря, a.forEach(...)). Скорость очень важна.

Элемент матрицы - объект, поэтому типизированные массивы заведомо отпадают.

Вопрос в структуре данных.

11. Алгоритм формирования цены для аукциона

Рассчитать алгоритм формирования цены для аукциона. Аукцион - аналог аукциона на то, чью рекламу показывать в видео. Есть показатели число просмотров канала, минимальная стоимость показа рекламы, конкуренция между рекламодателями. Задача сформировать алгоритм формирования цены показа рекламы.
12. Cервис автоопределения тональности рецензий на кинофильмы.
Приложение, при получении списка рецензий на фильмы, должно формировать ответ с результатом определения тональности для каждой из рецензий (целочисленное значение в интервале от 1 до 10). Точность работы алгоритма анализа тональности: 85%. Скорость обработки рецензий: от 8 в сек.
13. Определение "похожести" текстов

Например, вот два названия товара:

HP 728 300-ml Cyan DesignJet Ink Cartridge
Hp 728 - Cyan - Original - Designjet - Blækpatron

Нужен инструмент, который с более-менее высокой вероятностью сможет понять, что это об одном и том же.
В целом задача такая: есть два списка названий, по-разному сформулированных, нужно найти соответствия между элементами списков.

14. Определение цвета

Есть база товаров (одежда), у каждого товара есть ссылка на его изображение. Необходим скрипт/модуль для определения основных цветов изображения и добавление полученных данных в бд.

Изображения в формате jpg, png. У большинства изображений светлый или прозрачный фон.  Цвет фона не должен участвовать в определении основных цветов.

 

15.  Определение человека на изображении

Необходимо на PHP написать функцию, в которую будет передан путь к картинке, после обработки картинки в ответе должно быть true(на картинке есть человек) или false(на картинке нет человека).

Вне зависимости от освещения и расположенных объектов на картинке. То есть надо определять что на картинке есть человек, какая бы это картинка не была.

16. Задача по анализу данных

Эксперимент с наценкой

Вводная

Есть сайт, продающий какие-то товары. Есть выделенная группа товаров, которые продаются с одной и той же фиксированной наценкой, например 100 руб. Есть конкуренты, которые продают те же товары со своей наценкой.

Задача

Необходимо провести эксперимент по изменению наценки с целью получения  максимальной прибыли. Например, уменьшив наценку мы станем продавать гораздо больше или наоборот никто и не заметит увеличения.

Каким образом будет проводится эксперимент?

По каким метрикам будет определяться победитель?

Как отследить, что конкуренты поменяли свою наценку?

17. Нейронные сети и стихотворения

Цель - нейронная сеть для генерации стихотворных форм на основе загруженных тегов из API соцсетей.
На Git есть реализованные англоязычные аналоги.
Ищем спеца, с опытом в нейронных сетях, который возьмет полную ответственность за поставленную задачу.

18. 100,000,000 строк

Сделать .txt файл со 100,000,000 строк с числами в диапазоне от 0 до 99,999,999:

  • формат чисел - 8 нулей (1 = 00000001, 65535 = 00065535)
  • диапазон от 0 до 99,999,999
  • все числа в рандомном порядке:
    • 00306453
    • 99645283
    • 70000021
    • 06847127
  • без повторов (каждая строка - уникальное число)