Ученые из МТИ разработали программный алгоритм под названием Taco, который позволяет автоматизировать компрессию тензорных таблиц (3D-матриц), состоящих из большого количества пустых данных. "Нули" при умножении таблиц заставляли процессор работать «вхолостую» и занимали слишком много места в памяти, а оптимизация требовала большого труда от программистов, передает Science Daily.

Подобные матрицы более удобны для анализа больших данных и машинного обучения, нежели обычные SQL-базы. Однако у них есть очевидный минус: если единицей отмечается покупка, то все остальные ячейки заполнены нулями.

Исследователи из МТИ придумали, как автоматизировать этот процесс так, чтобы от программиста лишь требовалось импортировать файл с данными и выбрать необходимую операцию для расчета. Технически алгоритм Taco реализован так, что сначала он отбирает все ненулевые значения, а потом избавляется от тех пар, где есть умножение на ноль, и лишь после этого записывает их память.

Если раньше требовалось умножить таблицы, результат записать в память, и только потом производить его сложение с другой таблицей, то теперь Taco позволяет совершать множественные расчеты в рамках одного цикла или "ядра". И главная новость в том, что в МТИ разработали разные "ядра" для наиболее часто встречающихся в анализе больших данных операций с тензорными таблицами.

Популярные статьи сейчас
"Бусификацию" обещают искоренить: ТЦК применят новый подход к мобилизации Штрафы от ТЦК вырастут вдвое: уклонистов изрядно потрясут Масштабное мартовское повышение пенсий: 2300 получат не все Украинцам выплатят по 4 500 гривен: кому посчастливится получить помощь
Показать еще

Результат впечатляет: благодаря Taco тензорные таблицы для всего, что есть в Amazon теперь займут какие-то 14 Гб и поместятся в обычном смартфоне.

Ранее портал "Знай.ua" собщал о смартфоне, прислушивающемся к вашему авто