Вчені з массачусетського технологічного інституту розробили програмний алгоритм під назвою Taco, який дозволяє автоматизувати компресію тензорних таблиць (3D-матриць), що складаються з великої кількості порожніх даних. "Нулі" при множенні таблиць змушували процесор працювати «вхолосту» і займали дуже багато місця в пам'яті, а оптимізація вимагала великої праці від програмістів, повідомляє Science Daily.
Підпишись на наш Viber: новини, гумор та розваги!
ПідписатисяПодібні матриці більш зручні для аналізу великих даних і машинного навчання, ніж звичайні SQL-бази. Однак у них є очевидний мінус: якщо одиницею відзначається покупка, то усі інші заповнені клітинки нулями.
Дослідники з массачусетського технологічного ІНСТИТУТУ придумали, як автоматизувати цей процес так, щоб від програміста лише потрібно було імпортувати файл з даними і вибрати необхідну операцію для розрахунку. Технічно алгоритм Taco реалізований так, що спочатку він відбирає всі ненульові значення, а потім позбавляється від тих пар, де є множення на нуль, і лише після цього записує їх пам'ять.
Якщо раніше було потрібно помножити таблиці, результат записати в пам'ять, і тільки потім проводити його складання з таблицею, то тепер Taco дозволяє здійснювати множинні розрахунки в межах одного циклу або "ядра". І головна новина в тому, що в массачусетському технологічному інституті розробили різні "ядра" для найбільш популярних в аналізі великих даних операцій з тензорними таблицями.
Результат вражає: завдяки Taco тензорні таблиці для всього, що є в Amazon тепер займуть якісь 14 Гб і помістяться в звичайному смартфоні.
Раніше портал "Знай.ua" повідомляв про смартфон, який прислухатеметься до вашого авто