Юлия Блинова
Автор новостей

Google открыла доступ к технологии, лежащей в основе «портретного режима»

Фото: Computer Blindness - Blogspot
Фото: Computer Blindness - Blogspot

Цель семантической сегментации изображения – охарактеризовать каждый пиксель на снимке и присвоить ему одну из меток «человек», «животное», «снег» и т.д. Данная технология имеет множество прикладных решений. И сейчас Google выпустила свою последнюю версию сегментации изображений, сделав код открытым для других разработчиков, которые его могут использовать в своих приложениях.

Фото: Google
Фото: Google

Способов использования этой технологии достаточно много. Одним из ярких примеров ее применения является портретный режим в смартфонах линейки Pixel 2. В данном случае программа отделяет людей на переднем плане от предметов на заднем фоне. Это позволяет создавать эффект глубины, как на профессиональных зеркальных камерах. Выделив человека или группу людей на фото, затем легко размыть оставшиеся объекты и тем самым получить профессиональный портрет. Чем точнее сделана семантическая сегментация изображения, тем качественнее получается эффект боке.

Однако портретный режим не единственный метод использования технологии, ее также можно применять для программной регулировки экспозиции и цветопередачи.

Фото: Google
Фото: Google

Смартфоны поискового гиганта демонстрируют хорошие успехи в портретном режиме, а следовательно они качественно сегментируют изображение. Поэтому выпуск DeepLab-v3+ с открытым исходным кодом — прекрасная новость для всех разработчиков, занимающихся созданием программ для обработки фотографий.

В компании отмечают, что ее технология, основанная на нейронных сетях, достигла такой высокой точности, о которых еще 5 лет назад можно было только мечтать. Предоставление программы в публичный доступ облегчит задачу другим группам разработчиков, работающим в этом направлении, и позволит расширить сферу ее практического применения.