Video konferans, küresel sağlık krizi sırasında en temel iletişim araçlarından biridir. Çoğu insan, izolasyon sırasında bunları günde birkaç kez kullanır. Video iletimi genellikle ağ yoğunluğu (hem gönderme hem de alma) ve video sıkıştırması nedeniyle görüntü kalitesini düşürebilir. Nvidia bu sorunu düşündü ve yapay zeka ve yapay sinir ağı oluşturma yoluyla bir çözüm önerdi.
YouTube'dan Netflix'e internet üzerinden yayınlanan tüm videolarda olduğu gibi, gerekli bant genişliğini azaltmak için sıkıştırma algoritmaları kullanılır, böylece video görüşmeleri, kullanıcının ISS'sinin hızından bağımsız olarak her zaman gerçek zamanlı olarak gerçekleşir. Bu algoritmalar, renk doğruluğunu azaltma, kare sayısını azaltma ve bunları yeniden enterpolasyondan video çözünürlüğünü düşürmeye kadar birçok numara kullanır. Bu bazen kullanıcıları 1990'larda gibi hissettirir.
Nvidia, video akışı kalitesini artırmak ve genel video konferans deneyimini geliştirmek için GPU hızlandırmalı yapay zeka video konferans yazılımından oluşan yeni bir bulut paketi tanıttı.
Bunu nasıl yaptı? Nvidia Maxine nedir?
Nvidia Maxine, servis sağlayıcıların her gün gerçekleşeceği tahmin edilen 30 milyondan fazla web toplantısına yeni AI tabanlı özellikler getirmesini sağlayan bulut tabanlı bir AI video akış platformudur. Bulutta şirketin GPU'sunda yeni bir platform çalıştıran video konferans servis sağlayıcıları, kullanıcılara görünüm düzeltme, süper çözünürlük, gürültü azaltma, yüz tanıma ve daha fazlası dahil olmak üzere yeni AI efektleri sunabilir.
Nvidia Maxine’in en iyi özelliklerinden biri nedir?
Video konferans görüşmelerinin verileri yerel cihazları yerine bulutta işlendiğinden, son kullanıcılar özel donanıma ihtiyaç duymadan tüm yeni özelliklerin keyfini çıkarabilir.
Ayrıca, Nvidia Maxine görüntülü görüşmeler için gereken bant genişliğini önemli ölçüde azaltabilir. Yapay zeka yazılımı, bir arama sırasında her bir kişinin kilit noktalarını analiz eder ve ardından diğer taraftaki videodaki yüzü akıllıca yeniden canlandırır. Nvidia GPU üzerinde çalışan yeni AI tabanlı video sıkıştırma teknolojisi ile geliştiriciler, video bant genişliği tüketimini H.264 video sıkıştırma standardının gereksinimlerinin onda birine kadar azaltabilir. Bu yalnızca sağlayıcıların maliyetlerini düşürmekle kalmaz, aynı zamanda ideal internet hızlarından daha düşük hızlara sahip olan kullanıcılara daha akıcı video konferans sağlar.
Maxine ayrıca, servis sağlayıcılar Nvidia'nın çekişmeli üretici ağlara (GAN'lar) yönelik araştırmalarından yararlanabileceğinden ve bir dizi yeni özellik sunduğundan, video konferansın daha kişisel bir konuşma gibi hissettirilmesine yardımcı olacak. Bazıları, yüzlerini bir konuşma sırasında birbirleriyle yüz yüze görünecek şekilde hizalamayı, göz temasını simüle etmeye yardımcı olan bir vizyon düzeltmesini ve gerçek zamanlı olarak sesleri ve duygusal tonlarıyla otomatik olarak kontrol edilen gerçekçi animasyonlarla animasyonlu avatarları içerir.
Nvidia Jarvis SDK ile geliştiriciler, konuşma tanıma, dil anlama ve konuşma oluşturma için son teknoloji yapay zeka dil modellerini kullanan sanal asistanları bile entegre edebilir. Bu sanal asistanlar, insan benzeri sesler kullanarak notlar alabilir, görevler ayarlayabilir ve soruları yanıtlayabilir. Aynı zamanda çeviriler, altyazılar ve transkriptler gibi diğer AI konuşma hizmetleri, katılımcıların bir çağrı sırasında ne hakkında konuştuklarını bilmelerine yardımcı olur.
AI ile bir video konferans denemek ister misiniz?