Google ogłasza nowe generatywne modele AI dla Vertex AI

W świecie generatywnej sztucznej inteligencji Google nie chce pozostać w tyle. Podczas dorocznej konferencji programistów, Google I/O, firma ogłosiła nowe modele sztucznej inteligencji, które będą dostępne w Vertex AI, w pełni zarządzanej usłudze sztucznej inteligencji. Jednym z polecanych szablonów jest Obraz, szablon zamiany tekstu na obraz, który może tworzyć i edytować obrazy, a także pisać podpisy do istniejących obrazów.

Obraz: Twórz obrazy z tekstu

Firma Google opracowała Image jako dostępne narzędzie dla programistów i nie trzeba być naukowcem ani programistą danych, aby z niego korzystać. przez interfejs użytkownika Obraz w VertexUżytkownicy mogą wprowadzać opisy lub „twierdzenia”, takie jak „fioletowa torba”, a formularz wygeneruje kilka kandydujących obrazów na podstawie podanego opisu.

Szablon zapewnia również narzędzia do edycji, które poprawiają tworzone obrazy, takie jak dostosowywanie koloru wyświetlanych obiektów. Ponadto Vertex zapewnia funkcje poprawy jakości obrazu, takie jak próbkowanie w dół w celu poprawy ostrości. Użytkownicy mogą również ustawiać i dostosowywać styl i preferencje szablonu za pomocą funkcji dostrajania.

Generuj tłumaczenia i przestrzegaj prywatności

Oprócz tworzenia obrazów Image ma możliwość tworzenia podpisów dla tworzonych lub istniejących obrazów. Istnieje nawet opcja przetłumaczenia tłumaczenia za pomocą Tłumacza Google. Google zobowiązuje się do przestrzegania przepisów dotyczących prywatności, takich jak Ogólne rozporządzenie o ochronie danych (RODO), i gwarantuje, że wygenerowane obrazy, które nie zostaną zapisane, zostaną usunięte w ciągu 24 godzin, aby zapewnić ochronę prywatności użytkowników.

Wyzwania etyczne i prawne

Chociaż generatywna sztuczna inteligencja ma ogromny potencjał, stwarza również wyzwania etyczne i prawne. Modele, takie jak Image, są szkolone przy użyciu zestawów danych, które często zawierają obrazy zebrane z publicznych witryn internetowych. Może to spowodować problemy z naruszeniem praw autorskich, ponieważ niektóre z tych obrazów mogą być chronione prawem autorskim.

Firma Google przeprowadziła szeroko zakrojone przeglądy zarządzania danymi, aby upewnić się, że jej modele są wolne od roszczeń dotyczących praw autorskich. Jednak kwestia wykorzystania obrazów chronionych prawem autorskim w szkoleniu modeli AI jest nadal przedmiotem dyskusji.

Skoncentruj się na integralności i jakości treści

Google rozumie, jak ważne jest zajmowanie się stronniczymi lub toksycznymi treściami generowanymi przez modele sztucznej inteligencji. W związku z tym wdrożyli środki mające na celu ocenę bezpieczeństwa modeli generatywnych w Vertex AI. Każde wywołanie API do modelu generatywnego jest oceniane pod kątem atrybutów bezpieczeństwa, takich jak toksyczność, przemoc i nieprzyzwoitość. Vertex ocenia modele na podstawie tych atrybutów i oferuje opcje blokowania klientów lub pozwalania im decydować, jak postępować z określonymi kategoriami treści.

Aby jeszcze bardziej rozwiązać ten problem, firma Google ogłosiła wprowadzenie Reinforcement Learning from Human Feedback (RLHF) jako zarządzanej usługi w Vertex AI. Ta technologia uczenia maszynowego umożliwia ulepszanie generatywnych modeli sztucznej inteligencji dzięki bezpośredniej informacji zwrotnej od użytkowników. Klienci mogą oceniać i oceniać odpowiedzi generowane przez model, a następnie usługa uczenia się przez wzmacnianie dostosowuje model, aby generować lepsze odpowiedzi, które są bardziej zgodne z potrzebami organizacji.

Nowe modele i narzędzia w Vertex AI

Jak wspomniano w poprzednich artykułach, oprócz obrazu Google udostępnił niektórym użytkownikom Vertex AI inne modele AI. Jednym z nich jest Codey, który jest odpowiedzią Google na platformę GitHub Copilot. kody Możesz generować kod w ponad 20 językach programowania, w tym Go, Java, JavaScript, Python i TypeScript. Ten formularz może sugerować wiersze kodu na podstawie kontekstu tego, co zostało wcześniej napisane, a także może odpowiadać na pytania dotyczące debugowania, dokumentacji i koncepcji programowania wyższego poziomu.

Kolejnym wprowadzonym modelem jest ćwierkanie, model mowy przeszkolony z milionami godzin dźwięku. Chirp obsługuje ponad 100 języków i może być używany do dodawania adnotacji do filmów, zapewniania pomocy głosowej i wykonywania różnych zadań związanych z mową.

Google udostępnił API Embeddings dla Vertex jako wersję testową, która konwertuje dane tekstowe i graficzne na reprezentacje semantyczne zwane wektorami. Ten interfejs API będzie używany do tworzenia możliwości wyszukiwania semantycznego, klasyfikacji tekstu, analizy nastrojów i wykrywania anomalii na podstawie danych przedsiębiorstwa.