Hej, tu Patryk!
A to pierwsze zestawienie newsów ze świata AI w grudniu! 🎄
Dzisiaj naprawdę ogromna dawka newsów, tak dużego wydania jeszcze nie było 🤯 Więc przechodzimy do nich od razu, miłego czytania!
Alibaba wprowadza model AI konkurujący z OpenAI
Alibaba wprowadza model QwQ-32B-Preview, oparty na 32,5 miliardach parametrów, jako konkurencję dla systemu o1 od OpenAI. Model charakteryzuje się m.in. możliwością przetwarzania zapytań o długości do 32 tys. tokenów oraz lepszymi wynikami w testach logicznych (AIME) i matematycznych (MATH) w porównaniu do o1-preview i o1-mini. Dzięki udostępnieniu pod licencją Apache 2.0, QwQ-32B-Preview wyróżnia się otwartością, co może wpłynąć na rozwój projektów AI w społeczności open-source.
AI zmienia zakupy na Black Friday 2024
Na Black Friday 2024 prawie połowa amerykańskich konsumentów planuje skorzystać z narzędzi AI, takich jak asystenci zakupowi i generatywne AI, by wyszukiwać najlepsze ceny, zbierać informacje o produktach oraz inspirować się pomysłami na prezenty. Trend ten jest szczególnie popularny wśród Millenialsów, a wzrost zakupów online – napędzany zwłaszcza przez starszych kupujących – sugeruje dalsze przeniesienie aktywności zakupowej do internetu. Detaliści, tacy jak Walmart i Amazon, aktywnie odpowiadają na te zmiany, wprowadzając narzędzia AI do wsparcia konsumentów, co może wpłynąć na sposób, w jaki użytkownicy eksplorują oferty i podejmują decyzje zakupowe.
https://www.askattest.com/blog/articles/ai-will-play-an-important-role-in-black-friday-2024
Nowy asystent prawny – CoCounsel z modelem o1-mini
Thomson Reuters wprowadza swojego asystenta prawnego CoCounsel opartego na modelu OpenAI o1-mini, ukierunkowanego na precyzyjną analizę dokumentów i wykrywanie subtelnych niuansów prawnych. Rozwiązanie łączy modele od OpenAI, Google (Gemini) i Anthropic. Każdemu przypisane są określone zadania – od generowania treści po integrację z dużymi dokumentami i analizy wymagające dużej wrażliwości. Podejście to, wspierane własnymi modelami Thomson Reuters oraz infrastrukturą AWS, usprawnia kluczowe procesy prawnicze, podkreślając trend w kierunku specjalizowanych systemów AI w branży korporacyjnej.
https://venturebeat.com/ai/thomson-reuters-cocounsel-redefines-legal-ai-with-openais-o1-mini-model/
Duża inwestycja w niemiecki startup Black Forest Labs?
Black Forest Labs, niemiecki startup AI współpracujący z projektem Grok Elona Muska w generowaniu obrazów, rozmawia z Andreessen Horowitz o dofinansowaniu wynoszącym 200 milionów USD. Potencjalna inwestycja wyceniłaby firmę na ponad 1 miliard USD.
StableAnimator – niesamowite narzędzie do animacji
StableAnimator to narzędzie wykorzystujące model dyfuzyjny do generowania wysokiej jakości animacji osób, zachowując ich tożsamość bez potrzeby stosowania post-processingu, takiego jak face-swapping. Projekt wprowadza unikalne podejście, integrując globalny Face Encoder i dystrybucyjny ID Adapter, aby unikać zakłóceń między klatkami i zwiększać spójność cech tożsamościowych.
https://francis-rings.github.io/StableAnimator
AI zwiększa wydajność, ale obniża satysfakcję z pracy naukowców
Badania nad integracją AI w pracy naukowców ujawniły, że sztuczna inteligencja dramatycznie podnosi wydajność – np. naukowcy odkryli o 44% więcej materiałów, zwiększając innowacje i ilość nowych patentów. Jednak “automatyzacja myślenia” w fazie generowania pomysłów odbiera badaczom “zabawę”, obniżając ich satysfakcję z pracy również o 44%.
https://www.strangeloopcanon.com/p/when-we-become-cogs
Personalizowane style odpowiedzi w Claude
Anthropic wprowadza do Claude.ai funkcję personalizowanych stylów odpowiedzi, umożliwiając użytkownikom dopasowanie komunikacji AI do ich preferencji. Wśród gotowych opcji znajdują się style formalny, zwięzły i wyjaśniający, a dodatkowo użytkownicy mogą tworzyć własne style przez przesyłanie przykładów treści i precyzowanie wymagań.
https://www.anthropic.com/news/styles
Strasze modele LLM grają w szachy lepiej niż nowsze
Badania nad grą w szachy dużych modeli językowych (LLM) wskazują, że modele takie jak gpt-3.5-turbo-instruct
osiągają poziom zaawansowanego amatora (~Elo 1750), przewyższając bardziej zaawansowane modele, m.in. gpt-4o
. Kluczowe wnioski sugerują, że skuteczność LLMów w szachach zależy od jakości danych szkoleniowych (np. PGN z partiami graczy o Elo >1800) i sposobu interakcji z modelem; eksperymenty z ulepszonymi promptami oraz przykładami “w kontekście” znacząco poprawiają wydajność. Natomiast ograniczenia związane z dostrojeniem na potrzeby interfejsów czatu oraz problemy z integracją czysto szachowych danych pozostają barierą, która zmniejsza przełożenie potencjału bazowych modeli na grywalne interfejsy.
https://dynomight.net/more-chess
Nowa funkcja ElevenLabs – tworzenie podcastów z tekstów i wideo
ElevenLabs wprowadziło funkcję GenFM, umożliwiającą automatyczne tworzenie wielogłosowych podcastów na podstawie przesłanych treści, takich jak wideo z YouTube, teksty czy dokumenty. Funkcja dostępna w aplikacji ElevenLabs Reader na iOS obsługuje 32 języki i generuje realistyczne dialogi, uwzględniając naturalne pauzy i przejawy ludzkiej mowy, np. „hmm” czy śmiech. Wyróżnia się na tle rozwiązań takich jak Google NotebookLM, oferując większą personalizację i integrację multimediów, co może wpłynąć na sposób, w jaki użytkownicy tworzą i konsumują treści.
Amazon wspiera rozwój AI – Claude zyska na współpracy z AWS
Amazon ogłosił strategiczne partnerstwo z Anthropic, inwestując w rozwój Claude, ich konkurencyjnego modelu AI do przetwarzania języka. W ramach współpracy Claude zostanie mocniej zintegrowany z infrastrukturą AWS, co może przyspieszyć adopcję zaawansowanych modeli językowych przez klientów cloudowych Amazonu. Ten ruch wzmacnia pozycję obu firm na coraz bardziej zatłoczonej scenie AI.
https://www.nytimes.com/2024/11/22/technology/amazon-anthropic-ai.html
Uber wchodzi na rynek sztucznej inteligencji – nowa platforma dla firm
Uber rozszerza swoją działalność o sektor sztucznej inteligencji, oferując programistów w modelu gig economy w ramach nowej inicjatywy Scaled Solutions. Platforma ta umożliwia firmom zewnętrznym, w tym klientom takim jak Aurora Innovation i Niantic, dostęp do specjalistów zajmujących się m.in. oznaczaniem danych czy treningiem modeli AI. Przyciągając freelancerów z USA, Kanady, Polski i Indii, Uber wchodzi na rynek outsourcingu AI, co może zmienić dynamikę dostępu do adnotacji danych dla firm rozwijających sztuczną inteligencję.
Spotify i Google łączą siły – łatwiejsze odtwarzanie muzyki
Gemini integruje się z Gemini! Użytkownicy Gemini mogą wydawać polecenia do odtworzania, wyszukiwania czy przeglądania utworów na Spotify, pod warunkiem powiązania konta Spotify z Google i posiadania subskrypcji Premium. Rozszerzenie działa obecnie wyłącznie w języku angielskim i nie obejmuje tworzenia playlist ani funkcji w aplikacjach Gemini na iOS czy Web.
https://9to5google.com/2024/11/26/spotify-gemini-extension/
Roboty w fabrykach BMW – jak sobie radzą?
Video przedstawiające humanoidalnego robota Figure testowanego na linii produkcyjnej BMW.
Jak AI pomaga tworzyć nowe smaki na rynku?
Singapurski startup Ai Palette wykorzystuje sztuczną inteligencję do przekształcania przemysłu badań rynkowych, oferując predykcyjne analizy trendów w czasie rzeczywistym. Jego platforma, analizując ponad 61 miliardów danych z 24 krajów, pomaga gigantom FMCG, takim jak Nestlé, PepsiCo czy Kellogg, tworzyć lokalne produkty, np. płatki o smaku kalmarów. Dzięki wsparciu inwestorów VC i technologii AI, firma ułatwia markom przewidywanie dynamicznie zmieniających się gustów konsumentów, zmieniając strategię wprowadzania produktów na rynki globalne i lokalne.
AI Earth Copilot od NASA – łatwiejszy dostęp do danych o Ziemi
NASA, we współpracy z Microsoftem, uruchamia Earth Copilot — narzędzie AI do łatwego dostępu i interpretacji geograficznych danych naukowych. Chatbot uprości zapytania, takie jak wpływ huraganu na konkretne regiony czy zmiany jakości powietrza, łącząc dane z rozległych zbiorów NASA. Początkowo dostępny dla naukowców, system ma potencjał, by zautomatyzować analizę dużych zbiorów danych i poszerzyć ich dostępność dla użytkowników spoza środowiska badawczego.
https://www.theverge.com/2024/11/14/24296758/nasa-ai-earth-copilot-microsoft
Orbit – nowa era wirtualnej rzeczywistości?
Orbit to prototypowy interfejs mózg-komputer, który działa bezinwazyjnie, stymulując mózg z zewnątrz za pomocą niewielkich patchy do noszenia za uchem. Docelowo urządzenie ma współpracować z nowymi zestawami VR/AR, wpływając na zmysły użytkownika – od odczuć motorycznych po emocjonalne – w celu eliminacji np. „VR Motion sickness”. Oczekiwana premiera rynkowa to 2026, a koszt w granicach kilkuset dolarów.
https://twitter.com/Scobleizer/status/1857205569788301795
Thrive AI – asystent zdrowotny dla lepszego życia
Sam Altman i Arianna Huffington zaprezentowali wczesną wersję swojego asystenta zdrowotnego Thrive AI, który ma wspierać zdrowszy tryb życia poprzez personalizowane porady dotyczące snu, odżywiania, aktywności fizycznej i zarządzania stresem. Demo oparte na interfejsie w stylu ChatGPT pozwala użytkownikom wprowadzać dane zdrowotne, takie jak wiek lub waga, ale funkcjonalność jest jeszcze ograniczona. Projekt, wspierany przez fundusz startupowy OpenAI i Thrive Global Huffington, mierzy się z technologicznymi i regulacyjnymi wyzwaniami, jednocześnie zwiększając oczekiwania wobec AI w sektorze zdrowia.
Nowe narzędzia Anthropic – łatwiejsze tworzenie promptów dla AI
Anthropic wprowadził zestaw narzędzi, w tym funkcję “Prompt Improver” i system zarządzania przykładami, które automatyzują oraz ulepszają proces tworzenia promptów dla modeli AI, takich jak Claude. Narzędzia te pomagają deweloperom zwiększyć precyzję wyników o 30%, stosując praktyki takie jak „chain-of-thought reasoning”, a także umożliwiają łatwe dostosowanie promptów między różnymi platformami AI. Rozwiązanie skierowane do firm upraszcza wdrożenia AI, zapewniając większą spójność odpowiedzi i elastyczność w integracji z kluczowymi procesami biznesowymi.
Musk kontra OpenAI i Microsoft – spór o dominację AI
Elon Musk rozszerzył pozew przeciwko OpenAI, wskazując na Microsoft jako kluczowego pozwanego, obok m.in. współzałożyciela LinkedIn Reida Hoffmana oraz byłych członków zarządu OpenAI. Musk zarzuca firmie monopolizację rynku generatywnej AI przy wsparciu technologii Microsoftu i „de facto fuzję” korzystną wyłącznie dla wybranych graczy. Twierdzi także, że umowy OpenAI z Microsoftem ograniczyły rynek dla konkurentów, takich jak jego xAI, i sugeruje, że działania OpenAI były sprzeczne z jej pierwotną misją non-profit.
https://techcrunch.com/2024/11/14/musks-amended-lawsuit-against-openai-names-microsoft-as-defendant/
Personalizowane boty głosowe od ElevenLabs
ElevenLabs udostępniło nową platformę do tworzenia konwersacyjnych agentów AI, umożliwiając programistom personalizację tonacji głosu, długości odpowiedzi oraz modelu językowego (np. GPT, Gemini, Claude). Rozwiązanie pozwala na integrację własnych baz wiedzy i modeli, oferując zestaw narzędzi kompatybilnych z popularnymi językami programowania oraz WebSocket API dla zaawansowanych konfiguracji. Dzięki wsparciu text-to-speech oraz wstępnie zdefiniowanym szablonom, firma celuje w uproszczenie wdrożenia konwersacyjnych botów, jednocześnie konkurując z liderami rynku, takimi jak OpenAI, Google czy Amazon.
https://techcrunch.com/2024/11/18/elevenlabs-now-offers-ability-to-build-conversational-ai-agents/
Musk prosi o dane zdrowotne użytkowników X?
Elon Musk zachęcił użytkowników platformy X do przesyłania danych medycznych, takich jak zdjęcia rentgenowskie czy rezonanse magnetyczne, do Grok, firmowego chatbota AI, w celu diagnostyki. Choć narzędzie zebrało mieszane opinie co do trafności wyników, propozycja wywołała obawy ekspertów z zakresu prywatności, którzy wskazują na ryzyko związane z udostępnianiem wrażliwych danych osobowych bez pełnej klarowności na temat ich dalszego wykorzystania. Ruch ten wydaje się wpisywać w trend rosnącej roli AI w opiece zdrowotnej, choć wiąże się z istotnymi wyzwaniami etycznymi i prawnymi.
https://www.nytimes.com/2024/11/18/well/x-grok-health-privacy.html
FLUX.1 Tools – nowe możliwości edycji obrazów
FLUX.1 Tools to zestaw modeli rozszerzających funkcjonalność bazowego modelu text-to-image FLUX.1, umożliwiający precyzyjną edycję i przekształcanie obrazów rzeczywistych i generowanych.
https://blackforestlabs.ai/flux-1-tools/
Szybkie wykrywanie guzów mózgu – nowa pomoc dla chirurgów
Badacze z Uniwersytetu Michigan i UCSF opracowali model AI FastGlioma, który w ciągu 10 sekund wykrywa pozostawione po operacji fragmenty guzów mózgu, trudne do zidentyfikowania tradycyjnymi metodami. Wykorzystując Stimulated Raman Histology i dane z 11 000 próbek, osiąga 90-92% dokładności, oferując chirurgom sposób na bardziej precyzyjne usunięcie zmian nowotworowych. Open-source’owy charakter technologii może przyspieszyć jej adaptację w diagnostyce innych nowotworów, od płuc po prostatę, potencjalnie poprawiając wyniki leczenia i jakość życia pacjentów.
https://newatlas.com/brain/fastglioma-ai-identifies-brain-tumors
Gemma Scope – jak lepiej zrozumieć decyzje AI?
Google DeepMind opracowało Gemma Scope – narzędzie, które pozwala badaczom na lepsze zrozumienie procesów decyzyjnych modeli AI. Wykorzystując tzw. „rzadkie autoenkodery”, narzędzie pozwala analizować, jak sieci neuronowe identyfikują i przetwarzają wzorce w danych, co otwiera drzwi do precyzyjniejszej kontroli i redukcji błędów, takich jak uprzedzenia czy fałszywe wnioski.
Nowa funkcja ChatGPT na Macu – łatwiejsza praca z kodem
OpenAI wprowadziło funkcję „Work with Apps” w aplikacji ChatGPT dla macOS, umożliwiającą czytanie kodu z wybranych narzędzi deweloperskich, takich jak Xcode, VS Code czy Terminal. Dzięki integracji przez API dostępności macOS, użytkownicy mogą udostępniać do 200 lini kodu bez potrzeby kopiowania i wklejania, co usprawnia współpracę AI z kodem w czasie rzeczywistym. Funkcja, dostępna na razie dla Plus i Teams.
https://techcrunch.com/2024/11/14/chatgpt-can-now-read-some-of-your-macs-desktop-apps/
DeepL Voice – tłumaczenia na żywo
DeepL wprowadza funkcję DeepL Voice, umożliwiającą tłumaczenie w czasie rzeczywistym mowy oraz wideo na tekst w 33 językach, z obsługą audio wejściowego w 13 z nich. Wykorzystując własny model językowy zoptymalizowany do tłumaczeń, usługa wyróżnia się brakiem opóźnień, co czyni ją szczególnie użyteczną w spotkaniach na żywo czy wideokonferencjach, gdzie napisy pojawiają się w czasie rzeczywistym.
AI ma problemy z matematyką – FrontierMath ujawnia słabości
Benchmark FrontierMath, opracowany przez Epoch AI we współpracy z ponad 60 matematykami, ujawnia ogromne ograniczenia współczesnych modeli AI w zaawansowanym rozwiązywaniu problemów matematycznych. W przeciwieństwie do wcześniej stosowanych zestawów testowych, takich jak GSM-8K czy MATH, gdzie modele osiągają ponad 90% skuteczności, FrontierMath zawiera nowe, badawcze zagadnienia wymagające głębokiego rozumowania i kreatywności – aktualne systemy, w tym GPT-4o i Gemini 1.5 Pro, rozwiązują poniżej 2%. Matematyka na tym poziomie obnaża trudności AI w logicznym, wieloetapowym rozumowaniu, stawiając prognozę, że pokonanie tego wyzwania może radykalnie zmienić sposób, w jaki postrzegamy zdolności maszyn do kompleksowej analizy i odkryć.
Roboty chirurgiczne uczą się operować dzięki AI
Naukowcy z Johns Hopkins i Stanford University stworzyli model uczenia przez naśladownictwo, który pozwala robotom chirurgicznym – w tym systemowi da Vinci – precyzyjnie odtwarzać techniki operacyjne po obejrzeniu nagrań procedur. Nowy system, wykorzystujący zasady sztucznej inteligencji stosowanej w ChatGPT, przekształca dane wizualne w ruchy robota, umożliwiając naukę nawet z ograniczonej liczby przykładów i szybkie rozszerzanie robotycznych możliwości.
https://interestingengineering.com/innovation/robot-nails-surgery-lik-human-doctor
LucidSim z MIT – Nowoczesne treningi dla robotów w wirtualnym świecie
Naukowcy z MIT opracowali system LucidSim, który wykorzystuje generatywne modele AI i symulator fizyki do tworzenia realistycznych, wirtualnych środowisk szkoleniowych dla robotów. W testach robot-pies nauczył się z powodzeniem pokonywać przeszkody, takie jak schody czy skrzynie, osiągając znacznie lepsze wyniki niż systemy oparte na tradycyjnych symulacjach. Rozwiązanie to, bazujące na danych wygenerowanych wyłącznie przez AI, ma potencjał do szkolenia robotów w wirtualnych światach, co może znacząco przyspieszyć rozwój zarówno robotyki, jak i algorytmów dla autonomicznych systemów.
Czy nowy model OpenAI zrewolucjonizuje AI?
OpenAI zamierza wprowadzić model o nazwie roboczej Orion (prawdopodobnie GPT-5), ale jego wydajność nie spełnia oczekiwań postawionych przez skalę przejścia między poprzednimi generacjami. Skalowanie opierające się na większej liczbie parametrów i mocy obliczeniowej wydaje się osiągać swoje granice, co potwierdzają prognozy naukowców takich jak Gary Marcus. OpenAI eksperymentuje teraz z alternatywnym podejściem, jak o1, korzystającym z obliczeń w czasie rzeczywistym, jednak wysoka złożoność i koszty wzbudzają wątpliwości co do opłacalności i praktyczności tego kierunku.
https://www.thealgorithmicbridge.com/p/gpts-are-maxed-out
Czy warto uczyć się kodować w erze AI?
Yossi Matias, szef badań w Google, uważa, że nauka kodowania wciąż pozostaje kluczową umiejętnością, mimo rosnącej roli AI w automatyzacji niektórych zadań programistycznych. Porównał podstawy programowania do matematyki, podkreślając, że nawet jeśli AI generuje obecnie spory procent kodu, to nadal wymaga on przeglądu i akceptacji przez inżynierów. Matias wskazał, że AI nie tylko wspiera programowanie, ale także transformuje dziedziny takie jak medycyna czy edukacja, co czyni zrozumienie podstaw technologii nieodzownym, nawet dla tych, którzy nie zamierzają zostać programistami.
https://www.yahoo.com/tech/googles-head-research-whether-learn-100201904.html
Czy AI zagrozi kreatywności w filmach? Ben Affleck mówi nie
Ben Affleck, występując na CNBC Delivering Alpha, ocenił rolę AI w branży filmowej jako wspomagającą, ale nie zagrażającą ludzkiej kreatywności. Według niego AI może uprościć kosztowne i powtarzalne aspekty produkcji, obniżając bariery wejścia i ułatwiając debiuty twórców, lecz pozostaje ograniczona do imitacji istniejących wzorców bez zdolności do tworzenia rzeczywistej sztuki. Podkreślił, że kluczowe dla filmów jest emocjonalne zaangażowanie oraz smak artystyczny, które, jak twierdzi, wciąż są poza możliwościami algorytmów.
https://movieweb.com/ben-affleck-ai-role-in-hollywood
AI wymaga porządku w kodzie
Generatywna AI zwiększa koszty utrzymania długu technicznego, znacząco pogłębiając różnicę w tempie pracy między środowiskami z „niskim” a „wysokim” długiem. Narzędzia AI, takie jak Cursor czy Aider, świetnie przyspieszają pracę z dobrze zorganizowanym kodem, ale gorzej radzą sobie z legacy code pełnym skomplikowanych zależności i nieprzewidywalnych wzorców.
https://www.gauge.sh/blog/ai-makes-tech-debt-more-expensive
Etyka AI – Jak dbać o przyszłą świadomość maszyn?
Anthropic zatrudniło Kyle’a Fisha jako swojego pierwszego badacza ds. dobrostanu AI, sygnalizując zainteresowanie pytaniami etycznymi wokół prawdopodobnej przyszłej świadomości AI. Fish dołączył do zespołu badającego „dopasowanie” (alignment), aby rozwijać wytyczne dotyczące potencjalnego traktowania zaawansowanych systemów AI, które mogą wykazywać cechy takie jak świadomość. Debata ta, choć kontrowersyjna, stawia nowe wyzwania związane z moralnym status quo, ryzykiem błędnej antropomorfizacji systemów oraz zarządzaniem ich potencjalnym wpływem społecznym.
https://arstechnica.com/ai/2024/11/anthropic-hires-its-first-ai-welfare-researcher
Nowe narzędzie AI generuje kompletne genomy od podstaw
Nowe narzędzie AI, trenowane na danych dotyczących ewolucji DNA, zostało opracowane do generowania kompletnych genomów od podstaw. Model bazuje na analizie biologicznych wzorców ewolucyjnych, co pozwala na syntetyczne tworzenie sekwencji genomowych uwzględniających naturalną strukturę i funkcjonalność. To podejście może znacząco usprawnić badania w dziedzinach takich jak biotechnologia, ewolucja i medycyna precyzyjna, oferując nowe perspektywy w projektowaniu genetycznym.
https://www.science.org/content/article/meet-evo-dna-trained-ai-creates-genomes-scratch
Nowe centrum danych Elona Muska – wyścig w AI z Teslą
Elon Musk’s xAI planuje zebrać do 6 miliardów dolarów, aby zakupić 100,000 procesorów Nvidia, które będą zasilać centrum danych w Memphis. Kluczowe finansowanie pochodzi z funduszy suwerennych Bliskiego Wschodu i innych inwestorów, a nowa infrastruktura ma wspierać rozwój superkomputera wspieranego przez Teslę.
Google tworzy narzędzie AI do interaktywnej nauki
Google wprowadziło eksperymentalne narzędzie AI o nazwie Learn About, bazujące na modelu LearnLM, które prezentuje bardziej interaktywne, edukacyjne odpowiedzi niż tradycyjne chatboty, takie jak Gemini. System integruje elementy wizualne oraz „kafelki” w stylu podręczników („dlaczego to ważne” czy „rozbuduj słownictwo”), oferując dodatkowe tematy do zgłębiania w bocznych panelach. Dzięki naciskowi na edukację i kontekst, Learn About może znaleźć zastosowanie w nauczaniu i eksploracji nowych tematów, wykraczając poza proste podawanie faktów.
https://www.theverge.com/2024/11/11/24293891/google-learn-about-ai-search-educational
Nowoczesny edytor kodu AI – Supermaven i Cursor łączą siły
Supermaven, twórca zaawansowanych modeli ułatwiających programowanie, dołącza do Cursor, aby wspólnie rozwijać jeszcze bardziej funkcjonalny edytor kodu oparty na sztucznej inteligencji. Dotychczasowe narzędzia Supermaven, takie jak wtyczki do VS Code, JetBrains i Neovim, będą nadal utrzymywane i usprawniane, a integracja z Cursor pozwoli na połączenie technologii modeli o długim kontekście z nowymi możliwościami projektowania interfejsu edytora. Współpraca ma na celu przezwyciężenie ograniczeń istniejących API i dostarczenie użytkownikom bardziej intuicyjnych oraz wydajnych rozwiązań.
https://supermaven.com/blog/cursor-announcement
Jak ożywić portrety dzięki X-Portrait 2?
X-Portrait 2 to zaawansowany model animacji portretowych, który bazuje na encoderach ekspresji oraz generatywnych modelach dyfuzji, pozwalając na przenoszenie nawet najsubtelniejszych ruchów twarzy i złożonych emocji z wideo na statyczne obrazy. Kluczową zaletą jest oddzielenie wyglądu od ruchu, co umożliwia adaptację zarówno do realistycznych portretów, jak i grafik w stylu kreskówkowym, otwierając szerokie zastosowania w animacji, tworzeniu postaci czy efektach wizualnych. W porównaniu do innych rozwiązań, model wyróżnia się precyzją w odwzorowywaniu niuansów mimiki, co czyni go przydatnym w produkcji wysokiej jakości treści.
https://byteaigc.github.io/X-Portrait2
Jak USA chce konkurować z Chinami w AI?
OpenAI przedstawiło plany dotyczące amerykańskiej strategii AI, obejmujące tworzenie stref gospodarczych AI, wykorzystanie doświadczeń US Navy w technologii reaktorów jądrowych oraz projekty rządowe finansowane przez prywatnych inwestorów. Firma proponuje również sojusz AI obejmujący kraje Ameryki Północnej, aby konkurować z rosnącym potencjałem AI w Chinach. Dodatkowo zapowiedziano inwestycje w infrastrukturę energetyczną, centra danych oraz wsparcie dla badań regionalnych, wskazując na Środkowy Zachód i Południowy Zachód USA jako kluczowe obszary rozwoju technologicznego.
Ciekawe przykłady użycia Computer Use od Anthropic
Ten wątek na Twitterze przedstawia ciekawe przykłady użycia Computer Use od Anthropic. Niektóre są naprawdę zaskakujące, jak np. rozwiązywanie Captcha.
https://twitter.com/CodeByPoonam/status/1856738528513913235
Daisy – chatbot, który oszukuje telefonicznych naciągaczy
Virgin Media O2 zaprezentowało Daisy, AI chatbot stylizowany na starszą panią, która w czasie rzeczywistym angażuje oszustów w rozmowy telefoniczne, celowo marnując ich czas i zasoby. Daisy wykorzystuje mieszankę modeli językowych i technologii syntezy głosu, by prowadzić rozmowy pełne anegdot o kotach czy robótkach ręcznych, jednocześnie udając „łatwy cel” wrażliwego seniora. Oparta na analizie przez profesjonalnych scambaiterów, takich jak YouTuber Jim Browning, pomaga ograniczyć skalę oszustw, a także edukować użytkowników o taktykach oszustów, zwiększając ogólną świadomość zagrożeń cyfrowych.
Dzięki za przeczytanie! 💪
Dodaj komentarz