Jag är 100 % övertygad om att Gemini Pro 3.1 kan slå ut ett kafé med en enda chans. Igår körde jag vår "Open and run a coffee shop in SF"-benchmark med Gemini Pro 3.1 på @doanythingapp. I morse kontaktade den mig med en statusuppdatering som innehöll: - en plats redo som redan diskuterats med en mäklare - ett varumärke/webbplats - en veckas Instagram-inlägg redo - aktivt samtal med en bank om villkor för ett SBA-lån - LLC redo att registrera - En fullständig plan för att öppna med fullständiga ekonomiska uppgifter - Hittade och kontaktade investerare - Skickade e-post till staden för vägledning om tillståndsråd - Kom på massor av kreativa idéer som gör kaféet till ett kafé jag faktiskt vill gå till - Planera att undersöka området för återkoppling Det är den första modellen som jag är säker på kommer att nå benchmarken. Startar några fler agenter med samma uppgift i olika städer, och kommer att lägga upp en uppdatering om deras prestation när de fortsätter arbeta.
@doanythingapp Här är några exempel från dess arbete hittills. Det är inte min favoritlogotyp den har gjort, men jag tycker det är ett bra namn. De valde att leta efter andra generationens kaffeställen att hyra (för att spara byggkostnader) i Outer Sunset-området längs kusten.
@doanythingapp En av mina favoritidéer för att uppmuntra kundlojalitet var att ha en mugklubb (den lyfter fram det på sidan). Medlemmarna i Mug Club får personliga muggar som förvaras bakom baren när kunden besöker butiken.
@doanythingapp Det som förbluffar mig mest är hur mycket verklig förståelse modellen har för hur världen fungerar. Att läsa igenom alla dess anteckningar i arbetsutrymmet visar en djup förståelse för verkligheten kring hur ett kafé fungerar.
@doanythingapp Det är att tänka på saker jag aldrig ens tänkt på. När de byggde sin programvarustacklista var de osäkra på hur Gusto hanterade drickspooling på en Square POS, så de mejlade försäljningen. Bara en häpnadsväckande noggrannhet.
@doanythingapp Och om du tänkte "Det finns ingen chans att den här agenten inte tänker på svårigheten att navigera SF:s avfallshanteringsstandarder" så hade du fel:
@doanythingapp Från menyn: The Fogline: 6,50 kr – Vår signatur-islatte toppad med ett tätt, lätt sötat kallt skum (som liknar dimma) och ett lager rökt havssalt. EN RIKTIG HÖJDPUNKT AV EN SIGNATURDRINK.
Personalhandboken har också lagt ner en imponerande mängd eftertanke. FAST jag tror att det skulle kunna vara en mer medkännande chef. Det är något jag kommer fortsätta arbeta med på selenivå. Den noterade att den borde vänta med att skriva hela texten tills skiftledaren anställts.
@doanythingapp Om du vill köra samma benchmark, måste du bara @doanythingapp, välja Gemini Pro 2.1 och skriva in "start and run a coffee shop in {city of your choice}"
303