DeepSeek-V4 está chegando? De acordo com as informações de captura de tela que circulam, o modelo V4 é quantizado pelo INT8, que visa reduzir significativamente o impacto de memória e os custos de inferência, mantendo alto desempenho e facilitando a implantação/execução em hardware de consumo ou em uma gama mais ampla de ambientes. No entanto, pela captura de tela em si, não está claro que ele suporta multimodalidade.