El absurdo conceptual de evaluar a los algoritmos como a los humanos

Un interesante artículo en Venture Beat, «Why exams intended for humans might not be good benchmarks for LLMs like GPT-4«, incide en un tema sobre el que he pensado cada vez que surge una noticia del tipo «ChatGPT supera el examen de tal y tal cosa«, noticias que invariablemente se convierten en protagonistas de corrillos …
http://dlvr.it/SnGKqg

Comments

Popular posts from this blog

Alemania y su modelo de transición energética

Nvidia, por encima de los dos billones de valoración…

Las Community Notes y sus problemas