„ChatGPT“ ги измамил универзитетските професори: Дури 94 отсто од испитите решени со вештачка интелигенција поминале незабележано и со подобри оценки од вистинските студенти

Точка

28/06/2024

14:44

2.936

Големина на фонт

а а а

Постапката на оценување на испитите во образовниот систем се наоѓа на пресвртница, откако големото британско истражување открило дека „ChatGPT“ е способен да ги измами дури и универзитетските професори.

Универзитетските испити се соочени со нов предизвик со оглед на тоа дека 94 проценти од поднесоците креирани со помош на „ChatGPT“ останале неоткриени, често постигнувајќи повисоки оценки од реалните студентски трудови.

Питер Скарф од британскиот Универзитет во Ридинг го водел истражувањето во кое „ChatGPT“ генерирал одговори за 63 прашања за проценка во курсеви по психологија. Тие испити, кои се полагале од дома, дозволувале пристап до белешки и референци, иако употребата на вештачката интелигенција не била дозволена. Истражувањето е објавено во списанието „PLoS One“.


Одговорите генерирани од вештачката интелигенција, кои претставувале 5 проценти од вкупните скрипти, биле помешани со реални трудови на учениците. Оценувачите, несвесни дека оценуваат трудови на 33 фиктивни ученици, ги оценувале и кратките одговори и подолгите есеи. Прашањата за „ChatGPT“ почнувале со вклучување на референци на академска литература, но не и одвоен референтен дел, по што следело испитно прашање.

Само 6 проценти од одговорите на вештачката интелигенција биле означени како сомнителни, а некои модили немале означена работа од вештачката интелигенција. Во просек, одговорите на „AI“ добиле повисоки оценки од нашите реални студентски одговори, вели Скарф иако резултатите варирале по модулите. И покрај борбата на „AI“ со апстрактното размислување, дури 83,5 проценти од предадените трудови на „AI“ ги надминале студентските трудови.


Значајно истражување

Ова истражување се смета за најголемо и најдобро од тој тип, предизвикувајќи загриженост и надвор од одделот за психологија на Ридинг. Немам причини да мислам дека другите предметни подрачја не би имала исти видови на проблеми, истакнува Скарф.

Томас Ланкастер од „Imperial College“ во Лондон дели слична загриженост. Резултатите го покажуваат тоа што очекував да го видам. Знаеме дека генеративна вештачка интелигенција може да произведе разумно звучно одговори на едноставни, ограничени текстуални прашања, рекол Ланкастер.


Товарот за откривање на содржините од генеративната вештачка интелигенција е значаен. Малку веројатно е дека маркерите на прашањата со кратки одговори под притисокот на времето ќе започне случаи на лошо однесување на „AI“, нагласува Ланкастер и додава дека се сомнева дека и други институции се соочуваат со лични предизвици.

Занимавањето со проблемот за користење на вештачка интелигенција на испитите и универзитетските задачи е клучно. Скарф предлага пристап на ниво на цел сектор. Мислам дека секторот како целина мора да го признае фактот дека ќе мораме да вградиме „AI“ во оценките кои им ги даваме на нашите ученици, вели тој.

Со оглед на тоа дека решавањето на проблемот на неговиот извор е речиси невозможно, повторно разгледување на стратегија за оценување станува клучно.




Спонзорирани линкови

Маркетинг