PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2024/11/20 15:12:39
Name Charli
File #1 KZ8zTiO.png (198.8 KB), Download : 72
출처 https://x.com/hyunw_kim/status/1858927208469065733
Link #2 https://github.com/Marker-Inc-Korea/Korean-SAT-LLM-Leaderboard?tab=readme-ov-file
Subject [기타] 올해 수능 한개 틀린 AI


1위는 오픈AI의 최신모델인 o1-preview로 올해 수능 한개틀렸다고 합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
及時雨
24/11/20 15:13
수정 아이콘
오 서울대 가겠다
24/11/20 15:16
수정 아이콘
인간시대의 끝이 도래했다
윌슨 블레이드
24/11/20 15:17
수정 아이콘
쟤는 그렇구나 하는데 8등급 맞은건 뭐죠 크크
전기쥐
24/11/20 15:19
수정 아이콘
옛날 gpt 버젼인 3.5요
일면식
24/11/20 15:18
수정 아이콘
어떤과목으로 시험을 봤길래 원점수가 97일까요? 수학은 아니라는건데
전기쥐
24/11/20 15:19
수정 아이콘
본글 짤방 첫 문장을 보니 수능 국어 같네요.
김건희
24/11/20 15:20
수정 아이콘
짤에 국어...라고 적혀 있네요. 흐흐
24/11/20 15:22
수정 아이콘
국어라고 적혀있네요. 인공지능에게 제일 어려울 영역이 국어라고 봤는데 이미 97점이네요
jjohny=쿠마
24/11/20 15:31
수정 아이콘
(수정됨) 오히려 다른 과목보다 국어/영어가 압도적으로 쉬울 겁니다.
LLM(그리고 그 기반이 되는 Transformer)의 기능이 그렇습니다.

수리영역이나 과학영역에 있어서는 상대적으로 허점이 많을 수 있어요.
(수능 사회영역 과목은 제가 시험본 적이 없어서 잘 모르고요)
24/11/20 15:34
수정 아이콘
사탐은 배경지식이 입력된상태면 만점나올겁니다.
jjohny=쿠마
24/11/20 15:46
수정 아이콘
기본적인 한국어 fine tuning 외에 배경지식을 추가로 학습시킨 건 약간 컨닝 같긴 한데...
배경지식 학습이라는 전제가 있다면 과탐보다 사탐 만점이 더 쉽겠네요.
모링가
24/11/20 18:22
수정 아이콘
학생들이 하는 공부가 정확하게 그거랑 같죠
호드람
24/11/20 15:20
수정 아이콘
와 이정도면 수능시험볼때, 안경에 초소형 통신 가능한 카메라, 귀에 초소형 통신용 이어폰 달아서,
이미지 바로 gpt에 쏴주고 답안 바로 음성으로 알려주면 되는거 아닌가요?
24/11/20 15:35
수정 아이콘
걸리지만 않으면 가능합니다(!?)
마틴루터킴
24/11/20 15:37
수정 아이콘
그 아이템이면 gpt 아니어도 대리 수능이 가능..
호드람
24/11/20 16:56
수정 아이콘
gpt가 수능 문제 풀이 능력이 한 두 문제 틀리는 정도인데, 만점에 가까울 정도로 수능을 풀어줄 사람을 먼저 구하는게 쉽지 않죠, 대리수능자의 리스크도 고려해야하고 비용도 지불해야할텐데, 그걸 gpt가 해결해준다는데 의미가 있죠
키르히아이스
24/11/20 17:48
수정 아이콘
초소형 카메라 탑재 안경과
귓구멍에 숨길수있는 초소형 이어폰을 숨길수 있는 사람이면
그정도 비용은 문제가 아닐것같습니다?
호드람
24/11/20 18:45
수정 아이콘
지금 알리익스프레스에 검색해봐도 손톱만한 카메라, 이어폰을 팔고 있어서 장비는 비용문제가 없을것 같네요
24/11/20 15:43
수정 아이콘
나중엔 진짜 안경 같은 거 빡쎄게 검사할 수도 있겠네요...막 스캐너에 통과 시키고...;;
우울한구름
24/11/20 16:11
수정 아이콘
그정도면 그냥 사람이 대리시험 봐도 되는거라 큰 의미가......
TempestKim
24/11/20 16:34
수정 아이콘
LLM은 아니지만 중국에서 비슷하게 보안뚫기해서 전자기기 탐지 한다고 하더라구요
24/11/20 15:22
수정 아이콘
ai도 문제를 다 못 맞추는구나
그렇군요
24/11/20 15:26
수정 아이콘
인간은 이제 필요없다구~
24/11/20 15:33
수정 아이콘
o1 프리뷰는 확실히 보법이 다릅니다
좀 진지한 거 물어볼 때는 거의 이거만 쓰는 듯
24/11/20 15:36
수정 아이콘
한국어 모델 기준인데도 o1-Preview는 진짜.. 와.. (.....)

대충 야놀자, Mistral, 라마 3.2, 3점수도 궁금해지네요
김재규장군의결단
24/11/20 15:48
수정 아이콘
GPT 3.5 지금도 쓸 수 있나요? 가끔은 예전 GPT의 엉뚱한 대답이 필요할 때가 있는데
전기쥐
24/11/20 15:54
수정 아이콘
지금 제 gpt 보니까 4까지만 가능하고 3.5 이런건 목록에도 없네요.
이른취침
24/11/20 16:19
수정 아이콘
서버 싹 날렸겠죠. 다 비용인데...
리얼포스
24/11/20 17:53
수정 아이콘
API로 레거시모델을 활용 가능합니다.
김재규장군의결단
24/11/20 23:28
수정 아이콘
과거 모델로 빙의해서 결과를 출력하라고 명령을 내리니까 어느정도 옛날 느낌이 나게 하긴 하네요. 이게 그시절 그 맛이었는지는 의문입니다만.
raindraw
24/11/20 15:53
수정 아이콘
최소한 클로드 정도는 넣었어야 좋은 비교가 될텐데 말입니다.
복합우루사
24/11/20 15:55
수정 아이콘
똑바로 서라 A.I.
왜 만점을 받지 못하였지?
신사동사신
24/11/20 16:05
수정 아이콘
곧 안경이나 어디든 칩심고
수능보다 걸린 학생등장 하겠군요..
24/11/20 16:29
수정 아이콘
GPT 4o도 쓸만하던데. 얘가 겨우 4등급따리였어?
아서스
24/11/20 16:45
수정 아이콘
특이점이 진짜 다가오고 있다!
공실이
24/11/20 18:25
수정 아이콘
우리나라 수능은 학습대이터에 확실히 없다는 점에서 의미있는결과네요
대불암용산
24/11/20 18:51
수정 아이콘
ai가 만점이 아니라니 쯧쯧 아직 멀었군
라방백
24/11/20 18:53
수정 아이콘
점수보다 푸는데 몇분이나 걸렸을지가 궁금하네요. 2~3분컷 아닐까..
모링가
24/11/20 18:59
수정 아이콘
(수정됨) o1-preview 장난 아닙니다
근데 장난 아니게 비쌉니다 크크
잠깐 20분정도 놀았는데 3달라 나갔읍니다

근데 애가 좀 이상한게 자꾸 대화를 마무리지으려고 합니다.
비싼 모델이라 썩 가치 있는 질문이 아니라면 더는 말하지 마라고 하는 듯한 느낌
24/11/20 21:25
수정 아이콘
구독제 아닌가요?
모링가
24/11/21 02:05
수정 아이콘
종량제로 쓸 수 있습니다
자연스러운
24/11/21 11:46
수정 아이콘
나 바쁜 몸이야 ~이런 느낌인가요
개망이
24/11/20 21:24
수정 아이콘
문과탑 클로드 소넷3.5가 없네요...
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
508719 [유머] 결혼식 하객 복장 논란 [11] 6698 24/11/20 6698
508718 [게임] ??: 심의를 받지않은 스팀게임 차단하겠다 [12] 유머4559 24/11/20 4559
508716 [유머] 2025년 남북통일을 예언한 탄허스님의 예언적중률이 높으면 안되는 이유 [19] 독서상품권5527 24/11/20 5527
508715 [기타] 은근히 사진 매너가 부족하다는 사람 [16] Lord Be Goja6495 24/11/20 6495
508714 [동물&귀욤] 빠른 더 빠른 더욱 더 빠른 강아지 [9] 그10번4035 24/11/20 4035
508713 [기타] 회사 여직원이랑 결혼하는 방법 [3] 쎌라비7449 24/11/20 7449
508712 [방송] 정지선 셰프의 촉 [9] insane6299 24/11/20 6299
508711 [LOL] (스포주의) 리헨즈 로드뷰피셜 XXX 이적확정.jpg [19] insane5984 24/11/20 5984
508710 [기타] 재규어 너프 [31] BTS5841 24/11/20 5841
508709 [LOL] 캐삭빵인줄 알았던 월즈4강 [11] 명탐정코난4628 24/11/20 4628
508708 [방송] 아침마당 은근 게스트 섭외 미쳤네요 [16] 여자아이돌8171 24/11/20 8171
508707 [게임] 스파6 국가별 마스터 랭크 분석 [5] STEAM2480 24/11/20 2480
508706 [기타] 말넘심... [7] Cand4878 24/11/20 4878
508705 [유머] 미적분학 랩소디 [4] veteus3696 24/11/20 3696
508703 [게임] 출시 20일만에 1600억 번 게임 [30] 두드리짱7034 24/11/20 7034
508702 [게임] 5일째 버그 안고쳐주는 스투 feat.협동전 [12] 두드리짱3153 24/11/20 3153
508701 [스포츠] 제우스 인스타 [16] 시린비5249 24/11/20 5249
508700 [기타] 이삭토스트 포켓몬 뱃지 오늘 구입 성공했습니다. [17] 44년신혼2년3990 24/11/20 3990
508699 [기타] 트럼프,장관인선에 늘 있는 wwe [9] Lord Be Goja3661 24/11/20 3661
508698 [LOL] 베릴이 말하는 과거의 자신과 지금의 자신이 달라진 점 [9] EnergyFlow3961 24/11/20 3961
508696 [기타] 올해 수능 한개 틀린 AI [43] Charli6342 24/11/20 6342
508695 [기타] 유치원 교사의 개인기 [30] 묻고 더블로 가!6016 24/11/20 6016
508694 [LOL] 내년 1군 데뷔 예정인 신인 원딜러의 경쟁상대들 [22] EnergyFlow3980 24/11/20 3980
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로