1 : 2026/04/08(水) 04:13:27.529 ID:n1zH5VpZu
2 : 2026/04/08(水) 04:14:53.587 ID:E35Wa5RWT
サム・アルトマン絶望中
6 : 2026/04/08(水) 04:16:45.891 ID:n1zH5VpZu
4 : 2026/04/08(水) 04:15:02.896 ID:n1zH5VpZu
Mythosは、すべての主要OSとすべての主要ウェブブラウザでゼロデイ脆弱性を発見しました。完全に自律的に。人間の指導は一切不要でした。
セキュリティ訓練ゼロのAnthropicエンジニアが一晩でリモートコード実行バグを探すよう依頼したら、朝起きたら完全動作するエクスプロイトが完成していました。発見された最も古いバグ:OpenBSDに潜む27年前の脆弱性——このOSは文字通りセキュリティで有名です。
彼らはこれを一般公開しません。代わりに、AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrikeらとProject Glasswingを結成し、防衛目的で活用するために1億ドルを約束しました。
「今後数ヶ月から数年にわたり、言語モデル(私たちが訓練したものも他者が訓練したものも)がすべての軸で改善を続けると予想されます。脆弱性研究やエクスプロイト開発を含む。」
ベンチマークは驚異的です:
-SWE-bench Verified: 93.9%(Opus 4.6比: 80.8%)
-SWE-bench Pro: 77.8%(53.4%比)
-USAMO数学オリンピアード: 97.6%(42.3%比——誤字ではありません)
-Firefoxエクスプロイト執筆: 181回の成功 vs Opus 4.6の2回
-Cybench CTFチャレンジ: 100%解決率
-CyberGym: 83.1% vs 66.6%
-Humanity’s Last Exam: 64.7% vs 53.1%
5 : 2026/04/08(水) 04:15:39.134 ID:n1zH5VpZu
えぐいて
7 : 2026/04/08(水) 04:17:13.735 ID:zDWgm/Pze
え、もう出たの?
9 : 2026/04/08(水) 04:18:00.414 ID:zDWgm/Pze
Opus4.6よりもそんな賢いとかやばくね?でも、いくら重いんや?
10 : 2026/04/08(水) 04:18:08.583 ID:mJTTd7Vvr
神話ってこと?
11 : 2026/04/08(水) 04:18:10.249 ID:Ocxiqv9tV
カピパーラな
14 : 2026/04/08(水) 04:21:49.573 ID:sngzNtfVl
新しいものが出てきたときのAIスレっていつもやばいしかいってない
16 : 2026/04/08(水) 04:22:35.399 ID:zDWgm/Pze
>>14
Gemma4は話題にすらならなかったからセーフ
Gemma4は話題にすらならなかったからセーフ
34 : 2026/04/08(水) 04:53:23.793 ID:c4Eehzfnc
>>16
なってたぞ
なってたぞ
15 : 2026/04/08(水) 04:22:26.291 ID:Hw93.9ArN
マイコラスな
17 : 2026/04/08(水) 04:25:25.592 ID:AeqpYkuRN
すぐ制限引っかかりそう
18 : 2026/04/08(水) 04:26:11.094 ID:7l9hCJhP2
お漏らししてたやつか
19 : 2026/04/08(水) 04:26:42.200 ID:kZl1S6Jmf
opusですらバカ食いやのにそれ以上とかもう富豪専用やろ
21 : 2026/04/08(水) 04:28:11.127 ID:nyH5ZnOBs
逆に言ったら攻撃もできるんやろ
22 : 2026/04/08(水) 04:30:18.813 ID:DCN0evpoy
恩恵受けれなかったら出す意味ないやん
23 : 2026/04/08(水) 04:31:06.004 ID:0pUFKsLyj
エ口緩いのか?疑問はそれだけです
24 : 2026/04/08(水) 04:35:37.211 ID:5ZMQB.Rdz
利用制限は?
35 : 2026/04/08(水) 04:58:49.370 ID:Belu98g9z
bonsaiってどうなん?




コメント