NRIセキュアではNews BitesやOUCH! を日本語に翻訳して皆さまにお届けしています。
購読制を採っておりますので、
ご希望の方は、ニュースレター登録からお申し込みください。
Applied Data Science and Machine Learning for Cybersecurity Professionals
Data Science and Machine Learning
English2024年2月26日(月)~3月2日(土)
1日目:9:00-17:30
2日目~6日目:9:30-17:30
◆LiveOnline形式
オンライン
早期割引価格:1,220,000 円(税込み 1,342,000 円)
※キャンペーン価格のため、他の割引の重複適用はできません。ご了承ください。
通常価格:1,350,000 円(税込み 1,485,000 円)
※オプションの価格は、コース本体と同時にお申し込みいただく場合のみ有効です。
※コース本体のお申し込み後から講義開始までの間に、GIAC試験オプションを追加される場合は、事務手数料10,000円(税込11,000円)をいただきます。
※講義開始後のGIAC試験のお申込みは、こちらのページ(英語)をご参照のうえ、GIACへ直接お申し込みください。
演習で使用するノートPCをご準備下さい。受講に必要なPC環境についてご確認ください。
注意:M1プロセッサを使用したアップルシステムは、現時点では必要な仮想化を実行できないため、このコースには使用できません。
重要! この説明書に従って設定されたご自身のシステムをお持ちください。
このコースに完全に参加するためには、正しく設定されたシステムが必要です。この説明書をよく読み、それに従わない場合、このコースに不可欠な実習に参加できないため、満足のいく授業が受けられない可能性が高くなります。したがって、コースで指定されたすべての要件を満たすシステムで参加されることを強くお勧めします。授業前にシステムをバックアップしておくことが重要です。また、重要なデータを保存しているシステムを持ち込まないことを強くお勧めします。
講義で使用するメディアは、ダウンロードで配信されます。講義で使用するメディアファイルは50GB以上と容量が大きいです。ダウンロードが完了するまでには、十分な時間が必要です。インターネット接続や速度は、様々な要因によって大きく異なります。そのため、教材のダウンロードにかかる時間の目安をお伝えすることはできません。リンクを入手したら、コースメディアのダウンロードを開始してください。講義初日には、コースメディアがすぐに必要になります。講義開始の前夜にダウンロードを開始した場合は、失敗する可能性が高くなります。
SANSでは、PDF形式の印刷物の提供を開始しました。さらに、一部のクラスでは、PDFに加え、電子ワークブックを使用しています。電子ワークブックを使用するクラスは、今後急速に増加すると思われます。この新しい環境では、セカンドモニターやタブレット端末があると、講師の講義中やラボの演習中に授業資料を見ることができ、便利です。
ノートパソコンの仕様についてご質問がある場合は、laptop_prep@sans.org までご連絡ください。
データサイエンス、人工知能、機械学習は、現在の流行語だけでなく、情報セキュリティの主要ツールの1つに急速になりつつあります。問題は、数学やデータサイエンスの学位を持っていない限り、ベンダーの言いなりになってしまう可能性が高いということです。このコースでは、機械学習とデータサイエンスについて完全に解明しています。授業時間の70%以上は、機械学習とデータサイエンスの問題について話すだけでなく、実際に解決することに費やされます。
この分野の他のコースとは異なり、このコースは情報セキュリティの問題を解決することに正面から取り組んでいます。他のコースでは、ほとんどすべての理論を教えるか、実世界に通用しないつまらない問題を解くか、両極端になりがちですが、このコースではバランスをとっています。このコースでは、絶対に知っておかなければならない理論と数学の基礎だけを取り上げ、それが実践的な技術に応用できる範囲に限定しています。コースでは、様々な統計学的、確率論的、あるいは数学的なツール(応用的なもの)を段階的に紹介、適用し、それらのツールを使えるようにします。このコースで扱う実践的なプロジェクトは、独自の機械学習ソリューションを構築するための幅広いベースを提供するために選択されました。ChatGPTは、機械学習とAIを使用して実際のサイバーセキュリティ問題を解決するための効果的なソリューションを構築する方法を知ることに加えて、あなたの組織での潜在的な使用方法についてインテリジェントに議論できるように、本当に機能します。コース内容の詳細については、下記のコース説明をご覧ください。また、上記の「コースデモ」ボタンをクリックすると、無料デモをご覧いただけます!
主なトピックは以下の通りです。
ビジネス上の学び
このコースはあなたの組織を支援します。
できるようになること
得られること
学べること
その他のリソース
NICEフレームワークの業務
GMLE認定資格は、実践的なデータサイエンス、統計、確率、および機械学習の知識を有することを証明するものです。GMLE認定者は、機械学習を使用して実世界のサイバーセキュリティ問題を解決する資格があることを証明します。
AIや機械学習はどこにでもある。ベンダーのソリューションはどうなっているのか?これは本当に黒魔術なのだろうか?私は、この分野の膨大な知識のギャップを埋めるために、このコースを書きました。私は、ツールを使うなら、そのツールがどのように機能するかを理解すべきであると考えています。そうでなければ、結果が何を意味するのか、なぜそのような結果を得ることができるのか、本当のところはわからないのです。このコースでは、統計学、数学、Python、機械学習について、ゼロから...「ヒーローになる」と約束するのは気が引けますが...クラッシュコースを提供します。今日から現実の問題を解決できる有能な人物とでも言いましょうか!
- David Hoelzer
概要
ここでは、データサイエンスや機械学習の分野における用語の紹介に加え、データソースとして利用されている技術の数々を紹介します。データサイエンスや機械学習のプロジェクトでは、まずデータを取得することが重要であるため、この日の授業では、これらの作業に備えるための実践的な演習に重点を置いています。
まず必要なスキルは、このコースで選択した言語であるPythonの使用です。Pythonの基礎的な理解があることが唯一の受講条件です。Pythonを1行でも書いたことがある人なら、おそらく十分な知識があるはずです。リスト、配列、タプル、ディクショナリ、内包、そしてnumpyの変種を紹介します。
Pythonの復習の後、いくつかの理論を学び、その後すぐに実践的な演習を行い、SQL、MongoDB、Webスクレイピングについて、実際に仕事をするのに必要な知識を身に付けます。
演習
トピックス
概要
データサイエンスと機械学習にとって重要な統計学の基礎から始めます。この導入と、実世界のデータに対するこれらの技術の実用的な使用を提供するハンズオン演習に続いて、コースは確率論に移行します。
確率論はそれ自体が広範な分野である。このコースでは、いくつかの基礎知識を紹介した後、ベイズの定理の導出に直接取り組みます。この導入部分をベースに、学生はベイズ分析の有用なツールを構築する実習を行い、コース後半でそれを基に改良を加える。
本節の残りの部分は、得られた統計的知識を信号解析の分野に応用することである。フーリエ級数、高速フーリエ変換、離散フーリエ変換の導出と応用に関する議論の後、学生はこれらのツールを実際の脅威探索活動で使用します。
演習
トピックス
概要
このコースの残りの18時間強は、様々な機械学習モデルについて学び、すぐに適用することに費やされる。各トピックの紹介と議論の後、学生は直感的な理解を深め、実際の問題にその手法を適用するために長時間の実習に取組みます。
このセクションでは、様々なクラスタリングアプローチと教師なし機械学習から始まります。サポートベクター分類器、カーネル関数、サポートベクターマシンから探究を始める。この議論と演習に続いて、K-MeansとKNNのアプローチを検討し、クラスタリングのテーマを継続する。2次元または3次元の例を扱った後、理想的なクラスタ数を決定する方法に注目する。そして、最後に高次元のアプリケーションと主成分分析による次元の削減を探求する。DBSCANアルゴリズムについては、脅威の探索や大規模データの効率的なSOC分析に応用することで、より深く掘り下げていきます。
このセクションの残りの時間は、決定木について説明します。実際に手を動かし、決定木の限界について議論した後、ランダムフォレストについて説明し、ほとんどの場合において、ランダムフォレストがより良い推論を提供することを実際に体験していただきます。最後に、ネットワーク上のユーザ活動の異常を発見するためのクラスタベースのアプローチについて説明します。
演習
トピックス
概要
このセクションでは、情報セキュリティ分野における教師あり学習アプローチの理論、開発、および使用に焦点を当てます。セクション2で扱った数学と統計学をベースに、線形回帰から始まり、リアルタイムのネットワークデータを含むマルチクラス分類問題への深層学習ニューラルネットワークの適用で終わります。
教材は、教師ありの機械学習と数学を使用して予測モデルを作成することに重点を置いています。最初の議論と演習は、異常検出のための予測と傾向分析が中心です。その後、分類問題に焦点を当てています。
セクション2で使用したベイズアプローチを基に、より正確なフィッシング検出ネットワークの開発を通じて、深層学習ニューラルネットワークと完全連結密なネットワークを紹介します。続いて、ニューラルネットワークの学習性能の可視化と測定について探求し、さらにオーバーフィット、過学習、そしてそれらを識別(そして回避!)する方法について議論します。
このセクションの次の部分は、カテゴリカルな問題に目を向け、リアルタイムネットワークプロトコル分類システムを構築します。さらに重要なことは、この分類システムにおいて、通常教師なしアプローチに留保されるタスクである異常検知を実装することです。
演習
トピックス
概要
このセクションでは、ディープラーニングソリューションの知識を広げることに特化しています。前半は、畳み込みネットワーク(CNN)に全面的に焦点を当てます。このクラスでは、テキスト分類問題へのCNNの応用だけでなく、ゼロデイマルウェアの予測的識別への応用も探求します。
後半は、オートエンコーダーに焦点を当てます。オートエンコーダーが何をするのか、なぜ機能するのか、潜在的な表現をどのように選択するのか、再構成損失関数がどのように機能するのか、について検討する。そして、この知識を応用して、シグネチャや人手を介さない自動ログ異常検知ソリューションを作成し、異常の特定を行います。さらに、ネットワーク上の脅威を検知するための大規模なアンサンブル・オートエンコーダの構成要素についても学びます。
演習
トピックス
概要
このコースの最終セクションでは、畳み込みニューラルネットワークと、回帰問題を解くためのCNNと完全連結ネットワークの応用について引き続き説明します。このセクションでは、TensorFlowの関数パターンを使用して、CAPTCHAの品質をテストし、解決するためのディープニューラルネットワークを作成することに重点を置いています。赤、青、紫のどのチームであっても、コンピュータビジョンの問題に相当するものを解決するために、機械学習を使って考え抜き、95%以上の精度で解決する方法を学ぶことができます! その後、より少ない学習時間でより高い精度を達成するための、別の問題解決方法を探ります。
最後に、機械学習の問題に適用可能な遺伝的アルゴリズムについて説明します。
演習
トピックス