BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:第665回 データ分析のためのデータ前処理研究
 会 by Team AI 2/10(月)
X-WR-CALNAME:第665回 データ分析のためのデータ前処理研究
 会 by Team AI 2/10(月)
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:768533@techplay.jp
SUMMARY:第665回 データ分析のためのデータ前処理研究会 by
  Team AI 2/10(月)
DTSTART;TZID=Asia/Tokyo:20200210T193000
DTEND;TZID=Asia/Tokyo:20200210T213000
DTSTAMP:20260410T153609Z
CREATED:20200123T062356Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/76853
 3?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\n＊This event is
  in Japanese only\nこんにちは、TeamAIの宮崎です。\nデータ
 サイエンスの現場において、「前処理」（データの整
 形）には多くの時間を費やしますよね？　前処理の良
 し悪しで、予測モデルの構築やデータモデリングとい
 ったデータサイエンス業務の精度が変わります。ただ
 し、体系だって手法をまとめてあるサイトや書籍は非
 常に少ないです。 我々はこの問題をコミュニティの集
 合知で解決しようとしています。\nもくもく会・ディ
 スカッション形式で前処理に関する研究会を進めてい
 き、 体系的な部分はどんどんQiita等の記事としてアウ
 トプットしていきましょう。初心者/中級者/上級者ス
 キルは問いません。\n流れ\n前処理の情報交換会\n対象\
 nデータサイエンティスト\nデータ分析に興味のあるエ
 ンジニア\n前処理の代表的な手法\n*データクリーニン
 グ - これはデータ前処理で実装される最初のステップ
 です。このステップでは、主な焦点は、欠落データ、
 ノイズの多いデータ、検出、および外れ値の除去、デ
 ータ内の重複および計算バイアスの最小化の処理です
 。\n*データ統合 - このプロセスは、さまざまなデータ
 ソースからデータを収集し、データを結合して一貫性
 のあるデータを形成する場合に使用されます。データ
 クリーニングを実行した後のこの一貫したデータは、
 分析に使用されます。\n*データ変換 - このステップは
 、モデルの必要に応じて生データを指定されたフォー
 マットに変換するために使用されます。データの変換
 に使用されるオプションは次のとおりです。\n*正規化 
 - この方法では、データのスケーリングを実行できる
 ように数値データを指定された範囲、つまり0と1の間
 に変換します。\n*集約 - コンセプトは単語そのものか
 ら派生することができます。この方法は、フィーチャ
 を1つにまとめるために使用されます。例えば、2つの
 カテゴリーを組み合わせて新しいカテゴリーを形成す
 ることができる。\n*一般化 - この場合、下位レベルの
 属性は上位レベルに変換されます。\n*データ削減 - デ
 ータ複製の変換とスケーリング、すなわちデータ内の
 冗長性が除去され、データを効率的に整理した後。\n
 この勉強会は外国人・日本人交え、技術情報を交換す
 る刺激ある場にしたいと思っております。\nオープン
 データ、API、ライブラリ、ツール、論文、コンペ等、
 どんどん情報交換して、業界を一緒に発展させましょ
 う！\nここからデータサイエンティストを始めたい方
 、もう一度基礎から復習してみたい方、経験は問いま
 せんのでぜひお越し下さい！\nデータ前処理に関する
 ブログ記事\n「前処理」のフォーマット共通化やOSS化
 はできないんだろうか\nhttp://tjo.hatenablog.com/entry/2013/12/1
 7/201529\nWI2研究会(公開用) “データ分析でよく使う前処
 理の整理と対処”\nhttps://www.slideshare.net/hajimesasaki1/wi2-55
 598897\nPythonで機械学習はじめました データ前処理編\nht
 tps://qiita.com/yuuki_1204_/items/c26cb09fba8aad35dc0a\n自然言語処
 理における前処理の種類とその威力\nhttps://qiita.com/Hiron
 san/items/2466fe0f344115aff177\n長岡技術科学大学 自然言語処
 理チーム\nhttps://www.youtube.com/watch?v=I02cX-uZtzM\nTeam AIとは
 ？\n2016年7月発祥のコミュニティです。2019年6月時点で
 会員6000人以上います。\n渋谷の拠点でAI教育イベント
 を通算500回実施、日本最大級のAIコミュニティです。\n
 代表の石井は、翔泳社から”AIエンジニアになりたい
 人の為の本”を出版し、1万部を販売してます。\n-web\nh
 ttps://www.team-ai.com/\n-Facebook(人工知能 研究会グループ Tea
 m AI)\nhttps://www.facebook.com/groups/teamaisupporters/?ref=bookmarks\n-
 Slack(AIコミュニティ）\n  https://ai-university.herokuapp.com/\n-
 メルマガ(最新のAI技術のトレンドや海外事例をメール
 マガジンでお届けします。)\nhttps://us9.list-manage.com/subscr
 ibe?u=b351ff53a100609b7c5759977&id=029741963f\nプレゼンター\n司会
  ： 宮崎 翼  \nTwitter:tsubasatwi\nhttps://twitter.com/tsubasatwi\n19
 82年愛媛県出身、新居浜工業高等専門学校卒業後、大
 手商社に入社、その後通信業界にてSIerとしてアカウン
 トセールス担当し、NWプリセールスとしてグローバル
 企業のプロジェクトリードを担当。\n代表者情報\n100万
 人の機械学習コミュニティを東京に創る Team AI\n http://w
 ww.team-ai.com/\n代表 ： 石井 大輔 \n経歴:https://www.ishiid.com
 \n株式会社ジェニオ代表取締役 1975年岡山県生まれ。 
 京都大学卒業後、伊藤忠商事にて欧州駐在しアパレル
 の知的財産と事業開発担当。2011年ジェニオを創業。 
 ファッション通販BUYMAの海外事業開発(欧州・米国)を受
 注。 2015年、シリコンバレーの起業家育成組織OneTraction
 の指導のもと米国で事業推進。 2016年、AI開発案件に特
 化したクラウドソーシングサービスTeam AIを立ち上げる
 。 TBS"AI共存ラジオ 好奇心家族"火曜日コメンテーター
 。
LOCATION:Team AI Base 東京都渋谷区宇田川町36-17 ニューシブ
 ヤマンション202
URL:https://techplay.jp/event/768533?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR