BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:データ前処理研究会
X-WR-CALNAME:データ前処理研究会
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:685902@techplay.jp
SUMMARY:データ前処理研究会
DTSTART;TZID=Asia/Tokyo:20180810T190000
DTEND;TZID=Asia/Tokyo:20180810T210000
DTSTAMP:20260406T045222Z
CREATED:20180719T020540Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/68590
 2?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\nこんにちは
 ！ Team AI代表 石井大輔です。\n\n弊社でもAIを構築して
 いますが、データの前処理は地味ながら、分析の精度
 を左右するとても大事な領域ですよね？でも、体系だ
 って手法をまとめてあるサイトや書籍は非常に少ない
 です。 我々はこの問題をコミュニティの集合知で解決
 しようとしています。\n\nもくもく会・ディスカッショ
 ン形式で前処理に関する研究会を進めていき、 体系的
 な部分はどんどんQiita等の記事としてアウトプットす
 ることで、 実際のデータ分析フィールドで活躍されよ
 うとしている方々の支援をしようと思っております。\
 n\nデータ前処理の代表的手法\n\n\nデータクリーニング 
 \nこれはデータ前処理で実装される最初のステップで
 す。このステップでは、主な焦点は、欠落データ、ノ
 イズの多いデータ、検出、および外れ値の除去、デー
 タ内の重複および計算バイアスの最小化の処理です。\
 nデータ統合\nこのプロセスは、さまざまなデータソー
 スからデータを収集し、データを結合して一貫性のあ
 るデータを形成する場合に使用されます。データクリ
 ーニングを実行した後のこの一貫したデータは、分析
 に使用されます。\nデータ変換 \nこのステップは、モ
 デルの必要に応じて生データを指定されたフォーマッ
 トに変換するために使用されます。データの変換に使
 用されるオプションは次のとおりです。\n正規化\nこの
 方法では、データのスケーリングを実行できるように
 数値データを指定された範囲、つまり0と1の間に変換
 します。\n集約\nコンセプトは単語そのものから派生す
 ることができます。この方法は、フィーチャを1つにま
 とめるために使用されます。例えば、2つのカテゴリー
 を組み合わせて新しいカテゴリーを形成することがで
 きる。\n一般化\nこの場合、下位レベルの属性は上位レ
 ベルに変換されます。\nデータ削減\nデータ複製の変換
 とスケーリング、すなわちデータ内の冗長性が除去さ
 れ、データを効率的に整理した後。\n\n\nTeam AI の勉強
 会のご紹介\n\nこの勉強会は外国人・日本人交え、技術
 情報を交換する刺激ある場にしたいと思っております
 。\nオープンデータ、API、ライブラリ、ツール、論文
 、コンペ等、どんどん情報交換して、業界を一緒に発
 展させましょう！\n\n“勉強会を開いて、学習者同士情
 報交換する" 手法を取っていますので、カジュアルに
 お越しください。\n\n社会人も学生も、みんなで集まっ
 てAIを自習しましょう！\n教材を持ち込んでもくもく勉
 強してもいいし、皆と話して情報交換していただいて
 もいいです。\n\n　データ前処理に関するブログ記事\n\
 n「前処理」のフォーマット共通化やOSS化はできないん
 だろうか\nhttp://tjo.hatenablog.com/entry/2013/12/17/201529\n\nWI2研
 究会(公開用) “データ分析でよく使う前処理の整理と
 対処”\nhttps://www.slideshare.net/hajimesasaki1/wi2-55598897\n\nPytho
 nで機械学習はじめました データ前処理編\nhttps://qiita.c
 om/yuuki_1204_/items/c26cb09fba8aad35dc0a\n\n自然言語処理におけ
 る前処理の種類とその威力\nhttps://qiita.com/Hironsan/items/24
 66fe0f344115aff177\n\n長岡技術科学大学 自然言語処理チー
 ム\nhttps://www.youtube.com/watch?v=I02cX-uZtzM\n\nContact\n\n質問が
 ある方や、迷子になったという方は、\ndai@jenio.co もし
 くは　TEL: 080-6306-2223　にご連絡ください。\n\n36-17 New Sh
 ibuya Mansion 202\, Udagawa-cho Shibuya-ku Tokyo JAPAN zip150-0042\n\n場
 所\n\n150-0042 東京都渋谷区宇田川町 36-17\, ニューシブヤ
 マンション 202号室\nJR渋谷駅徒歩5分、東急ハンズ渋谷
 店から30秒\n\nフレッシュネスバーガーとサイゼリヤの
 間の道を進むと左手に見える白いマンションです。\n
 道順写真はこちらから\n\n主催\n\n100万人の機械学習コ
 ミュニティを東京に創る Team AI\nhttp://www.team-ai.com/\n機
 械学習に特化した勉強会・人材紹介・受託開発を行っ
 ています。\n\n代表 ： 石井 大輔 （経歴・プロフィー
 ル）\n株式会社ジェニオ代表取締役 1975年岡山県生まれ
 。\n京都大学卒業後、1998年伊藤忠商事に入社し繊維カ
 ンパニーでPaulSmith等を担当。\nロンドン、ミラノでの
 駐在を経て、2011年ジェニオを創業。\nファッション通
 販BUYMAの海外事業開発を受注。\n2015年、シリコンバレ
 ーの起業家育成組織OneTractionの指導のもと米国で事業
 推進。\n2016年、人工知能開発案件に特化したクラウド
 ソーシングサービスTeam AIを立ち上げる。
LOCATION:Team AIベース（ニューシブヤマンション202） 東京
 都渋谷区宇田川町36-17 ニューシブヤマンション202
URL:https://techplay.jp/event/685902?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR
