TECH PLAY

データサイエンス」に関連する技術ブログ

178 件中 166 - 178 件目
はじめに データサイエンス部の平田です。 ディープラーニングのモデルを作る際、学習データが少ないことが原因で精度が上がらない場合、データのかさまし(augmentation)を行うことがあります。 画像の場合は、オリジナルに対して回転させたりノイズを少し加えることで同じラベル付けがされている別の画像を作り出すことができ、それを学習データに加えることで頑健なモデルになります。 ただし、テキストの場合は回転させると意味不明になるのでどういう操作をしてかさましするかというのを考える必要があります。 そこで、ED
はじめまして。開発部の sakura818uuu です。 CS(カスタマーサクセス)チームのサポートエンジニアを始めて3ヶ月が 経過しました。 3ヶ月が経ったので振り返ってみようと思います。 主な業務内容 求められるスキル 1.データ分析(SQL) 2.プロダクトの仕様把握 3.情報共有 他にもあったら良さそうなスキル キャリアとして さいごに 主な業務内容 主な業務内容はCSチームの技術的サポートや施策の計画や管理をしています。 また、CS業務のドキュメントの拡充や整理を行いました。 やってること(一部
はじめまして。 sakura818uuuです。 この前、社内で初めてPMっぽい動きをしたら盛大に失敗したので 反省すべきことや学んだことを書きます。 この記事はdely Advent Calendar 2019の12日目の記事です。 Qiita: https://qiita.com/advent-calendar/2019/dely Adventar: https://adventar.org/calendars/4134 昨日はiOSエンジニアのnancyさんが「 Combine と Rx
こんにちは。delyインターンのしょーといいます。 データサイエンスチームで1ヶ月間インターンさせていただきました。 本記事では、インターンで行なってきた事柄を紹介していきます。 目次 目次 1. コホート分析 分析手法 結果 2. アプリダウンロード数の推移 分析手法 結果 3. 動画視聴予測モデル作成 基礎となるデータフレームに至るまで 学習 精度向上に向けて このモデルを利用した機能提案 4. データサイエンスチームの取り組みに参加した 成果報告会を行なった 終わりに 1. コホート分析 レシピ詳細
はじめに こんにちは。データサイエンスチームのsakura ( @818uuu ) です。 クラシルの検索改善を担当しています。 データサイエンスチームでは今月 Presto勉強会 を毎日行っていました。 本記事ではその取り組みをご紹介しようと思います。 Prestoとは Prestoとは、Amazon Athenaで使用されている分散SQLエンジンのことを指します。 ※本勉強会ではPrestoで動く「SQL記法」を勉強しています。 概要 Presto勉強会の概要です。 [内容] Prestoの公式ドキュ
はじめに こんにちは。データサイエンスチームのsakura ( @818uuu ) です。クラシルの検索改善を担当しています。 データサイエンスチームでは今年の3月から サーベイチャレンジ という取り組みを行っています。 本記事ではその取り組みをご紹介しようと思います。 概要 サーベイチャレンジの概要です。 [内容] 論文を読み、データサイエンスチーム内で共有する [目的] 料理に関する様々な研究を知る・様々な分野の最先端技術を知る [作業時間] 基本的に業務時間内に実施 [共有時間] 週1回のチームMT
はじめに こんにちは。データサイエンス部の平田です。 一休でのデータ分析はJupyter NotebookやJupyter Labを用いてDWHにアクセスして行われることが多いですが、サービスそのものと分析環境が乖離していることにより、分析結果を継続的にサービスに取り込むのが難しい状況でした。 また、マーケティング部の方々がJupyterを使用して分析した結果に基づいて継続的に施策を行おうとしても、Airflowに組み込む際のエンジニアの負担はそこそこありますし、修正するたびに依頼をしなければならないなど
こんにちは、サーバーサイドエンジニアのjoooee0000です。 delyはデータ基盤としてAWS Athenaを使っており、ユーザーの行動ログからアプリケーションのアクセスログまで、様々なログがAWS Athena上に存在しています。AWS AthenaはS3上にあるデータソースをprestoのクエリ記法で引けるようになっていてとても便利です。 クラシルの分析基盤の歴史に興味がある方は、この記事にまとまっているので参照してみてください。クラシルの分析基盤はデータサイエンスチームが主体となって今も改善を続
一休のデータサイエンス部に所属しています小島です。 以前データ分析基盤の構築で記事を上げていましたが、今回はETL *1 周りの話をしようと思います。 user-first.ikyu.co.jp 今回ETLのツールとして導入したのはAirflowというツールです。 2017年のアドベントカレンダーでも紹介させていただきました。 一休のデータフローをAirflow&#x
メリークリスマスイブ! 皆様クリスマスイブはいかがお過ごしですか。 データサイエンス部所属のエンジニア 笹島 id:sisijumi です。 年末ということもあり、今日は一休という会社のエンジニア組織の変遷を振り返るとともに、現状に関してもお話させていただきます。 (現状はデータサイエンス部ですが、今年の10月までは宿泊事業部のエンジニアのマネージャーをやっておりました。) 一休における収益の変遷 宿泊事業に関してですが、過去発表した資料を元に説明させていただきます。 (近年非上場になった為、直近の収益に
この記事は 一休.comアドベントカレンダー2017 の20日目です。 データサイエンス部所属のエンジニア 笹島 id:sisijumi です。 今日はクラウド環境へのデータ分析基盤構築にまつわるお話をさせていただこうと思っています。 データ分析基盤の構築に関して 夏にデータ分析基盤を Azure SQL Data Warehouse を中心にした構成で構築 構築はしましたが、残念ながらこの構成での運用には至りませんでした。 一休では元々社内にデータ分析基盤を構築し運用していましたが、運用負荷の増大に伴い
この記事は 一休.com アドベントカレンダー 2017 の 13 日目です。 一休データサイエンス部の id:kitsuyui です。データエンジニア兼データサイエンティストをやっています。 この記事はもともとアドベントカレンダー上では「脱・神 Excel (仮)」という名前で枠で取っていたのですが、 少し主語が大きすぎたかな?と反省しています。 書いているうちに全く主旨が変わってきましたので、副題とさせていただきました。 今回は一休社内でのデータエンジニアリングにまつわる負担、それらを解決する Red
この記事は、[一休.comアドベントカレンダー2017]の7日目です。 qiita.com こんにちは、データサイエンス部・大西 id:ohke です。 ユーザの行動収集基盤や、マーケティング施策の実行を支援するシステムの開発・メンテナンスを担当しています。 7日目の本投稿では、GoでSQL Serverを使う方法について、紹介したいと思います。 なぜGoとSQL Serverなのか メジャーじゃない組み合わせだと思いますので、なぜGoからSQL Serverを使うことになったのか、背景を補足します。 今