TECH PLAY

Kaggle」に関連する技術ブログ

59 件中 1 - 15 件目
1 はじめに2 背景3 取り組んだ内容3.1 ライフイベントの推定結果を特徴量に追加3.2 階層構造を明示したマルチ タスク学習モデルの導入3.3 予測確率の補正3.4 配信サイズの動的変更4 オフラ...
はじめにこんにちは、データサイエンティストの栗本です。LINEヤフーでは、最新の知見を業務に取り入れるべく、論文の社内共有会や社外研究会への参加などを積極的に行っています。その一環として、業務に関連す...
みなさん、こんにちは。DevHRチームの長谷川(X: @hasehathy )です。 普段はエンジニア組織のXアカウント( @OnecareerDevjp )の運用や、このテックブログの運営、EntranceBookの作成〜更新などを担当しています。 今回は、弊社データサイエンティストの協力のもと、データサイエンスのスキルアップに役立つ技術書をご紹介します!
サーバーワークスの村上です。 このブログでは Amazon Quick Suite を使い、Kaggleの小売データセットを題材に、簡単な顧客離反(Churn)分析をやってみます(推論ではなくデータ分析)。 概要 Amazon Quick Suiteについて 使用するデータセットについて シナリオ(Scenarios)機能を利用した分析 Quick Reserch SaaS系のAIソリューションとの違い BIツールである点 料金体系やガバナンス面 概要 今回試したことを簡単にまとめます。 シナリオ(Sce
ファインディでソフトウェアエンジニアをやっている土屋です。今回は、先日大好評だった企画、「エンジニアの人生を変えたイベント」のPart2をお届けします。 tech.findy.co.jp 前回に引き続き、弊社エンジニア達が過去に参加したイベントの中で、特に印象に残っているイベントを紹介していきます。 それでは見ていきましょう! YAPC (Yet Another Perl Conference) はじめての外部登壇 同世代エンジニアとの出会い キャリアの転機 まとめ HackBowl【次世代エンジニアの登
はじめに こんにちは、traPで主にWebバックエンドの開発をしている @pirosiki です。 デジタル創作同好会traPは、東京科学大学の創作・プログラミングの総合サークルです。アプリ・ゲームの制作を中心に、音楽( […]
企業の環境では、カスタムアプリケーションが業務の改善、生産性の向上、組織内の知識の集中化において重要な役割を果たします。しかし、これらのツールは多くの場合、関連する情報にユーザーが素早く直感的にアクセスできるような賢い会話型インターフェイスが備わっていません。膨大な組織データから文脈に応じた洞察を把握したり、複雑なクエリを解釈したりするには、従来のダッシュボードや検索バーでは限界があります。 生成 AI は、この課題に対する強力なソリューションを提供します。開発者が制御できるアプリケーションに会話型エクス
DifyのMCPプラグインとZapier MCPを利用してDifyとSnowflakeを連携させ、Snowflakeのデータを自然言語で扱ってみました。本記事では、その連携方法を中心に紹介したいと思います。 はじめに 利用したサービス Dify Zapier Snowflake 構成 連携設定 Snowflake の設定 Zapierの設定 Dify の設定 動作確認 まとめ 参考 はじめに こんにちは。NTTコミュニケーションズの大島です。普段は、クラウドサービスを中心に、データレイクやデータウェアハウ
G-gen の佐々木です。当記事では、Cloud Run における GPU 利用のユースケースとして、オープン LLM である Gemma 3 を Cloud Run のサービスにデプロイしてみます。 前提知識 Cloud Run サービスの概要 Cloud Run における GPU 利用 Gemma 3 Cloud Run にオープン LLM をデプロイするメリット 利用する Gemma 3 モデルのサイズと配置場所について 事前準備 GPU の割り当て増加 シェル変数の設定 Artifact Regi
こんにちは、AIチームの戸田です。 KaggleのTitanicデータセットは、機械学習の入門として定番のデータセットです。 Titanic - Machine Learning from Disaster 多くの機械学習手法が試されてきたこのデータセットに対し、今回は少し異なるアプローチを試みたいと思います。ランダムフォレストのような従来の表形式データ向け機械学習手法ではなく、テキストを処理するLLM(Large Language Model)を使って、Titanicの生存者予測を試します。 従来の機械
G-gen の堂原です。当記事では、 Google スプレッドシート (Google Sheets)の機能である コネクテッドシート で、 データの抽出 機能を使う際、行数制限が 10万行までしか選べない 場合の対処法を紹介します。 コネクテッドシートとは 概要 データの抽出 事象 解決方法 コネクテッドシートとは 概要 コネクテッドシート (Connected Sheets)は、 Google スプレッドシート の機能です。コネクテッドシートを用いると、Google Cloud(旧称 GCP)のデータ分
LINEヤフー Advent Calendar 2024の記事です。 こんにちは。データ人材戦略部エバンジェリストチームの權です。 私が自然言語処理に関する入門的なKaggle Notebookを...
はじめに こんにちは、Data meetup!事務局の斉藤・田口です。 リクルートのデータ推進室では定期的にオンラインイベント
はじめに こんにちは!データ推進室の鶴谷、池田、腰高、安藤です。 私たちが所属するデータ推進室で、独自の制度「クラウド利用支
AIの世界では、ChatGPTをはじめとする生成系AIが広がり、テキスト生成モデルである大規模言語モデル(LLM)の仕事での利用も増えています。 今回紹介するオープンモデルLLMは、AI技術の発展において重要な役割を果たしています。ChatGPTのようなクローズドなLLMモデルは高性能ですが、LLMを活用したツール作成や検証などの研究目的での利用にはコスト面の課題があります。オープンモデルLLMは 無料で利用できるため、スタートアップや予算の限られたプロジェクトなどでも、柔軟に対応できる点が評価されていま