「Jupyter」に関連する技術ブログ

全 74 件中 16 - 30 件目

2024年09月25日

AI在庫管理の開発チームのバックエンドエンジニアのもっち(@mottyzzz) です。今回は、AI在庫管理の開発において、Gitのコミットログから開発属人性を可視化して品質向上を実施していく箇所の優先順位をつけた事例を紹介します。この記事は秋の技術特集 2024 の 16 記事目です。背景優先順位をつけて無理なくコツコツ取り組めるアプローチ Gitのコミットログに着目 Gitのコミットログで開発者の偏りを可視化してみました結果の解釈と活用 Gitのコミットログを取得し可視化するまでの流れ前提

Git, GitHub, Python, プログラミング, Jupyter, テスト, 設計

株式会社カケハシ

2024年09月24日

BigQueryのパーティションフィルタを必須にするとどうなるのか

こんにちは。SCSKの磯野です。 BigQueryのパーティションフィルタについて、気になったことをいくつか調べてみました。パーティションフィルタとはパーティションフィルタを有効にすると、パーティション列を適切に指定したWHERE句が存在しないときに、エラーとすることができます。これにより、必ずパーティションが効くクエリしか実行できなくなるため、フルスキャンによる高額課金を防止することができます。パーティション分割テーブルの管理 | BigQuery | Google Cloud cloud

Google Cloud, Google BigQuery, Jupyter, Terraform

SCSKクラウドソリューション

2024年09月02日

Databricksでnotebookのセルの中身を検証する

この記事は秋の技術特集2024 の1記事目です。背景・目的我々のチームではDBをホスティングせず、S3上のDatabricksのdeltaテーブルを使って社内プラットフォームのシステムを提供していますデータの登録はDatabricksのnotebookを使って行うのですが、それをチーム外のメンバーに利用してもらうにあたり入力バリデーションを行う必要がありましたそこで、notebookのセルの中身を検証する方法を調査しました graph LR user((チーム外の\n社内メンバー)) gh[Gi

AWS, GitHub, Python, セキュリティ, プログラミング, SQL, Jupyter, ネットワーク, テスト

株式会社カケハシ

2024年08月01日

Amazon Forecast から Amazon SageMaker Canvas への移行方法

本ブログは「 Transition your Amazon Forecast usage to Amazon SageMaker Canvas 」を翻訳したものです。 Amazon Forecast  は、統計および機械学習（ML）アルゴリズムを使用して非常に正確な時系列予測を提供するフルマネージドサービスです。2019年8月にリリースされ、 Amazon SageMaker Canvas  よりも前に登場しました。Amazon SageMaker Canvasは、時系列予測モデルを含

AWS, GitHub, アルゴリズム, ハンズオン, ワークショップ, 自然言語処理, データ分析, Jupyter, ネットワーク, API

AWS

2024年07月05日

LLM の埋め込み情報ドリフトを Amazon SageMaker JumpStart から監視する

本記事は 2024年2月2日に公開された ” Monitor embedding drift for LLMs deployed from Amazon SageMaker JumpStart ” を翻訳したものです。生成 AI のワークロードで最も有用なアプリケーションパターンの 1 つが Retrieval Augmented Generation (RAG) パターンです。 RAG パターンでは、入力プロンプトに関連する参照コンテンツを探すために、埋め込みベクトル (テキスト文字列の数値表現) に

AWS, Docker, GitHub, ハンズオン, 自然言語処理, Jupyter, フロントエンド, UIデザイン, ChatGPT, 大規模言語モデル（LLM）

AWS

2024年07月01日

EKSで生成AIソリューションのデプロイを検証し設定を確認する

こんにちは。サイオステクノロジーの塙です。今回はEKS上でGPUを扱う生成AIソリューションのデプロイを試し、実際にGPUがどう使われてどう見えるのかを検証してみたいと思います。概要前回は、Kubernetes をベースとしたプラットフォームでGPUを扱っていくための手法について解説してみました。 KubernetesでGPUを扱うためにはどんな準備が必要となるのか、またどんな設定をすれば良いかをまとめています。 ■前回の記事はこちら KubernetesでGPUを使用する   前回までの

AWS, Git, Python, Jupyter, Kubernetes, ネットワーク, GPU, アーキテクチャ, Terraform, ハードウェア

サイオステクノロジー（Tech...

2024年06月28日

Amazon SageMaker でのフルマネージド型 MLFlow の一般提供に関するお知らせ

6月19日、 Amazon SageMaker でのフルマネージド型 MLflow 機能の一般提供についてお知らせいたします。 MLflow は広く使用されているオープンソースツールであり、機械学習 (ML) チームが ML ライフサイクル全体を管理する上で重要な役割を果たします。今回の新リリースにより、わずか数ステップで MLflow Tracking Server を簡単にセットアップおよび管理できるようになり、お客様はプロセスの合理化と生産性の向上を実現できます。 MLflow を活用すると、デー

AWS, セキュリティ, 機械学習, Jupyter, インフラ, テスト, OSS, IDE

AWS

2024年06月27日

PySparkを少し触ってみる

はじめに会員システムグループのkiqkiqです。最近PySparkというライブラリを触ってみたので紹介したいと思います。 Apache Spark・PySparkとは PySparkは、Pythonを使ってApache Sparkを操作するためのライブラリです。そのApache Sparkというのは、オープンソースの大規模データ処理フレームワークで、高速で汎用的なデータ処理エンジンです。Sparkには主に４つの特徴があります。分散処理 Sparkはクラスター上で分散処理を行うことができ、大量のデータを

Java, Python, R, Scala, Apache Spark, アルゴリズム, SQL, データ分析, Jupyter, ネットワーク

ニフティ株式会社

2024年05月22日

対話可能な選択的機械除草ロボットのプロジェクトとさくらの専用サーバの利用について

はじめに 2023年度未踏IT人材発掘・育成事業のために、さくらの専用サーバ高火力シリーズの「NVIDIA V100（64GB）」プランを貸していただいた。プロジェクトのホームページからロボットが動く様子を事前に見てお […]

Python, Jupyter, Google Colab

さくらインターネット

2024年04月09日

さくらのクラウド高火力プランでGoogle Colabを使う

はじめにさくらのクラウドには、機械学習やディープラーニング(深層学習)に最適なGPUサーバを利用できる「高火力プラン」があります。本記事では、Googleが提供している開発環境であるGoogle Colaborato […]

Jupyter, GPU, Google Colab

さくらインターネット

2024年03月21日

spacy-llmで色々なNLPタスクをzero-shotで解いてみる

こんにちは AIチームの戸田です固有表現抽出（NER）や品詞タグ付けなどのNLPタスクを行うためのPythonライブラリに spaCy があります。シンプルなAPIで拡張性も高く、AI ShiftでもプロダクトのNLPロジック部分やデータ分析など多くの場面で利用しています。そんな非常にお世話になっているspaCyですが、処理パイプラインにLLMを統合できる spacy-llm がリリースされました。今回の記事ではそのspacy-llmを使って極性分類やNERなどのNLPタスクをzero-shotで解い

データ分析, 人工知能, Jupyter, テスト, API, Kaggle, ハードウェア, ChatGPT, 大規模言語モデル（LLM）

株式会社AI Shift（株式...

2024年03月07日

32,000トークン対応の商用利用可能な日本語チャットモデル CyberAgentLM2 をワンクリックで FineTune とデプロイ

生成 AI の発展と共にモデルの規模はどんどん大きくなり、デプロイするためのインフラの選択や設定はますます複雑になっています。 Amazon SageMaker JumpStart は大規模言語モデルを最適な設定、かつワンクリックでデプロイする機能を提供します。オープンソースコミュニティとの連携を通じ、AWS はこれまで Meta の Llama2 や TII の Falcon 、 rinna の japanese-gpt-neox などを JumpStart で提供してきました。このたび株式会社サ

AWS, Jupyter, 大規模言語モデル（LLM）

AWS

2023年12月04日

Vertex AI Workbench を使ってデータの傾向を統計分析で把握する

はじめにこんにちは、クラウドエースデータ ML ディビジョン所属の中村です。クラウドエースの IT エンジニアリングを担うシステム開発部の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのがデータ ML ディビジョンです。本記事では BigQuery および VertexAI Workbench（Python3.10）を使って、データセットの傾向を把握する流れを記載します。データ分析の参考になれば幸いです。 VertexAI　Workbench

Python, Jupyter, API

クラウドエース

2023年10月31日

Colab Enterprise を解説

はじめにこんにちは、クラウドエースデータ ML ディビジョン所属の坂田です。データ ML ディビジョンでは、Google Cloud が提供しているデータ領域のプロダクトについて、新規リリースをキャッチアップするための調査報告会を毎週実施しています。新規リリースの中でも、特に重要と考えるリリースを記事としてまとめ、本ページのように公開しています。今回は、Google Cloud の Vertex AI に新登場したプロダクト「Colab Enterprise」について解説します。 Colab E

Python, Jupyter, Google Colab

クラウドエース

2023年09月26日

rinna の日本語大規模言語モデルが AWS にワンクリックでデプロイできるようになりました

生成系 AI の発展と共にモデルの規模はどんどん大きくなり、デプロイするためのインフラの選択や設定はますます複雑になっています。 Amazon SageMaker JumpStart は大規模言語モデルを最適な設定、かつワンクリックでデプロイする機能を提供します。オープンソースコミュニティとの連携を通じ、AWS はこれまで Meta の Llama2 や TII の Falcon などを JumpStart で提供してきましたが、この度 rinna 株式会社から公開されている大規模言語モデルも Ju

AWS, ハンズオン, Jupyter

AWS