「データ分析」に関連する技術ブログ

企業やコミュニティが発信する「データ分析」に関連する技術ブログの一覧です。

データ分析基盤を作ってみよう 設計編 ~NRIネットコム TECH AND DESIGN STUDY #37~

こんにちは、ブログ運営担当の小野です。 7/18(木)12:00~12:30 当社主催の勉強会「NRIネットコム TECH & DESIGN STUDY #37」が開催されます!! NRIネットコム TECH AND DESIGN STUDY #37 「データは新たな原油」と例えられる現代において、そのデータを総合的に分析し、価値ある情報へと昇華させる基盤の構築は、企業にとって不可欠な戦略の一つです。 今回のウェビナー、「データ分析

Anthropic の Claude 3.5 Sonnet モデルが Amazon Bedrock で利用可能に: Claude 3 Opus よりもさらにインテリジェンスが強化され、コストは 5 分の 1 に

Anthropic が Claude 3 をリリース してからまだ 3 か月ばかりです。Claude 3 は最先端の人工知能 (AI) モデルファミリーであり、ニーズに合ったインテリジェンス、速度、コストの適切な組み合わせを選択することを可能にします。 6月20日、Anthropic は、近日リリース予定の Claude 3.5 モデルファミリーの最初のリリースである Claude 3.5 Sonnet を発表しました。 Amazon Bedrock で Claude 3.5 S

AppSheet(アップシート)の使い方を紹介!できること・開発例も詳しく紹介

AppSheet (アップシート)とは AppSheet は、Google Cloud のサービスの一つで、プログラミングの知識がなくてもアプリを簡単に作成できるノーコード開発プラットフォームです。

PySparkを少し触ってみる

はじめに 会員システムグループのkiqkiqです。最近PySparkというライブラリを触ってみたので紹介したいと思います。 Apache Spark・PySparkとは PySparkは、Pythonを使ってApache Sparkを操作するためのライブラリです。そのApache Sparkというのは、オープンソースの大規模データ処理フレームワークで、高速で汎用的なデータ処理エンジンです。Sparkには主に4つの特徴があります。 分

SaaS 向けリレーショナルデータベースのスケーリング(Part 2: シャーディングとルーティング)

この記事は、software as a service (SaaS) のためのリレーショナルデータベースのスケーリングに関するシリーズの続編です。SaaS プロバイダーは、 Amazon Relational Database Service (Amazon RDS) や Amazon Aurora などのリレーショナルデータベースを一般的にソリューションで利用しています。 Part 1 では、リレーショナルデータベースアーキテクチャをスケーリングまたは最適化する一般的

SaaS 向けリレーショナルデータベースのスケーリング (Part 1: 一般的なスケーリングパターン)

ビジネスが成長するにつれて、SaaS (Software as a Service) プロバイダーが直面する課題の 1 つは、 テナント のエクスペリエンスをどのように維持するかです。これには、テナントベースが拡大するにつれて、許容できるパフォーマンスとレスポンスタイムを確保することが含まれます。 Amazon Relational Database Service (Amazon RDS) や Amazon Aurora などのリレーショナルデータベースは、

データエンジニアリングの基礎 輪読会で得た知見 後編

みなさんこんにちは!ワンキャリアでデータエンジニアをやっている野田(Github: tsugumi-sys )です! 社会人になってからお酒にハマっております。最近はめっきり暑くなってきて、ビールの美味しい季節ですね。弊社のデータだけでなく、私の体重データもエンジニアリングする必要がありそうです。さて、私のわがままボディの話はこれくらいにして本題に入っていき

dbt-snowflake で delete+insert の incremental model を実装する際には join の爆発に気をつけよう

Photo by Melanie Hughes on  Unsplash はじめに こんにちは、Finatextグループのナウキャストでデータエンジニアをしているけびん(X: @Kevinrobot34 )です。Snowflake と dbt そして Terraform を使ってデータ分析基盤の構築をするとともに、POSデータのパイプラインの開発・運用を行っています。 POSデータの弊社のパイプラインは Snowflake と dbt で実装されているのですが、POSのトランザクシ

AWS Summit Japan 2024 参加レポート

こんにちは。SCSKのふくちーぬです。 2024/6/20(木)~2024/6/21(金)に開催されたAWS Summit Japan 2024 に参加してきました。 AWS Summit Japan | 2024 年 6 月 20 日(木), 21 日(金) オンデマンド配信中 AWS Summit は、AWSに関して学習し、ベストプラクティスの共有や情報交換ができる日本最大級の AWS イベントです。基調講演・150 を超えるセッション、さらに 250 以上の展示やハンズオンなど

k-means法によるクラスタリングと可視化

こんにちは。コミュニケーションIT事業部 ITソリューション部の英です。 普段はWebアプリや スマホ アプリの案件などを担当しています。あと、趣味でAIを勉強しています。 突然ですが、AIの勉強をしていると k-means法 と k近傍法 って混同しませんか? 不意に尋ねられた際にぱっと答えられる自信がありません。 なので、今回から2回に渡ってk-means法とk近傍法のそれぞれ

AWS DataZoneを使ってデータ分析基盤を理解しよう

こんにちは、中途入社1年目 松田です! 最近、AWS Glueや、Amazon Datazoneに関するAWS Updateが頻繁に登場していますね! データ分析に興味がありつつも、サービスの種類が多く戸惑う方も多いと思います。 各サービスの役割や構成がイメージできていないと、AWS Updateによる恩恵を理解することができませんので、 今回の記事では、まずはざっくり全体像を把握しよう!とい

AWS ITトランスフォーメーションパッケージ ファミリー(ITX)– 生成AIの土台となるデータ活用を支援し、パートナーと連携した支援を拡充。さらに、 公共のお客様の大規模なクラウド移行を支援する、新たな包括的クラウド移行支援プログラムを開発

みなさん、こんにちは。シニアマイグレーションスペシャリストの富松です。 AWSジャパンでは、AWSへの大規模なシステムの移行を実現し、ひいてはお客様のデジタルトランスフォーメーションをサポートする 「 AWS ITトランスフォーメーションパッケージ(ITX) 」を2021年に、2022年には内容を強化・拡大した「 AWS ITトランスフォーメーションパッケージ2.0(ITX2.0) 」をリ

【徹底解説】Document Intelligenceを利用してRAGを構築する【セマンティックチャンキング】

こんにちは、サイオステクノロジー の佐藤 陽です。 今日は Azure の AI サービスである Document Intelligence を利用した RAG システムを構築してみたいと思います。 PDF データを独自データとした RAG を構築したい! Document Intelligence とか Azure AI Search ってどうやって使うの? セマンティックチャンキングって何? といった方は最後までご覧ください! はじめに こちらの サンプ
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?