「Apache Spark」に関連する技術ブログ

週刊AWS – 2024/9/30週

2024/10/07

みなさん、こんにちは。ソリューションアーキテクトの杉山です。今週も週刊AWS をお届けします。 10 月 31 日 (木) 14:00-18:00 に、 AWS AI Day を開催します。物理的に来場する点に加えて、ライブ配信での視聴が事前登録できるようになりました。現地では、QuizKnock が審査員を行う AI ハッカソン決勝戦、展示ブース、スピーカーと会話ができる Ask a Speaker の場があるため、可

AWS, Docker, MySQL, R, Apache Spark, ハッカソン, ネットワーク, ゲーム, API, アーキテクチャ

提供開始: Graviton4 を搭載したメモリで最適化された Amazon EC2 X8g インスタンス

2024/10/07

ブックマーク

Graviton 4 を搭載し、メモリを最適化した X8g インスタンスは、現在、最大 3 TiB の DDR5 メモリと最大 192 個の vCPU を備えた、10 の仮想サイズと 2 つのベアメタルサイズで利用できるようになりました。X8g インスタンスは、これまでで最もエネルギー効率が良く、これまでで同等の EC2 Graviton インスタンスの中で最高の料金パフォーマンスとスケールアップ機能を備えています

AWS, MySQL, PostgreSQL, Redis, Apache Spark, ネットワーク, テスト, Microservices, SAP, ハードウェア

Azure Cosmos DB for MongoDBのデータベース移行： Azure DatabricksとAzure Data Factoryの比較

2024/09/30

ブックマーク

はじめに背景 Azure Data Factory利用時の注意点 Azure DatabricksとAzure Data Factoryの比較 Azure Databricksの利用方法 Azure Databricksの作成クラスターの作成 PySparkの記述方法 storesコレクション ordersコレクション merged_storesコレクション終わりにはじめに電通総研XI本部AIトランスフォーメーションセンターの岩本です。この記事では、Azure Cosmos DB for MongoDBのデータベース移行手段として

MongoDB, Python, R, Scala, Apache Spark, 機械学習, SQL, ビッグデータ, プロジェクトマネジメント, オンプレミス

rpy2を用いてPython上でRを使用した効果検証手法の簡単な実装

2024/09/20

ブックマーク

カケハシでデータサイエンティストをしている島吉です。カケハシのデータサイエンティストは、AI在庫管理のエンジニアと連携したり、機械学習を使う業務が多いため、データ分析にはPythonを使用することが多いです。しかし、統計的な手法のライブラリはRに多く存在しています。たとえば、現在の業務では、効果検証に傾向スコアマッチングを使用しており、さま

Python, R, Scala, Apache Spark, プログラミング, 機械学習, SQL, データ分析, 統計

AWS Weekly Roundup: Amazon DynamoDB、AWS AppSync、Storage Browser for Amazon S3 など (2024 年 9 月 9 日)

2024/09/11

ブックマーク

9月2日週、最新の AWS ヒーローが発表されました! AWS ヒーローは、インサイト、ベストプラクティス、革新的なソリューションを惜しみなく共有し、他のユーザーを支援する、素晴らしい技術エキスパートです。 AWS GenAI Loft は大盛況で、現在サンフランシスコとサンパウロにて開催中です。また、今後数か月の間にロンドン、パリ、ソウルで開催される予定です。

AWS, Apache Spark, アルゴリズム, ハンズオン, ワークショップ, スタートアップ, OSS, データベース, オンプレミス

週刊AWS – 2024/9/2週

2024/09/09

ブックマーク

みなさん、こんにちは。ソリューションアーキテクトの根本です。今週も週刊AWS をお届けします。関東は、秋めいた日も増えたように感じますが皆さんの地域はいかがでしょうか？この時期になるとre:Inventが楽しみな気持ちもありつつ、その前にもいくつかイベントが予定されています。その一つが10月31日に開催されるAWS AI Dayです。本日からオンサイト参加の登録サ

AWS, GitHub, Python, Scala, Apache Spark, インフラ, ネットワーク, ゲーム, API, OSS

週刊AWS – 2024/8/12週

2024/08/19

ブックマーク

みなさん、こんにちは。ソリューションアーキテクトの根本です。今週も週刊AWS をお届けします。早速ですが、先日開催されたAWS Builders Online Seriesのセッションが登録なしでご覧いただけるようになりました。 https://resources.awscloud.com/aws-builders-online-series-japanese ご参加できなかった方もこれを機にぜひご活用いただけますと幸いです。それでは、先週の主なアップデー

AWS, Hadoop, Apache Spark, アルゴリズム, セキュリティ, 機械学習, OSS, Serverless, ノーコード/ローコード, 統計

プロダクト開発にデータ職責として浸かってみて思ったこと

2024/08/14

ブックマーク

はじめに背景業務フロー 1. 分析の準備 KPIとログの設計 A/Bテストによる効果検証の準備 2. データの準備エンジニアリング目線も加味しつつログ設計を最適化出来るデータのニーズの変化に臨機応変に対応できる 3. データの分析終わりにはじめに DELISH KITCHENでデータサイエンティストをやっている山西です。今回は「データサイエンティストとしてプロダクト開発プ

Apache Spark, 機械学習, キャリア, SQL, A/Bテスト, ビッグデータ, テスト, 設計, 統計, データサイエンス

BigQuery × Apache Iceberg で実現するデータレイクハウス構築

2024/08/02

ブックマーク

はじめにこんにちは、クラウドエースデータソリューション部の松本です。普段はデータ基盤や機械学習システムの構築を行なっており、Google Cloud 認定トレーナーとしてトレーニング提供もしています。クラウドエースデータソリューション部についてクラウドエースのITエンジニアリングを担うシステム開発統括部の中で、特にデータ基盤構築・分析基盤構築か

Google Cloud, Hadoop, Apache Spark, SQL, Google BigQuery, データ分析, ビッグデータ, OSS, 品質管理, 設計

AWS Weekly Roundup: Llama 3.1、Mistral Large 2、AWS Step Functions、AWS 認定資格の更新など (2024 年 7 月 29 日)

2024/08/01

ブックマーク

Amazon Web Services (AWS) コミュニティメンバーの才能と情熱、特にテクノロジーコミュニティにおける多様性、公平性、インクルージョンを高めるための取り組みにはいつも驚かされます。 7月22日週、 Natalie が率いる AWS ユーザーグループウィメンベイエリアのミートアップで講演する機会がありました。このグループは、女性のエンパワーメントとつながりを促進し、クラ

AWS, Apache Spark, ハンズオン, ワークショップ, 機械学習, 人工知能, OSS, 数学

DeltaLake Universal Formatを使ったクロスプラットフォーム分析

2024/07/30

ブックマーク

本記事では6月に開催された DATA+AI Summit 2024 でGeneral Availabilityが発表された Databricks のDeltaLake Universal Formatの機能を使ってクロスプラットフォームでの分析を実現する方法について紹介します。 DeltaLake Universal FormatはDeltaLakeに保存されたデータをApache Icebergなどの異なるフォーマットで読み出すことができるようにする機能です。本記事では実際にDatabricks上でDeltaLake Universal F

Azure, Apache Spark, Unity, SQL, Apache, OSS, データベース, OAuth

PySparkを少し触ってみる

2024/06/27

ブックマーク

はじめに会員システムグループのkiqkiqです。最近PySparkというライブラリを触ってみたので紹介したいと思います。 Apache Spark・PySparkとは PySparkは、Pythonを使ってApache Sparkを操作するためのライブラリです。そのApache Sparkというのは、オープンソースの大規模データ処理フレームワークで、高速で汎用的なデータ処理エンジンです。Sparkには主に４つの特徴があります。分

Java, Python, R, Scala, Apache Spark, アルゴリズム, SQL, データ分析, Jupyter, ネットワーク

2024 年 6 月第 3 週の Google Cloud の主なリリースに関するニュース

2024/06/18

ブックマーク

6 月 10 日〜 6 月 14 日の期間にアナウンスされた Google Cloud の主なリリースに関してご紹介します。 ! 該当日の全ての情報を掲載しているものではございません。すべてのリリースノートを確認されたい方は、当該ページからご確認ください。 Virtual Private Cloud　（VPC） Private Service Connect Port Mapping（Preview）単一の Private Service Connect エンドポイントを介すことにより、コン

AWS, GitHub, Apache Spark, Google BigQuery, インフラ, ネットワーク, API, Looker, 設計, 大規模言語モデル（LLM）

TypeScriptとPythonで直せると地味にうれしいコードと横断検索する方法

2024/05/24

ブックマーク

すべてのソースコードを読む時間があればよいのですが。 GitHubを横断して確認すると、ソースコードレベルで気になる箇所はよく見つかります。このとき他のコードベースでも起きてないか確認したいところです。ソースコードレベルの細かいレビューをコツコツしていくことは可能ですが、どうしても量が多くなってしまうのとスケールしづらいです。調査のためにも

Python, Apache Spark, TypeScript

Google Cloud でのビッグデータ処理の選択肢

2024/05/16

ブックマーク

はじめにこんにちは、クラウドエースデータソリューション部所属の伊藤です。普段は、データ基盤や機械学習基盤を中心とした案件に携わったり、エンジニアリングマネージャーをしたり、Google Cloud 認定トレーナーとしてトレーニングを提供したりしてます。データ処理システムのよくある課題として、データ処理が遅い、今後データ量が増える、などといったもの

Google Cloud, Apache Spark, SQL

週刊AWS – 2024/9/30週

提供開始: Graviton4 を搭載したメモリで最適化された Amazon EC2 X8g インスタンス

Azure Cosmos DB for MongoDBのデータベース移行： Azure DatabricksとAzure Data Factoryの比較

rpy2を用いてPython上でRを使用した効果検証手法の簡単な実装

AWS Weekly Roundup: Amazon DynamoDB、AWS AppSync、Storage Browser for Amazon S3 など (2024 年 9 月 9 日)

週刊AWS – 2024/9/2週

週刊AWS – 2024/8/12週

プロダクト開発にデータ職責として浸かってみて思ったこと

BigQuery × Apache Iceberg で実現するデータレイクハウス構築

AWS Weekly Roundup: Llama 3.1、Mistral Large 2、AWS Step Functions、AWS 認定資格の更新など (2024 年 7 月 29 日)

DeltaLake Universal Formatを使ったクロスプラットフォーム分析

PySparkを少し触ってみる

2024 年 6 月第 3 週の Google Cloud の主なリリースに関するニュース

TypeScriptとPythonで直せると地味にうれしいコードと横断検索する方法

Google Cloud でのビッグデータ処理の選択肢

アクセス数ランキング

地味に嬉しい！Geminiを使ってGoogleドキュメントを瞬間的に要約する機能

「人を活かすAI」が明日の医療を切り拓く。カケハシの生成AI研究開発チームが描くビジョン

ソートアルゴリズムの基礎を深める

技術ブログに書けることがないわけない！

「なんでできないの？」と感じたときに、そっと読みたい話

タグから技術ブログをさがす

ソフトウェア開発

プログラミング

領域

TECH PLAY でイベントをはじめよう

エラータイトル