「 月別アーカイブ:2017年10月 」 一覧

no image

時間のない人程、本を読むべき。

2017/10/29   -書籍・読書

本ほど時間短縮になるものはない。 編集者が読みやすく編集してくれてるんだから。 ブログやネットの記事は素人が書いたものであるから、正確性を担保する必要もないし、読みやすく配慮するには時間がかかるから、 …

no image

Dockerの有用性

2017/10/29   -AWS, Docker

コンテナがあることで、EC2インスタンスのような計算資源を有効活用できる。 アプリケーション毎にEC2インスタンスを作ると、あまり使用しないアプリケーション分が無駄になる。 同一EC2インスタンス内に …

no image

AWS Amazon CodePipelineでCI

2017/10/29   -AWS

ビルド、テスト、デプロイを自動化するCIの仕組みはマネージドサービスの「AWS CodePipeline」で提供される。 「GCodePipelineは、GitHubのソース変更をトリガーに、自動的に …

no image

AWSの基本と独自ドメインの設定

2017/10/28   -AWS

サービス概要 VPC(Amazon Virtual Private Cloud) 仮想プライベートクラウド環境 EC2 EBS(Amazon Elastic Block Store) VPC内にEC2 …

no image

非同期I/O

2017/10/27   -未分類

非同期I/Oはプロセスやスレッドを使わずに並行I/O処理を走らせることができる。 少メモリかつ高速である。よく聞くところでは nginx Node.js これらも非同期I/Oであり、性能の高さは広く認 …

no image

いつも遅刻する人の特徴・いつも間に合ってる人の特徴

2017/10/25   -コラム

いつも遅刻する人の特徴 ギリギリの時間に会社の最寄り駅に着く。 乗ってる電車が空いている 都内では通勤ラッシュがすごいです。乗車率は200%などと言われ、朝の通勤時間は よく遅刻する人の電車はなぜか空 …

no image

Pythonでページ内のリンクを一括抽出する

2017/10/25   -未分類

import requests import lxml.html #開始URLにリクエストを投げる r=requests.get(“http://開始URL/”) #レスポンスをパースする tree= …

no image

Python-Scrapyを使う

2017/10/24   -Python, Scrapy

Scrapyとは? Scrapyはクローリング・スクレイピングのためのPythonのフレームワークである。 Scrapyを使うと、プログラマーはサイトごとの個別処理を書けばよく、その他の面倒なことをフ …

no image

Googleのn-gramデータがすごい

2017/10/24   -コラム, 未分類

10年前のこの記事 発想がすごいなって思いました。 web全体の解析 数千台規模の計算機クラスタを使用 解析に使ったのは、MarReduceだそうです。

no image

mecab

2017/10/23   -スクレイピング

mecabとは? 自然言語処理ライブラリである。 形態素解析 与えられた文章を形態素という文章の最小単位に分解し、その最小単位の品詞や読みを判別すること。 公式ドキュメント MeCab: Yet An …