• Skip to main content
  • Skip to primary sidebar

学習記録

プログラミング

Googleトランスで翻訳

2022年9月1日 by 河副 太智 Leave a Comment

Googleトランスにおいては謎のエラーが発生してうまく動かなかったが、
google_trans_newを使用してから翻訳できるようになった。

①pip install google-trans-new
でインストール

➁C:\Users\xxx\AppData\Local\Programs\Python\Python310\Lib\site-packages\google_trans_newを開く

enter image description here

③151行目のresponse = (decoded_line + ‘]’) を
response = decoded_lineに変える

④以下のコードを実行

1
2
3
4
from google_trans_new import google_translator
translator = google_translator()  
translate_text = translator.translate('요소로',lang_tgt='en')
print(translate_text)

これでgoogle翻訳が使用可能になった2022/9/1現在

Filed Under: python3, スクレイピング

postgresqlマイナーバージョンアップ

2021年6月30日 by 河副 太智 Leave a Comment

SQLサービス停止してSQL実行バイナリを入れ替えて再びサービス起動をするだけ。

SQLサービス停止

1
systemctl stop postgresql-12

更新(awsではなぜかできない)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
yum update postgresql-12-server
 
エラー
[root@ip-172-31-35-163 ruling]# yum update postgresql-12-server
読み込んだプラグイン:extras_suggestions, langpacks, priorities, update-motd
amzn2-core | 3.7 kB 00:00:00
amzn2extra-docker | 3.0 kB 00:00:00
amzn2extra-nginx1.12 | 1.3 kB 00:00:00
amzn2extra-postgresql10 | 3.0 kB 00:00:00
pgdg12 | 3.6 kB 00:00:00
1 packages excluded due to repository priority protections
引数に一致しません: postgresql-12-server
パッケージ postgresql-12-server は利用できません。
No packages marked for update

 

SQLサービス再起動

1
systemctl start postgresql-12

 

Filed Under: PosgreSQL

ChromeDriverのバージョンエラー

2020年11月15日 by 河副 太智 Leave a Comment

Google chromeのバージョンが変わると
“This version of ChromeDriver only supports Chrome version xx”
というエラーが出るようになる。

この場合はchromeのブラウザからヘルプ→google chromeについてをクリック
して現在のバージョンを確認する。
このバージョンとchromedriver-binaryのバージョンが異なるので
エラーがでるという事になる。

以下のページからブラウザから表示したバージョンと同じバージョンの
数字を確認する。
http://chromedriver.chromium.org/downloads

例えばブラウザで確認したバージョンが86.0.4240.198であれば
http://chromedriver.chromium.org/downloadsのページでは
86.0.4240.22がダウンロードすべきバージョンとなる。
(頭2桁が同じものを探す)

このダウンロードすべきバージョンを以下のように指定して
インストールする。

pip install chromedriver-binary==86.0.4240.22

Filed Under: スクレイピング

pg_trgmでDB全文検索を早くする

2020年8月31日 by 河副 太智 Leave a Comment

ローカルの場合

psqlにログインして以下を実行するだけで準備完了

1
CREATE EXTENSION pg_trgm;

インデックスの作成

1
2
3
CREATE INDEX (任意のインデックスの名前) ON (テーブル) USING gist(項目 gist_trgm_ops);
 
#例CREATE INDEX eu_index ON test_eu USING GIST (eng_discription gist_trgm_ops);

インデックスを作成したテーブルを検索した際のパフォーマンスを調べる

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#インデックス作成前のパフォーマンスを調べる
explain select * from test_eu where eng_discription ~ '.*remote controller.*' ORDER BY image_amount DESC;
QUERY PLAN
#結果
-------------------------------------------------------------------------------------
Gather Merge (cost=155601.10..155609.74 rows=74 width=1295)
Workers Planned: 2
-> Sort (cost=154601.08..154601.17 rows=37 width=1295)
Sort Key: image_amount DESC
-> Parallel Seq Scan on test_eu (cost=0.00..154600.11 rows=37 width=1295)
Filter: (eng_discription ~ '.*remote controller.*'::text)
#インデックス作成後の結果
--------------------------------------------------------------------------------
Sort (cost=462.64..462.86 rows=88 width=1295)
Sort Key: image_amount DESC
-> Bitmap Heap Scan on test_eu (cost=113.09..459.80 rows=88 width=1295)
Recheck Cond: (eng_discription ~ '.*remote controller.*'::text)
-> Bitmap Index Scan on eu_index (cost=0.00..113.07 rows=88 width=0)
Index Cond: (eng_discription ~ '.*remote controller.*'::text)

スコアの見方

1
Seq Scan on w_user (cost=0.00..178.50 rows=50 width=161)

0.00がはじめのデータ取得で178.50が最後のデータ取得の時間

 

AWSの場合

そのままだとエラーになる

1
2
rulings=# CREATE EXTENSION pg_trgm;
ERROR:  機能拡張の制御ファイル"/usr/pgsql-12/share/extension/pg_trgm.control"をオープンできませんでした: No such file or directory

contribをインストール

1
yum -y install postgresql12-contrib

再度以下を実行するだけで準備完了

1
CREATE EXTENSION pg_trgm;

CREATE EXTENSIONが出ればOK

 

Filed Under: PosgreSQL

データベースのリストア(ローカルとAWS)

2020年8月23日 by 河副 太智 Leave a Comment

ローカルの場合

■一度該当のデータベースを削除して入れ直さないとデータが二重になる

■データベースの削除の際はpsqlでログインしてから行う

1
DROP DATABASE rulixxx;

■データベース作成もpsqlで行う

1
CREATE DATABASE ruliXXX;

■dumpしたsqlのファイルがある場所にcdで移動して実行する
※リストアはpsqlではなく通常のコマンドで実行

データベースごとリストア

1
pg_restore -C -U postgres -d rulixxx rulixxx.sql

テーブルのみリストア

1
pg_restore -C -U app_admin -d rulixxx -t test_xx test_xx.sql

 

■以下のようなエラーが出るが無視
ld not execute query: ERROR: relation “pre_xx” already exists
上記エラーが出ても暫くすればエラーを無視しましたと表示され、リストア完了

■データベースごとリストアしても一部のテーブルだけがリストアできない場合は
テーブルだけを指定してリストア

1
pg_restore -C -U postgres -d rulixxx -t pre_xx rulixxx.sql

■リストアが成功したかどうかは以下のコードで件数を確認

1
SELECT COUNT( * ) FROM all_xxxx;

いくらリストアしても件数0と表示される場合dumpしたsqlファイルが
破損している可能性もあるので別のsqlファイルで実行してみる。

AWSの場合

■一度該当のデータベースを削除して入れ直さないとデータが二重になる
■データベースの削除の際はpsqlでログインしてから行う

1
DROP DATABASE rulixxx;

■データベース作成もpsqlで行う

1
CREATE DATABASE ruliXXX;

■dumpしたsqlのファイルがある場所にcdで移動して実行する
※リストアはpsqlではなく通常のコマンドで実行

データベースごとリストア

1
pg_restore -C -U app_admin -d rulixxx rulixxx.sqlて

テーブルのみリストア

1
pg_restore -C -U app_admin -d rulixxx -t test_xx test_xx.sql

 

■以下のようなエラーが出るが無視て待つ
ld not execute query: ERROR: relation “pre_xx” already exists

■上記エラーが出てからリストアまで時間がかかるので放置。
「pg_restore: 警告: リストア中に無視されたエラー数: 7」というメッセージで
リストア完了

■データベースごとリストアしても一部のテーブルだけがリストアできない場合は
テーブルだけを指定してリストア

1
pg_restore -C -U postgres -d rulixxx -t pre_xx rulixxx.sql

■リストアが成功したかどうかは以下のコードで件数を確認

1
SELECT COUNT( * ) FROM all_xxxx;

いくらリストアしても件数0と表示される場合dumpしたsqlファイルが
破損している可能性もあるので別のsqlファイルで実行してみる。

Filed Under: AWS, PosgreSQL

PostgreSQLのdumpファイルをAWSにインポート

2020年8月19日 by 河副 太智 Leave a Comment

ローカルで作成したdumpファイルをファイル転送(winSCP等)で

/var/tmp/

に置いてから以下を実行

1
pg_restore -C -d postgres rulings.sql

 

Filed Under: PosgreSQL

  • « Go to Previous Page
  • Page 1
  • Page 2
  • Page 3
  • Page 4
  • Interim pages omitted …
  • Page 55
  • Go to Next Page »

Primary Sidebar

カテゴリー

  • AWS
  • Bootstrap
  • Dash
  • Django
  • flask
  • GIT(sourcetree)
  • Plotly/Dash
  • VPS
  • その他tool
  • ブログ
  • プログラミング
    • Bokeh
    • css
    • HoloViews
    • Jupyter
    • Numpy
    • Pandas
    • PosgreSQL
    • Python 基本
    • python3
      • webアプリ
    • python3解説
    • scikit-learn
    • scipy
    • vps
    • Wordpress
    • グラフ
    • コマンド
    • スクレイピング
    • チートシート
    • データクレンジング
    • ブロックチェーン
    • 作成実績
    • 時系列分析
    • 機械学習
      • 分析手法
      • 教師有り
    • 異常値検知
    • 自然言語処理
  • 一太郎
  • 数学
    • sympy
      • 対数関数(log)
      • 累乗根(n乗根)
    • 暗号学

Copyright © 2025 · Genesis Sample on Genesis Framework · WordPress · Log in