Gene ECH_0055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0055
Symbol	pgk
ID	3926974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	47910
End bp	49061
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	31%
IMG OID	637901179
Product	phosphoglycerate kinase
Protein accession	YP_506886
Protein GI	88658248
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0126] 3-phosphoglycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.186403
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TACAAGATTT TAGTTGTAGT GGTAAAACTG TATTGCTGCG TGCGGATTTA 
AATGTTCCAG TAGATAATGG GATAGTTTTG GATGATACTA GGATTGTTAG ATTAACTACA 
ACTATAAAAT ATTTATTGAG TAATGATGCG AAAATTGTCA TAATGTCGCA CTATGGATCT 
CCTAAATCTT ATGATAAAGA ATTTTCTTTA AAGTTTGTGG TTGAGTATTT GAATAAAATA 
TTTGCAACAA ATGTAGTATT TATAGATGGT GTAATTGGAG ATTATGTAGA ACAGACTATT 
CAATCTGTTC CAGCAGGGAC TATATTGCTG CTAGAAAATT TGAGATTTTA CGCAGAAGAA 
GAAAAGAATG ATTTGAATTT TGCAAAACAA CTTGCGTTGT TGGCTGATAT ATATGTTAAT 
GATGCTTTTT CTTGTTTACA TCGTAAGCAT GCTTCTATAG ATGCGATTAC TAGAGTTATG 
CCGTCTTTTA TTGGCTTTAA TTTTCAAGAA GAAATGAAAT ATTTGAGTTG TGTTGTTTCA 
AATAGTGAGA AGCCAGTAGC TGTTATAGTT GGTGGTTCAA AAATATCAAC AAAAGTTCAT 
ATGTTAAAAA ATTTGATTAA AAAAATAGAT TTTTTGATAG TGGGAGGAGC CATTGCGAAT 
AATTTTTTGT TATCACAAGG TTTAAAAATA GGTAAGTCGT TATACGAAGA GTTAGAAAAA 
GATCTTGTAA CAGAAATTGT AGATCTTGCT AAGAGATATG AATGTAAGAT AATTGTCCCT 
GTTGATTACG TAGTGGCTAA AAATTACATT TGTGGGGATA GTACAATAAA AGACAATGAC 
ACTTTAGAGT CTGATGATAT GATATTAGAT GTAGGACCTC AAACTGTTAA CATGATTGCT 
GCTACGATAA ATAAATGTAG AACAGTGCTA TGGAATGGTC CGTGTGGTAT GTTTGAAAAA 
GAACCTTTTT CTAAAGGAAC ATTTAGTGTT GCGAACTTGT TGTCAAAATT GACTAAGGTA 
GGAAAGCTAA AAAGTATTGT TGGAGGTGGA GATAGTATAT GTGCAATAAA ATTATCTGGA 
CTTTCAAATG AAGACTTTAC TTATATTTCT ACAGGAGGAG GAGCTTTATT GCATTTTTTG 
AGTATCGCAT GA

Protein sequence

MKKIQDFSCS GKTVLLRADL NVPVDNGIVL DDTRIVRLTT TIKYLLSNDA KIVIMSHYGS 
PKSYDKEFSL KFVVEYLNKI FATNVVFIDG VIGDYVEQTI QSVPAGTILL LENLRFYAEE 
EKNDLNFAKQ LALLADIYVN DAFSCLHRKH ASIDAITRVM PSFIGFNFQE EMKYLSCVVS 
NSEKPVAVIV GGSKISTKVH MLKNLIKKID FLIVGGAIAN NFLLSQGLKI GKSLYEELEK 
DLVTEIVDLA KRYECKIIVP VDYVVAKNYI CGDSTIKDND TLESDDMILD VGPQTVNMIA 
ATINKCRTVL WNGPCGMFEK EPFSKGTFSV ANLLSKLTKV GKLKSIVGGG DSICAIKLSG 
LSNEDFTYIS TGGGALLHFL SIA