Gene ECH74115_3735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3735
Symbol	engA
ID	6967089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3456142
End bp	3457614
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	52%
IMG OID	643387528
Product	GTP-binding protein EngA
Protein accession	YP_002271981
Protein GI	209399678
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03594] ribosome-associated GTPase EngA

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0134821
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACCTG TGGTCGCGCT TGTCGGGCGC CCTAACGTAG GAAAATCCAC GTTATTTAAC 
CGTCTAACTC GCACCCGAGA TGCGCTGGTT GCGGATTTCC CGGGTCTGAC TCGTGACCGT 
AAGTACGGTC GTGCGGAAAT TGAAGGCCGT GAGTTTATCT GTATTGATAC CGGCGGGATT 
GATGGCACAG AAGACGGTGT AGAAACCCGC ATGGCGGAAC AGTCGCTGCT GGCGATTGAA 
GAAGCGGACG TCGTACTGTT TATGGTGGAT GCGCGCGCGG GCCTGATGCC GGCAGATGAA 
GCGATTGCCA AACATCTGCG CTCCCGTGAA AAACCGACCT TCCTGGTGGC AAACAAAACT 
GACGGTCTGG ATCCCGATCA GGCAGTGGTT GATTTCTACT CGCTTGGTTT AGGTGAAATC 
TACCCGATCG CCGCGTCTCA CGGTCGTGGC GTATTAAGTC TGCTGGAGCA TGTGCTACTG 
CCGTGGATGG AAGATCTCGC ACCGCAAGAG GAAGTCGACG AAGACGCTGA ATACTGGGCG 
CAATTTGAAG CGGAAGAGAA CGGCGAAGAA GAAGAGGAAG ACGACTTCGA CCCGCAAAGT 
CTGCCGATCA AACTGGCGAT TGTGGGTCGT CCGAACGTAG GTAAGTCTAC ACTCACTAAC 
CGTATTCTTG GTGAAGAGCG CGTTGTTGTT TATGACATGC CTGGTACGAC GCGTGACAGT 
ATCTACATTC CAATGGAACG CGATGGACGT GAGTATGTGC TCATTGACAC CGCTGGCGTA 
CGTAAACGCG GCAAAATCAC CGATGCTGTA GAGAAATTCT CCGTAATCAA AACGTTGCAG 
GCCATTGAAG ACGCCAACGT GGTGATGTTA GTGATTGATG CGCGCGAAGG TATTTCCGAT 
CAGGATCTCT CGCTGCTGGG CTTTATTCTC AATAGTGGGC GCTCACTTGT CATTGTGGTG 
AATAAGTGGG ATGGCCTGAG TCAGGAAGTG AAAGAGCAGG TGAAAGAAAC GCTGGACTTC 
CGTCTGGGCT TTATCGATTT TGCTCGTGTG CACTTTATCT CTGCCTTGCA CGGCAGTGGT 
GTTGGTAACT TGTTTGAATC AGTACGTGAA GCGTATGACA GCTCCACCCG TCGTGTGGGG 
ACCTCTATGC TGACGCGCAT CATGACGATG GCTGTTGAAG ATCACCAACC GCCGCTGGTA 
CGCGGTCGTC GTGTGAAGCT GAAATATGCA CACGCCGGTG GTTATAATCC GCCGATTGTG 
GTGATTCACG GTAATCAGGT GAAAGACCTG CCTGATTCCT ACAAGCGTTA CTTGATGAAC 
TACTTCCGCA AATCGCTGGA CGTAATGGGA TCGCCGATTC GTATTCAGTT CAAAGAAGGG 
GAAAACCCGT ATGCGAACAA GCGTAACACC CTGACGCCAA CCCAGATGCG TAAACGTAAG 
CGTCTGATGA AGCACATCAA GAAAAATAAA TAA

Protein sequence

MVPVVALVGR PNVGKSTLFN RLTRTRDALV ADFPGLTRDR KYGRAEIEGR EFICIDTGGI 
DGTEDGVETR MAEQSLLAIE EADVVLFMVD ARAGLMPADE AIAKHLRSRE KPTFLVANKT 
DGLDPDQAVV DFYSLGLGEI YPIAASHGRG VLSLLEHVLL PWMEDLAPQE EVDEDAEYWA 
QFEAEENGEE EEEDDFDPQS LPIKLAIVGR PNVGKSTLTN RILGEERVVV YDMPGTTRDS 
IYIPMERDGR EYVLIDTAGV RKRGKITDAV EKFSVIKTLQ AIEDANVVML VIDAREGISD 
QDLSLLGFIL NSGRSLVIVV NKWDGLSQEV KEQVKETLDF RLGFIDFARV HFISALHGSG 
VGNLFESVRE AYDSSTRRVG TSMLTRIMTM AVEDHQPPLV RGRRVKLKYA HAGGYNPPIV 
VIHGNQVKDL PDSYKRYLMN YFRKSLDVMG SPIRIQFKEG ENPYANKRNT LTPTQMRKRK 
RLMKHIKKNK