Gene EcolC_1166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1166
Symbol	engA
ID	6065502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1275394
End bp	1276866
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	52%
IMG OID	641600582
Product	GTP-binding protein EngA
Protein accession	YP_001724160
Protein GI	170019206
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03594] ribosome-associated GTPase EngA

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000585661
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0127623
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACCTG TGGTCGCGCT TGTCGGGCGC CCTAACGTAG GAAAATCCAC GTTATTTAAC 
CGTCTAACTC GCACCCGAGA TGCGCTGGTT GCGGATTTCC CGGGTCTGAC TCGTGACCGT 
AAGTACGGTC GTGCGGAAAT TGAAGGCCGT GAGTTTATCT GTATTGATAC CGGCGGGATT 
GATGGCACAG AAGACGGTGT AGAAACCCGC ATGGCGGAAC AGTCGCTGCT GGCGATTGAA 
GAAGCGGACG TCGTACTGTT TATGGTGGAT GCGCGCGCGG GCCTGATGCC GGCAGATGAA 
GCGATTGCCA AACATCTGCG CTCCCGTGAA AAACCGACCT TCCTGGTGGC AAACAAAACT 
GACGGTCTGG ATCCCGATCA GGCCGTGGTT GATTTCTACT CGCTTGGTTT AGGTGAAATC 
TACCCGATCG CCGCGTCTCA CGGTCGTGGC GTATTAAGTC TGCTGGAGCA TGTGCTGCTG 
CCGTGGATGG AAGATCTCGC ACCGCAAGAG GAAGTCGACG AAGACGCTGA ATACTGGGCG 
CAATTTGAAG CGGAAGAGAA CGGCGAAGAA GAAGAGGAAG ACGACTTCGA CCCGCAAAGT 
CTGCCGATCA AACTGGCGAT TGTGGGTCGT CCGAACGTAG GTAAGTCTAC ACTCACTAAC 
CGTATTCTTG GTGAAGAGCG CGTTGTTGTT TATGACATGC CTGGTACGAC GCGTGACAGT 
ATCTACATTC CAATGGAACG CGATGGACGT GAGTATGTGC TCATTGACAC CGCTGGCGTA 
CGTAAACGCG GTAAAATCAC CGATGCTGTA GAGAAATTCT CCGTAATCAA AACGTTGCAG 
GCCATTGAAG ATGCCAACGT GGTGATGTTA GTGATTGATG CGCGCGAAGG TATTTCCGAT 
CAGGATCTCT CGCTGCTGGG CTTTATTCTC AATAGTGGGC GCTCACTTGT CATTGTGGTG 
AATAAGTGGG ATGGCCTGAG TCAGGAAGTG AAAGAGCAGG TGAAAGAAAC GCTGGACTTC 
CGTCTGGGCT TTATCGATTT TGCTCGTGTG CACTTTATCT CTGCCTTGCA CGGCAGTGGT 
GTTGGTAACT TGTTTGAATC AGTACGTGAA GCGTATGACA GCTCCACCCG TCGTGTGGGG 
ACCTCTATGC TGACGCGCAT CATGACGATG GCTGTTGAAG ATCACCAACC GCCGCTTGTA 
CGCGGTCGTC GTGTGAAGCT GAAATATGCC CACGCCGGTG GTTATAACCC GCCGATTGTG 
GTGATTCACG GTAATCAGGT GAAAGACCTG CCTGATTCCT ACAAGCGTTA CTTGATGAAC 
TACTTCCGCA AATCGCTGGA CGTAATGGGA TCGCCGATTC GTATTCAGTT CAAAGAAGGG 
GAAAACCCGT ATGCGAACAA GCGTAACACC CTGACGCCAA CCCAGATGCG TAAACGTAAG 
CGTCTGATGA AGCACATCAA GAAAAATAAA TAA

Protein sequence

MVPVVALVGR PNVGKSTLFN RLTRTRDALV ADFPGLTRDR KYGRAEIEGR EFICIDTGGI 
DGTEDGVETR MAEQSLLAIE EADVVLFMVD ARAGLMPADE AIAKHLRSRE KPTFLVANKT 
DGLDPDQAVV DFYSLGLGEI YPIAASHGRG VLSLLEHVLL PWMEDLAPQE EVDEDAEYWA 
QFEAEENGEE EEEDDFDPQS LPIKLAIVGR PNVGKSTLTN RILGEERVVV YDMPGTTRDS 
IYIPMERDGR EYVLIDTAGV RKRGKITDAV EKFSVIKTLQ AIEDANVVML VIDAREGISD 
QDLSLLGFIL NSGRSLVIVV NKWDGLSQEV KEQVKETLDF RLGFIDFARV HFISALHGSG 
VGNLFESVRE AYDSSTRRVG TSMLTRIMTM AVEDHQPPLV RGRRVKLKYA HAGGYNPPIV 
VIHGNQVKDL PDSYKRYLMN YFRKSLDVMG SPIRIQFKEG ENPYANKRNT LTPTQMRKRK 
RLMKHIKKNK