Gene SbBS512_E2886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2886
Symbol	engA
ID	6268815
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2685330
End bp	2686802
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	52%
IMG OID	641726829
Product	GTP-binding protein EngA
Protein accession	YP_001881302
Protein GI	187731692
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03594] ribosome-associated GTPase EngA

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000000684219
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTACCTG TGGTCGCGCT TGTCGGGCGC CCTAACGTAG GAAAATCCAC GTTATTTAAC 
CGTCTAACTC GCACCCGAGA TGCGCTGGTT GCGGATTTCC CGGGTCTGAC TCGTGACCGT 
AAGTACGGTC GTGCGGAAAT TGAAGGCCGT GAGTTTATCT GTATTGATAC CGGCGGGATT 
GATGGCACAG AAGACGGTGT AGAAACCCGC ATGGCGGAAC AGTCGCTGCT GGCGATTGAA 
GAAGCGGACG TCGTACTGTT TATGGTGGAT GCGCGCGCGG GCCTGATGCC GGCAGATGAA 
GCGATTGCCA AACATCTGCG CTCCCGTGAA AAACCGACCT TCCTGGTGGC AAACAAAATT 
GACGGTCTGG ATCCCGATCA GGCAGTGGTT GATTTCTACT CGCTTGGCTT AGGTGAAATC 
TACCCGATCG CCGCGTCTCA CGGTCGTGGC GTATTAAGTC TGCTGGAGCA TGTGCTGCTG 
CCGTGGATGG AAGATCTCGC ACCGCAAGAG GAAGTCGACG AAGACGCTGA ATACTGGGCG 
CAATTTGAAG CGGAAGAGAA CGGCGAAGAA GAAGAGGAAG ACGACTTCGA CCCGCAAAGT 
CTGCCGATCA AACTGGCGAT TGTGGGTCGT CCGAACGTAG GTAAGTCTAC ACTCACTAAC 
CGTATTCTTG GTGAAGAGCG CGTTGTTGTT TATGACATGC CTGGCACGAC GCGTGACAGT 
ATCTACATTC CAATGGAACG CGATGGACGT GAGTATGTGC TCATTGACAC CGCTGGCGTA 
CGTAAACGCG GCAAAATCAC CGATGCTGTA GAGAAATTCT CCGTAATCAA AACGTTGCAG 
GCCATTGAAG ATGCCAACGT GGTGATGTTA GTGATTGATG CGCGCGAAGG TATTTCCGAT 
CAGGATCTCT CGCTGCTGGG CTTTATTCTC AATAGTGGGC GCTCACTTGT CATTGTGGTG 
AATAAGTGGG ATGGCCTGAG CCAGGAAGTG AAAGAGCAGG TGAAAGAAAC GCTGGACTTC 
CGTCTGGGCT TTATCGATTT TGCTCGTGTG CACTTTATCT CTGCCTTGCA CGGCAGTGGT 
GTTGGTAACT TGTTTGAATC AGTACGTGAA GCGTATGACA GCTCCACCCG TCGTGTGGGG 
ACCTCTATGC TGACGCGCAT CATGACGATG GCTGTTGAAG ATCACCAACC GCCGCTGGTA 
CGCGGTCGTC GTGTGAAGCT GAAATATGCC CACGCTGGTG GTTATAACCC GCCGATTGTG 
GTGATTCACG GTAATCAGGT GAAAGACCTG CCTGATTCCT ACAAGCGCTA CTTGATGAAC 
TACTTCCGCA AATCGCTGGA CGTAATGGGA TCGCCGATTC GTATTCAGTT CAAAGAAGGG 
GAAAACCCGT ATGCGAACAA GCGTAACACC CTGACGCCAA CCCAGATGCG TAAACGTAAG 
CGTCTGATGA AGCACATCAA GAAAAATAAA TAA

Protein sequence

MVPVVALVGR PNVGKSTLFN RLTRTRDALV ADFPGLTRDR KYGRAEIEGR EFICIDTGGI 
DGTEDGVETR MAEQSLLAIE EADVVLFMVD ARAGLMPADE AIAKHLRSRE KPTFLVANKI 
DGLDPDQAVV DFYSLGLGEI YPIAASHGRG VLSLLEHVLL PWMEDLAPQE EVDEDAEYWA 
QFEAEENGEE EEEDDFDPQS LPIKLAIVGR PNVGKSTLTN RILGEERVVV YDMPGTTRDS 
IYIPMERDGR EYVLIDTAGV RKRGKITDAV EKFSVIKTLQ AIEDANVVML VIDAREGISD 
QDLSLLGFIL NSGRSLVIVV NKWDGLSQEV KEQVKETLDF RLGFIDFARV HFISALHGSG 
VGNLFESVRE AYDSSTRRVG TSMLTRIMTM AVEDHQPPLV RGRRVKLKYA HAGGYNPPIV 
VIHGNQVKDL PDSYKRYLMN YFRKSLDVMG SPIRIQFKEG ENPYANKRNT LTPTQMRKRK 
RLMKHIKKNK