Gene EcSMS35_3479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3479
Symbol	obgE
ID	6145638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3557194
End bp	3558366
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	53%
IMG OID	641618308
Product	GTPase ObgE
Protein accession	YP_001745455
Protein GI	170683110
COG category	[R] General function prediction only
COG ID	[COG0536] Predicted GTPase
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR02729] Obg family GTPase CgtA

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000528393
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTTG TTGATGAAGC ATCGATTCTG GTCGTTGCAG GTGATGGCGG TAATGGTTGC 
GTGAGCTTCC GCCGCGAAAA GTATATTCCG AAAGGCGGCC CGGATGGCGG CGACGGCGGT 
GACGGCGGTG ACGTATGGAT GGAAGCCGAC GAGAACCTGA ACACGCTTAT CGATTATCGT 
TTTGAAAAAT CTTTCCGCGC AGAGCGTGGT CAGAATGGCG CAAGCCGCGA CTGTACCGGT 
AAGCGCGGTA AAGACGTGAC GATTAAAGTG CCGGTAGGTA CGCGTGTTAT CGACCAGGGT 
ACCGGTGAAA CCATGGGCGA TATGACCAAA CACGGTCAGC GTCTGCTGGT TGCTAAGGGC 
GGCTGGCACG GTCTGGGCAA TACCCGTTTC AAATCGTCAG TTAACCGTAC ACCACGGCAG 
AAAACTAACG GTACGCCGGG CGATAAGCGT GAGCTGCTGC TGGAGCTGAT GCTGCTGGCT 
GACGTCGGTA TGTTGGGGAT GCCAAACGCG GGTAAATCGA CCTTTATTCG TGCGGTATCG 
GCGGCTAAAC CGAAAGTGGC GGATTATCCG TTTACCACTC TGGTGCCAAG TCTTGGTGTG 
GTACGAATGG ACAACGAAAA GAGCTTCGTT GTTGCCGATA TTCCAGGACT GATTGAAGGC 
GCTGCGGAAG GCGCTGGCCT GGGCATTCGC TTCCTGAAGC ACCTGGAGCG TTGCCGCGTT 
CTGTTGCACC TCATCGATAT CGATCCGATT GACGGCACCG ATCCGGTTGA AAACGCGCGT 
ATTATTATCA GCGAGCTGGA AAAATACAGC CAGGATCTGG CGGCGAAACC GCGTTGGTTA 
GTCTTCAACA AGATCGATCT GCTGGATAAG GCAGAAGCCG AAGAGAAAGC GAAAGCGATC 
GCTGAAGCGC TGGGCTGGGA AGATAAATAT TATCTGATCT CTGCGGCGAG CGGACTGGGC 
GTGAAAGATC TCTGCTGGGA TGTGATGACC TTTATCATTG AAAACCCGGT CGTGCAGGCT 
GAAGAAGCGA AACAGCCAGA GAAAGTCGAA TTCATGTGGG ATGATTATCA CCGTCAGCAG 
CTTGAAGAGA TTGCTGAAGA GGATGATGAA GACTGGGATG ACGACTGGGA CGAAGACGAC 
GAAGAAGGCG TTGAGTTCAT TTACAAGCGT TAA

Protein sequence

MKFVDEASIL VVAGDGGNGC VSFRREKYIP KGGPDGGDGG DGGDVWMEAD ENLNTLIDYR 
FEKSFRAERG QNGASRDCTG KRGKDVTIKV PVGTRVIDQG TGETMGDMTK HGQRLLVAKG 
GWHGLGNTRF KSSVNRTPRQ KTNGTPGDKR ELLLELMLLA DVGMLGMPNA GKSTFIRAVS 
AAKPKVADYP FTTLVPSLGV VRMDNEKSFV VADIPGLIEG AAEGAGLGIR FLKHLERCRV 
LLHLIDIDPI DGTDPVENAR IIISELEKYS QDLAAKPRWL VFNKIDLLDK AEAEEKAKAI 
AEALGWEDKY YLISAASGLG VKDLCWDVMT FIIENPVVQA EEAKQPEKVE FMWDDYHRQQ 
LEEIAEEDDE DWDDDWDEDD EEGVEFIYKR