Gene EcSMS35_3729 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3729
Symbol	ugpC
ID	6147384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3798532
End bp	3799602
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	57%
IMG OID	641618555
Product	glycerol-3-phosphate transporter ATP-binding subunit
Protein accession	YP_001745695
Protein GI	170682930
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGAC TGAAATTACA GGCAGTAACC AAAAGCTGGG ATGGCAAAAC CCAGGTCATT 
AAACCGCTGA CCCTTGATGT GGCGGATGGC GAATTTATCG TGATGGTCGG GCCGTCTGGC 
TGCGGGAAAT CGACGTTATT GCGAATGGTG GCCGGACTGG AGCGGGTAAC GACGGGCGAT 
ATCTGGATCG ACCGCAAGCG TGTCACCGAA ATGGAGCCGA AAGATCGCGG AATTGCGATG 
GTGTTCCAGA ACTACGCGCT CTATCCGCAT ATGAGCGTAG AGGAGAACAT GGCGTGGGGG 
CTGAAAATTC GCGGCATGGG CAAGCAACAA ATTGCCGAAC GTGTTAAAGA AGCGGCGCGC 
ATTCTGGAGC TGGACGGCCT GCTTAAGCGC CGCCCGCGTG AGCTATCTGG CGGTCAGCGT 
CAGCGTGTGG CGATGGGGCG TGCGATTGTG CGTGAGCCGG CAGTGTTCCT GTTTGATGAG 
CCGCTCTCTA ACCTCGATGC CAAGCTGCGT GTGCAGATGC GTCTTGAACT GCAACAGCTG 
CACCGTCGCC TGAAAACGAC TTCACTCTAC GTTACCCACG ATCAGGTTGA GGCGATGACG 
CTCGCCCAGC GAGTAATGGT GATGAACGGC GGCGTTGCCG AACAGATTGG CACGCCAGTG 
GAAGTCTACG AAAAGCCCGC CAGCCTGTTT GTAGCGAGTT TTATCGGCAG CCCGGCGATG 
AACCTACTGG CTGGCCGCGT GAATAACGAA GGTACGCATT TCGAACTGGA TGGTGGTATT 
ACGCTGCCGC TAAACGGTGG CTACCGTCAG TATGCCGGGC GTAAAATGAC CCTCGGCATT 
CGCCCGGAAC ATATAGCGCT AAGCTCGCAG GCAGAAGGTG GTGTGCCGCT GGTGATGGAC 
ACGCTGGAGA TCCTCGGCGC AGATAACCTG GCGCACGGAC GCTGGGGCGA ACAGAAGCTG 
GTGGTGCGAC TGGCACATCA GGAGCGCCCG ACGGCAGGCA GCACGCTGTG GCTGCATCTG 
CCGGAAAATC AGCTACATCT TTTTGATGGT GAAACAGGAC AACGAGTATG A

Protein sequence

MAGLKLQAVT KSWDGKTQVI KPLTLDVADG EFIVMVGPSG CGKSTLLRMV AGLERVTTGD 
IWIDRKRVTE MEPKDRGIAM VFQNYALYPH MSVEENMAWG LKIRGMGKQQ IAERVKEAAR 
ILELDGLLKR RPRELSGGQR QRVAMGRAIV REPAVFLFDE PLSNLDAKLR VQMRLELQQL 
HRRLKTTSLY VTHDQVEAMT LAQRVMVMNG GVAEQIGTPV EVYEKPASLF VASFIGSPAM 
NLLAGRVNNE GTHFELDGGI TLPLNGGYRQ YAGRKMTLGI RPEHIALSSQ AEGGVPLVMD 
TLEILGADNL AHGRWGEQKL VVRLAHQERP TAGSTLWLHL PENQLHLFDG ETGQRV