Gene ECH74115_4764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4764
Symbol	ugpC
ID	6968129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4408849
End bp	4409919
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	58%
IMG OID	643388460
Product	glycerol-3-phosphate transporter ATP-binding subunit
Protein accession	YP_002272888
Protein GI	209399510
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.257443
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGAC TGAAATTACA GGCAGTAACC AAAAGCTGGG ATGGCAAAAC CCAGGTGATT 
AAACCGCTGA CCCTTGATGT GGCGGATGGC GAATTTATCG TGATGGTCGG GCCGTCAGGC 
TGCGGGAAAT CGACGCTGCT GCGCATGGTT GCCGGGCTGG AGCGGGTGAC GGAAGGCGAT 
ATCTGTATCA ACGACCAGCG GGTGACCGAA ATGGAGCCGA AAGATCGCGG GATTGCGATG 
GTGTTCCAGA ACTACGCGCT TTATCCGCAT ATGAGTGTTG AAGAAAACAT GGCGTGGGGG 
CTGAAAATTC GCGGCATGGG CAAGCAGCAA ATTGCCGAGC GCGTTAAAGA GGCGGCGCGC 
ATTCTGGAAC TGGACGGTCT GCTTAAGCGC CGCCCGCGCG AGCTTTCCGG CGGTCAGCGT 
CAGCGTGTGG CGATGGGCCG GGCGATTGTG CGCGATCCGG CGGTGTTCCT GTTTGATGAG 
CCACTCTCTA ACCTCGATGC CAAGCTGCGC GTACAGATGC GTCTTGAACT GCAACAGCTG 
CACCGTCGCC TGAAAACGAC TTCACTCTAC GTTACTCACG ATCAGGTTGA GGCGATGACC 
CTCGCCCAGC GAGTAATGGT GATGAACGGC GGCGTTGCCG AACAGATTGG CACACCAGTT 
GAAGTCTACG AAAAGCCCGC CAGCCTGTTT GTGGCGAGTT TTATTGGCAG CCCGGCGATG 
AATCTGCTGA CAGGCCGCGT GAATAACGAA GGCACGCACT TCGAGCTGGA CGGCGGCATT 
GCGCTGCCGC TAAACGGTGG CTACCGTCAG TATGCAGGGC GTAAAATGAC TCTCGGCATT 
CGCCCGGAAC ATATCGCGCT AAGCTCGCAG GCAGAAGGCG GCGTGCCGCT GGTGATGGAC 
ACGCTGGAGA TCCTCGGCGC AGATAACCTG GCGCACGGAC GCTGGGGCGA ACAGAAGCTG 
GTGGTACGGC TGGCGCATCA GGAGCGCCCG ACGGCAGGCA GCACGCTGTG GCTGCATCTG 
CCGGAAAATC AGCTACATCT TTTTGATGGT GAAACAGGAC AACGAGTATG A

Protein sequence

MAGLKLQAVT KSWDGKTQVI KPLTLDVADG EFIVMVGPSG CGKSTLLRMV AGLERVTEGD 
ICINDQRVTE MEPKDRGIAM VFQNYALYPH MSVEENMAWG LKIRGMGKQQ IAERVKEAAR 
ILELDGLLKR RPRELSGGQR QRVAMGRAIV RDPAVFLFDE PLSNLDAKLR VQMRLELQQL 
HRRLKTTSLY VTHDQVEAMT LAQRVMVMNG GVAEQIGTPV EVYEKPASLF VASFIGSPAM 
NLLTGRVNNE GTHFELDGGI ALPLNGGYRQ YAGRKMTLGI RPEHIALSSQ AEGGVPLVMD 
TLEILGADNL AHGRWGEQKL VVRLAHQERP TAGSTLWLHL PENQLHLFDG ETGQRV