Gene EcSMS35_3712 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3712
Symbol	glgC
ID	6145179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3778419
End bp	3779714
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	53%
IMG OID	641618538
Product	glucose-1-phosphate adenylyltransferase
Protein accession	YP_001745678
Protein GI	170682122
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0448] ADP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR02091] glucose-1-phosphate adenylyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.499827
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.460208
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAGTT TAGAGAAGAA CGATCACTTA ATGTTGGCGC GCCAGCTGCC ATTGAAATCT 
GTTGCCCTGA TACTGGCGGG AGGACGTGGT ACCCGCCTGA AGGATTTAAC CAATAAGCGA 
GCAAAACCGG CCGTACACTT CGGCGGTAAG TTCCGCATTA TCGACTTTGC GCTGTCTAAC 
TGCATCAACT CCGGGATCCG TCGTATGGGC GTGATCACCC AGTACCAGTC CCACACTCTG 
GTGCAGCACA TTCAGCGCGG CTGGTCATTC TTCAATGAAG AAATGAACGA GTTTGTCGAT 
CTGCTGCCAG CACAGCAGAG AATGAAAGGG GAAAACTGGT ATCGCGGCAC CGCAGATGCG 
GTCACCCAAA ACCTCGACAT TATCCGCCGT TATAAAGCGG AATACGTGGT GATCCTGGCG 
GGCGACCATA TCTACAAGCA AGACTACTCG CGTATGCTTA TCGACCACGT CGAAAAAGGC 
GCACGTTGCA CCGTTGCTTG TATGCCAGTA CCGATTGAAG AAGCCTCCGC GTTTGGCGTT 
ATGGCGGTTG ATGAGAACGA TAAAATTATC GAATTCGTTG AAAAACCAGC TAACCCGCCG 
TCAATGCCGA ACGATCCGAG CAAATCTCTG GCGAGTATGG GTATTTACGT CTTTGACGCC 
GACTATCTGT ATGAACTGCT GGAAGAAGAC GATCGCGATG AGAACTCCAG CCACGACTTT 
GGCAAAGATT TGATTCCCAA GATCACCGAA GCCGGTCTGG CCTATGCGCA TCCGTTCCCG 
CTCTCTTGCG TACAATCCGA CCCGGATGCC GAGCCGTACT GGCGCGATGT GGGTACGCTG 
GAAGCTTACT GGAAAGCGAA CCTCGATCTG GCCTCTGTGG TGCCGGAACT GGATATGTAC 
GATCGCAATT GGCCAATTCG CACCTACAAT GAATCATTAC CGCCAGCGAA ATTCGTGCAG 
GATCGCTCCG GTAGCCACGG GATGACCCTT AACTCACTGG TATCCGGCGG TTGTGTGATC 
TCCGGTTCGG TGGTGGTGCA GTCCGTTCTG TTCTCGCGCG TTCGCGTGAA TTCATTCTGC 
AACATTGATT CCGCCGTATT GTTACCGGAA GTATGGGTAG GTCGCTCGTG CCGTCTGCGC 
CGCTGCGTCA TCGATCGTGC TTGTGTTATT CCGGAAGGCA TGGTGATTGG TGAAAACGCA 
GAGGAAGATG CACGTCGTTT CTATCGTTCA GAAGAAGGCA TCGTGCTGGT AACGCGCGAA 
ATGCTACGGA AGTTAGGGCA TAAACAGGAG CGATAA

Protein sequence

MVSLEKNDHL MLARQLPLKS VALILAGGRG TRLKDLTNKR AKPAVHFGGK FRIIDFALSN 
CINSGIRRMG VITQYQSHTL VQHIQRGWSF FNEEMNEFVD LLPAQQRMKG ENWYRGTADA 
VTQNLDIIRR YKAEYVVILA GDHIYKQDYS RMLIDHVEKG ARCTVACMPV PIEEASAFGV 
MAVDENDKII EFVEKPANPP SMPNDPSKSL ASMGIYVFDA DYLYELLEED DRDENSSHDF 
GKDLIPKITE AGLAYAHPFP LSCVQSDPDA EPYWRDVGTL EAYWKANLDL ASVVPELDMY 
DRNWPIRTYN ESLPPAKFVQ DRSGSHGMTL NSLVSGGCVI SGSVVVQSVL FSRVRVNSFC 
NIDSAVLLPE VWVGRSCRLR RCVIDRACVI PEGMVIGENA EEDARRFYRS EEGIVLVTRE 
MLRKLGHKQE R