Gene ECH74115_4981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4981
Symbol	gpsA
ID	6971912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4632578
End bp	4633597
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	57%
IMG OID	643388663
Product	NAD(P)H-dependent glycerol-3-phosphate dehydrogenase
Protein accession	YP_002273090
Protein GI	209398298
COG category	[C] Energy production and conversion
COG ID	[COG0240] Glycerol-3-phosphate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAAC GTAATGCTTC AATGACTGTG ATCGGTGCCG GCTCGTACGG CACCGCTCTT 
GCCATCACCC TGGCAAGAAA TGGCCACGAG GTTGTCCTCT GGGGCCATGA CCCTGAACAT 
ATCGCAACGC TTGAACGCGA CCGCTGTAAC GCCGCGTTTC TCCCCGATGT GCCTTTTCCC 
GATACGCTCC ATCTTGAAAG CGATCTCGCC ACTGCGCTGG CAGCCAGCCG TAATATTCTC 
GTCGTCGTAC CCAGCCATGT CTTTGGTGAA GTGCTGCGCC AGATTAAACC GCTGATGCGT 
CCTGATGCGC GTCTGGTGTG GGCGACCAAA GGGCTGGAAG CGGAAACCGG ACGTCTGTTA 
CAGGACGTGG CGCGTGAGGC CTTAGGCGAT CAAATTCCGC TGGCGGTTAT CTCTGGCCCA 
ACGTTTGCGA AAGAACTGGC GGCAGGTTTA CCGACAGCTA TTTCGCTGGC CTCGACCGAT 
CAGACCTTTG CCGATGATCT CCAGCAGCTG CTGCACTGCG GCAAAAGTTT CCGCGTTTAC 
AGCAATCCGG ATTTCATTGG CGTGCAGCTT GGCGGTGCGG TGAAAAACGT CATTGCCATT 
GGCGCGGGGA TGTCCGACGG TATCGGTTTT GGTGCGAATG CGCGTACGGC ACTGATCACC 
CGTGGGCTGG CTGAAATGTC GCGTCTTGGC GCGGCGCTGG GTGCCGATCC TGCCACCTTT 
ATGGGCATGG CGGGGCTGGG CGATCTTGTG CTTACTTGTA CCGACAACCA GTCGCGTAAC 
CGCCGTTTTG GCATGATGCT CGGTCAGGGC ATGGATGTAC AAAGCGCGCA GGAGAAGATT 
GGTCAGGTGG TGGAAGGCTA CCGCAATACG AAAGAAGTCC GCGAACTGGC GCATCGCTTC 
GGCGTAGAAA TGCCAATAAC CGAGGAAATT TATCAAGTAT TATATTGCGG AAAAAACGCG 
CGCGAGGCAG CATTGACGTT ATTAGGTCGT GCACGCAAGG ACGAGCGCAG CAGCCACTAA

Protein sequence

MNQRNASMTV IGAGSYGTAL AITLARNGHE VVLWGHDPEH IATLERDRCN AAFLPDVPFP 
DTLHLESDLA TALAASRNIL VVVPSHVFGE VLRQIKPLMR PDARLVWATK GLEAETGRLL 
QDVAREALGD QIPLAVISGP TFAKELAAGL PTAISLASTD QTFADDLQQL LHCGKSFRVY 
SNPDFIGVQL GGAVKNVIAI GAGMSDGIGF GANARTALIT RGLAEMSRLG AALGADPATF 
MGMAGLGDLV LTCTDNQSRN RRFGMMLGQG MDVQSAQEKI GQVVEGYRNT KEVRELAHRF 
GVEMPITEEI YQVLYCGKNA REAALTLLGR ARKDERSSH