Gene EcSMS35_3945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3945
Symbol	gpsA
ID	6146824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4023859
End bp	4024878
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	57%
IMG OID	641618771
Product	NAD(P)H-dependent glycerol-3-phosphate dehydrogenase
Protein accession	YP_001745910
Protein GI	170683136
COG category	[C] Energy production and conversion
COG ID	[COG0240] Glycerol-3-phosphate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.874691
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAAC GTAATGCTTC AATGACTGTG ATCGGTGCCG GCTCGTACGG CACCGCTCTT 
GCCATCACCC TGGCAAGAAA TGGCCACGAG GTTGTCCTCT GGGGCCATGA CCCTGAACAT 
ATCGCAACGC TTGAACGCGA CCGCTGTAAC GCCGCGTTTC TCCCCGATGT GCCTTTTCCC 
GATACGCTCC ATCTTGAAAG CGATCTCGCC ACTGCGCTGG CAGCCAGCCG TAATATTCTC 
GTTGTCGTAC CCAGCCATGT CTTTGGTGAA GTGCTGCGCC AGATTAAACC GCTGATGCGT 
CCTGATGCGC GTCTGGTGTG GGCGACCAAA GGGCTGGAAG CAGAAACCGG ACGTCTGTTA 
CAGGACGTGG CGCGTGAGGC CTTAGGCGAT CAAATTCCGT TGGCGGTTAT CTCTGGCCCA 
ACGTTTGCGA AAGAACTGGC GGCAGGTTTA CCGACGGCCA TTTCGCTGGC CTCGACGGAC 
CAGACCTTTG CCGATGACCT CCAGCAATTG CTGCACTGTG GCAAAAGTTT CCGCGTTTAC 
AGCAATCCGG ATTTCATTGG CGTGCAGCTT GGCGGCGCGG TGAAAAACGT CATTGCCATT 
GGCGCGGGGA TGTCCGACGG TATCGGTTTT GGTGCGAATG CGCGTACGGC GCTGATCACC 
CGTGGACTGG CTGAAATGTC GCGTCTTGGC GCGGCGCTGG GTGCCGATCC TGCCACCTTT 
ATGGGCATGG CGGGGCTGGG CGATCTGGTG CTTACCTGTA CCGACAACCA GTCGCGTAAC 
CGCCGTTTTG GCATGATGCT CGGTCAGGGC ATGGATGTAC AAAGCGCGCA GGAGAAAATT 
GGTCAGGTGG TGGAAGGCTA CCGCAATACG AAAGAAGTCC GCGAACTGGC GCATCGCTTC 
GGCGTTGAAA TGCCAATAAC CGAGGAAATT TATCAAGTAT TATATTGCGG AAAAAACGCG 
CGCGAGGCAG CATTGACTTT ACTAGGTCGT GCACGCAAGG ACGAGCGCAG CAGCCACTAA

Protein sequence

MNQRNASMTV IGAGSYGTAL AITLARNGHE VVLWGHDPEH IATLERDRCN AAFLPDVPFP 
DTLHLESDLA TALAASRNIL VVVPSHVFGE VLRQIKPLMR PDARLVWATK GLEAETGRLL 
QDVAREALGD QIPLAVISGP TFAKELAAGL PTAISLASTD QTFADDLQQL LHCGKSFRVY 
SNPDFIGVQL GGAVKNVIAI GAGMSDGIGF GANARTALIT RGLAEMSRLG AALGADPATF 
MGMAGLGDLV LTCTDNQSRN RRFGMMLGQG MDVQSAQEKI GQVVEGYRNT KEVRELAHRF 
GVEMPITEEI YQVLYCGKNA REAALTLLGR ARKDERSSH