Gene EcolC_0100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0100
Symbol	gpsA
ID	6068343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	104918
End bp	105937
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	57%
IMG OID	641599504
Product	NAD(P)H-dependent glycerol-3-phosphate dehydrogenase
Protein accession	YP_001723113
Protein GI	170018159
COG category	[C] Energy production and conversion
COG ID	[COG0240] Glycerol-3-phosphate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAAC GTAATGCTTC AATGACTGTG ATCGGTGCCG GCTCGTACGG CACCGCTCTT 
GCCATTACCC TGGCAAGAAA TGGCCACGAG GTTGTCCTCT GGGGCCATGA CCCTGAACAT 
ATCGCAACGC TTGAACGCGA CCGCTGTAAC GCCGCGTTTC TCCCCGATGT GCCTTTTCCC 
GATACGCTCC ATCTTGAAAG CGATCTCGCC ACTGCGCTGG CAGCCAGCCG TAATATTCTC 
GTCGTCGTAC CCAGCCATGT CTTTGGTGAA GTGCTGCGCC AGATTAAACC GCTGATGCGT 
CCTGATGCGC GTCTGGTGTG GGCGACCAAA GGGCTGGAAG CGGAAACCGG GCGTCTGTTA 
CAGGACGTGG CCCGCGAGGC GTTAGGCGAT CAAATTCCGC TGGCGGTTAT CTCTGGCCCA 
ACGTTTGCGA AAGAACTGGC GGCAGGTTTA CCGACAGCTA TTTCGCTGGC CTCTACCGAC 
CAGACCTTTG CCGATGATCT CCAACAATTG CTGCACTGTG GCAAAAGTTT CCGCGTTTAC 
AGCAACCCGG ATTTCATTGG CGTGCAGCTT GGCGGTGCGG TGAAAAACGT CATTGCCATT 
GGCGCGGGGA TGTCCGACGG TATCGGTTTT GGTGCGAATG CGCGTACGGC ACTGATCACC 
CGTGGGCTGG CTGAAATGTC GCGTCTTGGC GCGGCGCTGG GTGCCGATCC TGCCACCTTT 
ATGGGCATGG CGGGGCTGGG CGATCTTGTG CTTACCTGTA CCGACAACCA GTCGCGTAAC 
CGCCGTTTTG GCATGATGCT CGGTCAGGGC ATGGATGTAC AAAGCGCGCA GGAGAAGATT 
GGTCAGGTGG TGGAAGGCTA CCGCAATACG AAAGAAGTCC GCGAACTGGC GTATCGCTTC 
GGCGTAGAAA TGCCAATAAC CGAGGAAATT TATCAAGTAT TATATTGCGG AAAAAACGCG 
CGCGAGGCAG CATTGACGTT ATTAGGTCGT GCACGCAAGG ACGAGCGCAG CAGCCACTAA

Protein sequence

MNQRNASMTV IGAGSYGTAL AITLARNGHE VVLWGHDPEH IATLERDRCN AAFLPDVPFP 
DTLHLESDLA TALAASRNIL VVVPSHVFGE VLRQIKPLMR PDARLVWATK GLEAETGRLL 
QDVAREALGD QIPLAVISGP TFAKELAAGL PTAISLASTD QTFADDLQQL LHCGKSFRVY 
SNPDFIGVQL GGAVKNVIAI GAGMSDGIGF GANARTALIT RGLAEMSRLG AALGADPATF 
MGMAGLGDLV LTCTDNQSRN RRFGMMLGQG MDVQSAQEKI GQVVEGYRNT KEVRELAYRF 
GVEMPITEEI YQVLYCGKNA REAALTLLGR ARKDERSSH