Gene EcolC_1853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1853
Symbol
ID	6065095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2052922
End bp	2053917
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	50%
IMG OID	641601267
Product	glyceraldehyde-3-phosphate dehydrogenase, type I
Protein accession	YP_001724829
Protein GI	170019875
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0430759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000191582
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTATCA AAGTAGGTAT CAACGGTTTT GGCCGTATCG GTCGCATTGT TTTCCGTGCT 
GCTCAGAAAC GTTCTGACAT CGAGATCGTT GCAATCAACG ACCTGTTAGA CGCTGATTAC 
ATGGCATACA TGCTGAAATA TGACTCCACT CACGGCCGTT TCGACGGTAC CGTTGAAGTG 
AAAGACGGTC ATCTGATCGT TAACGGTAAA AAAATCCGTG TTACCGCTGA ACGTGATCCG 
GCTAACCTGA AATGGGACGA AGTTGGTGTT GACGTTGTCG CTGAAGCAAC TGGTCTGTTC 
CTGACTGACG AAACTGCTCG TAAACACATC ACCGCTGGTG CGAAGAAAGT GGTTATGACT 
GGTCCGTCTA AAGACAACAC TCCGATGTTC GTTAAAGGCG CTAACTTCGA CAAATATGCT 
GGCCAGGACA TCGTTTCCAA CGCTTCCTGC ACCACCAACT GCCTGGCTCC GCTGGCTAAA 
GTTATCAACG ATAACTTCGG CATCATCGAA GGTCTGATGA CCACCGTTCA CGCTACTACC 
GCTACTCAGA AAACCGTTGA TGGCCCGTCT CACAAAGACT GGCGCGGCGG CCGCGGCGCT 
TCCCAGAACA TCATCCCGTC CTCTACCGGT GCTGCTAAAG CTGTAGGTAA AGTACTGCCA 
GAACTGAATG GCAAACTGAC TGGTATGGCG TTCCGCGTTC CGACCCCGAA CGTATCCGTA 
GTTGACCTGA CCGTTCGTCT GGAAAAAGCT GCAACTTACG AGCAGATCAA AGCTGCCGTT 
AAAGCTGCTG CTGAAGGCGA AATGAAAGGC GTTCTGGGCT ACACCGAAGA TGACGTAGTA 
TCTACCGATT TCAACGGCGA AGTTTGCACT TCCGTGTTCG ATGCTAAAGC TGGTATCGCT 
CTGAACGACA ACTTCGTGAA ACTGGTATCC TGGTACGACA ACGAAACCGG TTACTCCAAC 
AAAGTTCTGG ACCTGATCGC TCACATCTCC AAATAA

Protein sequence

MTIKVGINGF GRIGRIVFRA AQKRSDIEIV AINDLLDADY MAYMLKYDST HGRFDGTVEV 
KDGHLIVNGK KIRVTAERDP ANLKWDEVGV DVVAEATGLF LTDETARKHI TAGAKKVVMT 
GPSKDNTPMF VKGANFDKYA GQDIVSNASC TTNCLAPLAK VINDNFGIIE GLMTTVHATT 
ATQKTVDGPS HKDWRGGRGA SQNIIPSSTG AAKAVGKVLP ELNGKLTGMA FRVPTPNVSV 
VDLTVRLEKA ATYEQIKAAV KAAAEGEMKG VLGYTEDDVV STDFNGEVCT SVFDAKAGIA 
LNDNFVKLVS WYDNETGYSN KVLDLIAHIS K