Gene EcolC_2242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2242
Symbol
ID	6064371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2460629
End bp	2461630
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	48%
IMG OID	641601647
Product	glyceraldehyde-3-phosphate dehydrogenase, type I
Protein accession	YP_001725206
Protein GI	170020252
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAAG TTGGTATTAA CGGTTTTGGT CGTATCGGTC GACTGGTGTT GCGTCGATTA 
CTTGAAGTCA AAAGCAACAT AGACGTTGTC GCTATTAATG ATCTCACTTC CCCAAAAATT 
CTCGCCTACC TGCTGAAACA TGATTCAAAC TACGGACCAT TCCCCTGGAG CGTTGATTTT 
ACGGAAGATT CACTTATCGT TGATGGGAAA AGTATCGCGG TTTACGCCGA AAAAGAGGCT 
AAAAATATTC CGTGGAAAGC GAAAGGTGCA GAAATCATTG TCGAATGTAC TGGCTTTTAT 
ACCTCCGCCG AGAAATCGCA GGCGCATCTT GATGCTGGTG CGAAGAAGGT GTTGATTTCC 
GCCCCTGCCG GTGAAATGAA AACTATCGTT TATAACGTCA ATGACGACAC TCTGGATGGC 
AACGACACCA TTGTTTCCGT GGCGTCATGC ACCACTAACT GTCTTGCGCC GATGGCCAAA 
GCCTTGCATG ACAGTTTCGG GATAGAAGTC GGCACGATGA CGACCATTCA TGCCTATACT 
GGCACCCAGT CACTGGTGGA TGGCCCGCGT GGTAAAGATT TACGTGCTTC ACGCGCAGCG 
GCAGAAAATA TCATTCCCCA CACTACGGGG GCGGCAAAAG CCATTGGTCT GGTGATCCCG 
GAACTGAGCG GCAAACTGAA AGGTCATGCG CAACGCGTGC CGGTGAAAAC AGGTTCGGTC 
ACTGAACTGG TATCGATTCT CGGAAAAAAA GTGACTGCCG AAGAGGTGAA TAACGCACTT 
AAACAAGCAA CCACCAATAA CGAGTCATTT GGTTATACCG ATGAAGAAAT AGTCTCTTCC 
GATATCATTG GCAGCCATTT CGGTTCGGTG TTTGATGCCA CGCAAACGGA AATTACCGCC 
GTGGGCGATT TACAACTGGT GAAAACGGTC GCCTGGTACG ATAACGAATA TGGCTTCGTC 
ACACAGCTTA TTCGCACCCT CGAAAAATTC GCTAAACTCT GA

Protein sequence

MSKVGINGFG RIGRLVLRRL LEVKSNIDVV AINDLTSPKI LAYLLKHDSN YGPFPWSVDF 
TEDSLIVDGK SIAVYAEKEA KNIPWKAKGA EIIVECTGFY TSAEKSQAHL DAGAKKVLIS 
APAGEMKTIV YNVNDDTLDG NDTIVSVASC TTNCLAPMAK ALHDSFGIEV GTMTTIHAYT 
GTQSLVDGPR GKDLRASRAA AENIIPHTTG AAKAIGLVIP ELSGKLKGHA QRVPVKTGSV 
TELVSILGKK VTAEEVNNAL KQATTNNESF GYTDEEIVSS DIIGSHFGSV FDATQTEITA 
VGDLQLVKTV AWYDNEYGFV TQLIRTLEKF AKL