Gene EcolC_1601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1601
Symbol
ID	6066255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1781588
End bp	1782673
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	44%
IMG OID	641601017
Product	dTDP-glucose 4,6 dehydratase
Protein accession	YP_001724587
Protein GI	170019633
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATAC TTGTTACTGG TGGCGCAGGA TTTATTGGTT CTGCTGTAGT TCGTCACATT 
ATAAATAATA CGCAGGATAG TGTTGTTAAT GTCGATAAAT TAACGTACGC CGGAAACCTG 
GAATCACTTG CTGATGTTTC TGATTCTGAA CGCTATGTTT TTGAACATGC GGATATTTGC 
GATGCAGCTG CAATGGCACG GATTTTTGCT CAGCATCAGC CGGATGCAGT GATGCACCTG 
GCTGCTGAAA GCCATGTTGA CCGTTCAATT ACAGGCCCTG CGGCATTTAT TGAAACCAAT 
ATTGTTGGTA CTTATGTCCT TTTGGAAGCC GCTCGCAATT ACTGGTCTGC TCTTGATAGC 
GACAAGAAAA ATAGCTTCCG TTTTCATCAT ATTTCTACTG ACGAAGTCTA TGGCGATCTG 
CCTCATCCTG ACGAAGTAAA TAATAAAGAA GAATTACCCC TCTTTACTGA GACGACAGCT 
TACGCGCCAA GCAGCCCATA TTCTGCTTCT AAAGCATCCA GCGATCATTT AGTCCGCGCG 
TGGAAACGTA CCTATGGTTT ACCGACCATT GTGACTAACT GTTCGAATAA CTACGGCCCT 
TATCACTTTC CGGAAAAATT GATTCCGCTG GTAATTCTTA ATGCTCTGGA AGGTAAGGCA 
TTACCTATTT ATGGCAAAGG GGATCAAATT CGCGATTGGC TGTATGTTGA AGATCATGCG 
CGTGCGTTAT ATACCGTTGT AACCGAAGGT AAAGCGGGTG AAACTTATAA CATTGGCGGA 
CACAACGAAA AGAAAAACAT CGATGTTGTG CTGACTATTT GTGATTTGTT GGATGAGATT 
GTACCGAAAG AGCAATCTTA TCGTGAGCAA ATTACTTATG TTGCCGATCG TCCGGGACAC 
GATCGCCGTT ATGCGATTGA TGCTGAGAAG ATTAGCCGCG AATTGGGCTG GAAACCGCAG 
GAAACGTTTG AGAGCGGGAT TCGGAAGACA GTGGAATGGT ACCTGTCCAA TACAAAATGG 
GTCGAAAATG TGAAAAGTGG TGCCTATCAG TCATGGATTG CACAGAACTA TGAGGGCCGC 
CAGTAA

Protein sequence

MKILVTGGAG FIGSAVVRHI INNTQDSVVN VDKLTYAGNL ESLADVSDSE RYVFEHADIC 
DAAAMARIFA QHQPDAVMHL AAESHVDRSI TGPAAFIETN IVGTYVLLEA ARNYWSALDS 
DKKNSFRFHH ISTDEVYGDL PHPDEVNNKE ELPLFTETTA YAPSSPYSAS KASSDHLVRA 
WKRTYGLPTI VTNCSNNYGP YHFPEKLIPL VILNALEGKA LPIYGKGDQI RDWLYVEDHA 
RALYTVVTEG KAGETYNIGG HNEKKNIDVV LTICDLLDEI VPKEQSYREQ ITYVADRPGH 
DRRYAIDAEK ISRELGWKPQ ETFESGIRKT VEWYLSNTKW VENVKSGAYQ SWIAQNYEGR 
Q