Gene EcolC_3728 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3728
Symbol
ID	6065654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4081205
End bp	4082356
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	53%
IMG OID	641603145
Product	2-hydroxyglutaryl-CoA dehydratase D-component
Protein accession	YP_001726665
Protein GI	170021711
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1775] Benzoyl-CoA reductase/2-hydroxyglutaryl-CoA dehydratase subunit, BcrC/BadD/HgdB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTTA TCACCGATCT ACCCGCCATT TTCGATCAAT TCTCTGAAGC TCGCCAGAAA 
GGTTTTCTCG CCGTTATGGA TTTCAAAGAG CGCGGCATTC CGCTGGTTGG CACCTACTGC 
ACGTTCATGC CGCAAGAGAT CCCGATGGCT GCCGGTGCGG TTGTGGTTTC ACTCTGCTCC 
ACCTCCGATG AAACCATCGA AGAAGCCGAG AAAGACCTGC CGCGCAATCT CTGCCCGCTG 
ATCAAAAGCA GCTACGGCTT TGGCAAAACC GATAAATGCC CCTACTTCTA CTTTTCCGAT 
CTGGTGGTTG GTGAAACTAC CTGCGACGGC AAAAAGAAAA TGTATGAATA CATGGCGGAG 
TTTAAGCCCG TTCATGTGAT GCAATTGCCT AACAGCGTGC AGGATGACGC CTCACGCGCG 
TTGTGGAAAG CCGAGATGCT GCGCCTGCAA ACAGCGGTAG AAGAGCGTTT TGGCAAAGAG 
ATAACCGAAG AGGCGCTGCG CGATGCCATT GCACTGAAAA ACCGCGAACG CCGTGCGCTG 
GCCAATTTTT ATCATCTTGG GCAGTTAAAT CCTCCGGCGT TAAGCGGCAG CGACATTCTG 
AAAGTGGTTT ACGGCGCAAC ATTCCGTTTT GACAAAGAAG CGCTGATCGA CGAACTCGAT 
GCAATGACCG CCCGCGTTCG CCAGCAGTGG GAAGAGGGTC AGCGGCTGGA CACGCGTCCA 
CGCATTCTGA TAACTGGCTG CCCGATTGGC GGTGCGGCAG AGAAAGTGGT GCGTGCCATC 
GAAGAGAATG GTGGCTGGGT TGTCGGTTAT GAAAACTGCA CCGGGGCGAA AGCGACAGAG 
CAATGCGTGG CGGAAACGGG CGATGTGTAC GACGCACTGG CTGATAAGTA TCTGGCAATC 
GGCTGCTCCT GTGTTTCGCC GAACGATCAG CGCCTGAAAA TGCTCAGCCA GATGGTGGAA 
GAATATCAGG TCGATGGCGT AGTTGATGTG ATTTTGCAGG CGTGCCATAC CTACGCGGTG 
GAATCGCTGG CGATTAAACG TCATGTGCGT CAGCAGCACA ACATTCCTTA TATCGCTATT 
GAAACAGACT ACTCCACCTC AGATGTCGGG CAGCTCAGTA CCCGTGTCGC GGCCTTTATT 
GAGATGCTGT AA

Protein sequence

MSLITDLPAI FDQFSEARQK GFLAVMDFKE RGIPLVGTYC TFMPQEIPMA AGAVVVSLCS 
TSDETIEEAE KDLPRNLCPL IKSSYGFGKT DKCPYFYFSD LVVGETTCDG KKKMYEYMAE 
FKPVHVMQLP NSVQDDASRA LWKAEMLRLQ TAVEERFGKE ITEEALRDAI ALKNRERRAL 
ANFYHLGQLN PPALSGSDIL KVVYGATFRF DKEALIDELD AMTARVRQQW EEGQRLDTRP 
RILITGCPIG GAAEKVVRAI EENGGWVVGY ENCTGAKATE QCVAETGDVY DALADKYLAI 
GCSCVSPNDQ RLKMLSQMVE EYQVDGVVDV ILQACHTYAV ESLAIKRHVR QQHNIPYIAI 
ETDYSTSDVG QLSTRVAAFI EML