Gene ECH74115_5849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5849
Symbol
ID	6969397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5501448
End bp	5502599
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	53%
IMG OID	643389471
Product	putative 2-hydroxyglutaryl-CoA dehydratase, D-component
Protein accession	YP_002273863
Protein GI	209398248
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1775] Benzoyl-CoA reductase/2-hydroxyglutaryl-CoA dehydratase subunit, BcrC/BadD/HgdB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.981774
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTTG TCACCGATCT ACCCGCCATT TTCGATCAGT TCTCTGAAGC TCGCCAGAAA 
GGCTTTCTCA CCGTCATGGA TCTCAAGGTG CGCGGCATTC CGCTGGTTGG CACTTACTGC 
ACCTTTATGC CGCAAGAGAT CCCGATGGCA GCCGGTGCGG TTGTGGTTTC GCTCTGTTCC 
ACCTCTGATG AAACCATTGA AGAAGCGGAG AAAGATCTGC CGCGCAACCT CTGCCCGCTG 
ATTAAAAGTA GCTACGGCTT CGGCAAAACC GATAAATGCC CCTACTTCTA CTTTTCGGAT 
CTGGTGGTCG GTGAAACCAC CTGCGACGGC AAAAAGAAAA TGTATGAATA CATGGCGGAG 
TTTAAGCCCG TTCATGTGAT GCAGCTGCCA AACAGCGTTA AAGACGATGC CTCGCGTGCG 
TTATGGAAAG CCGAGATGCT GCGCTTACAA AAAGCGGTGG AAGAACGTTT TGGGCACGAA 
ATTAGCGAAG ATGCTCTGCG CGATGCCATT GCGCTGAAAA ACCGCGAACG TCGCGCACTG 
GCCAATTTTT ATCATCTTGG GCAGTTCAAT CCTCCGGCGC TTAGCGGCAG CGACATTCTG 
AAAGTGGTTT ACGGCGCAAC CTTCCGGTTC GATAAAGAGG CGTTGATCAA TGAACTGGAC 
GCGATGACCG CCCGCATTCG TCAGCAGTGG GAAGAAGGCC AGCGACTGGA CCCGCGTCCG 
CGCATTTTAA TCACCGGCTG CCCGATTGGC GGCGCAGCAG AGAAAGTGGT GCGCGCGATT 
GAAGAGAATG GCGGCTGGGT TGTCGGTTAT GAAAACTGCA CCGGGGCGAA AGCGACCGAG 
CAATGCGTGG TAGAAACGGG CGATGTCTAC GACGCGCTGG CGGATAAATA TCTGGCGATT 
GGCTGCTCCT GTGTTTCGCC GAACGATCAG CGCCTGAAAA TGCTCAGCCA GATGGTGGAA 
GAATATCAGG TCGATGGCGT AGTTGATGTG ATTTTGCAGG CGTGCCATAC CTACGCGGTG 
GAATCGCTGG CAATTAAACG TCATGTGCGT CAGCAGCACA ACATTCCTTA TATCGCTATT 
GAAACAGACT ACTCCACCTC GGATGTTGGG CAGCTCAGTA CCCGTGTCGC GGCCTTTATT 
GAGATGCTGT AA

Protein sequence

MSLVTDLPAI FDQFSEARQK GFLTVMDLKV RGIPLVGTYC TFMPQEIPMA AGAVVVSLCS 
TSDETIEEAE KDLPRNLCPL IKSSYGFGKT DKCPYFYFSD LVVGETTCDG KKKMYEYMAE 
FKPVHVMQLP NSVKDDASRA LWKAEMLRLQ KAVEERFGHE ISEDALRDAI ALKNRERRAL 
ANFYHLGQFN PPALSGSDIL KVVYGATFRF DKEALINELD AMTARIRQQW EEGQRLDPRP 
RILITGCPIG GAAEKVVRAI EENGGWVVGY ENCTGAKATE QCVVETGDVY DALADKYLAI 
GCSCVSPNDQ RLKMLSQMVE EYQVDGVVDV ILQACHTYAV ESLAIKRHVR QQHNIPYIAI 
ETDYSTSDVG QLSTRVAAFI EML