Gene EcHS_A4563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4563
Symbol
ID	5595311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4569707
End bp	4570858
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	53%
IMG OID	640923659
Product	putative 2-hydroxyglutaryl-CoA dehydratase, D-component
Protein accession	YP_001461099
Protein GI	157163781
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1775] Benzoyl-CoA reductase/2-hydroxyglutaryl-CoA dehydratase subunit, BcrC/BadD/HgdB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACTTA TCACCGATCT ACCCGCCATT TTCGATCAGT TCTCTGAAGC TCGCCAGAAA 
GGCTTTCTCA CCGTCATGGA TCTCAAGGAG CGCGGCATTC CGCTGGTTGG CACTTACTGC 
ACCTTTATGC CGCAAGAGAT CCCGATGGCA GCCGGTGCGG TTGTGGTTTC GCTCTGTTCT 
ACCTCTGATG AAACCATTGA AGAAGCGGAG AAAGATCTGC CGCGCAACCT CTGCCCGCTG 
ATTAAAAGCA GCTACGGCTT CGGCAAAACC GATAAATGCC CCTACTTCTA CTTTTCGGAT 
CTGGTGGTCG GTGAAACCAC CTGCGACGGC AAAAAGAAAA TGTATGAATA CATGGCGGAG 
TTTAAGCCCG TTCATGTGAT GCAGTTGCCG AACAGCGTTA AGGACGATGC CTCGCGTGCG 
TTATGGAAAG CCGAGATGCT GCGCTTGCAA AAAACGATAG AAGAACGTTT TGGGCACGAG 
ATTAGCGAAG ATGCTCTGCG CGATGCCATT GCGCTGAAAA ACCGCGAACG TCGCGCACTG 
GCCAATTTTT ATCATCTTGG GCAGTTAAAT CCTCCGGCGC TTAGCGGCAG CGACATTCTG 
AAAGTGGTTT ACGGCGCAAC CTTCCGGTTC GATAAAGAGG CGTTGATCAA TGAACTGGAC 
GCGATGACAG CCCGCGTTCG TCAGCAGTGG GAAGAAGGCC AGCGGCTGGC CCTGCGTCCA 
CGCATTTTAA TCACCGGCTG CCCGATTGGC GGCGCAGCAG AAAAAGTGGT GCGCGCGATT 
GAAGAGAATG GCGGCTGGGT TGTCGGTTAT GAAAACTGCA CCGGGGCGAA AGCGACCGAG 
CAATGCGTGG CAGAAACGGG CGATGTCTAC GACGCACTGG CGGATAAATA TCTGGCGATT 
GGCTGCTCCT GTGTTTCGCC GAACGATCAG CGCCTGCAAA TGCTCAGCCA GATGGTGGAA 
GAATATCAGG TCGATGGCGT AGTTGATGTG ATTTTGCAGG CGTGCCATAC CTACGCGGTG 
GAATCGCTGG CGATTAAACG TCATGTGCGT CAGCAGCACA ACATTCCTTA TATCGCTATT 
GAAACAGACT ACTCCACCTC AGATGTCGGG CAGCTCAGTA CCCGTGTCGC GGCCTTTATT 
GAGATGCTGT AA

Protein sequence

MSLITDLPAI FDQFSEARQK GFLTVMDLKE RGIPLVGTYC TFMPQEIPMA AGAVVVSLCS 
TSDETIEEAE KDLPRNLCPL IKSSYGFGKT DKCPYFYFSD LVVGETTCDG KKKMYEYMAE 
FKPVHVMQLP NSVKDDASRA LWKAEMLRLQ KTIEERFGHE ISEDALRDAI ALKNRERRAL 
ANFYHLGQLN PPALSGSDIL KVVYGATFRF DKEALINELD AMTARVRQQW EEGQRLALRP 
RILITGCPIG GAAEKVVRAI EENGGWVVGY ENCTGAKATE QCVAETGDVY DALADKYLAI 
GCSCVSPNDQ RLQMLSQMVE EYQVDGVVDV ILQACHTYAV ESLAIKRHVR QQHNIPYIAI 
ETDYSTSDVG QLSTRVAAFI EML