Gene Cthe_3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3103
Symbol
ID	4809729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3659904
End bp	3660890
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	41%
IMG OID	640108531
Product	2-hydroxyglutaryl-CoA dehydratase, D-component
Protein accession	YP_001039491
Protein GI	125975581
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1775] Benzoyl-CoA reductase/2-hydroxyglutaryl-CoA dehydratase subunit, BcrC/BadD/HgdB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAAATA TAGGTTTTAC AACAAGCGTA CCCGTTGAGG TGATATTTGC GGCAGGGTAC 
AGACCTGTTG ATTTAAATAA TGTTTTTATT ACCGATGATA ATCCGGGAAA GTTGATAGAA 
GTGGCTGAAA ATACAGGTTT TCCCAGAAAT ATCTGTGCAT GGATAAAAGG TATTTATTCT 
GCTGTGGCAG ATATGGGAGG AATAGATGAG CTGATAGGTG TTGTTGAAGG TGACTGCTCT 
AATGCGAAAG CCCTTGTGGA GGTTTTGGAA CTGAAGGGCG TGCAATGTTT CCAGTTTTCA 
TATCCCAGTT CCCGAAGTTA CGACCGGTTG AAAAAGGAAA TTGACAGGTT TTGCAGTCAT 
TTTGGGGTCA GTTATGAAGA GTGTTTGAAA GTTAAAAAGG AATTGGACAA GATTAGACTA 
AGACTTGCTT ATTTGGATGA ATTGACATGG AAGCACAACA AGGCCGGAGG ATTTGAAAAT 
CACATATGGC AGGTTTCAAG CAGTGATTTT AACGGGGATT ATGTTACCTT TGGCCGCGAG 
CTGGAAGATG CTATTTCCTC CATTGAAAAA AGGGAGCCGA AAACAGAGAG TAAAAGAATA 
GGGTATATAG GAGTTCCGCC TATTAACGCA GATATATATG AATTTATTGA ATCTCTTGAT 
GCCAGGGTGG TATATAATGA GGTGCAGAGA CAGTTTACAA TGGCAGATTC GGTTGGCATT 
GAAGATATTG TGGAAGAATA CAGGAGATTT ACCTACCCGT ACGGTATAAG AGGCAGACTT 
GAAGATATAA CGGTCCAGGT GAAAAAAAGA AAGATTGATG GGGTTATACA CTACACTCAG 
GCATTTTGCT TTAGAGGTAT TGAAGACATT ATAATAAGGA AGGAACTTGG TGTCCCGGTT 
CTTACCCTTG AAGGAGACAG ACCCGGAAAA CTTGACCAGA GAACAAGGCT TCGTATTGAA 
GCGTTTATTG ATATGCTGGA TGAGTGA

Protein sequence

MKNIGFTTSV PVEVIFAAGY RPVDLNNVFI TDDNPGKLIE VAENTGFPRN ICAWIKGIYS 
AVADMGGIDE LIGVVEGDCS NAKALVEVLE LKGVQCFQFS YPSSRSYDRL KKEIDRFCSH 
FGVSYEECLK VKKELDKIRL RLAYLDELTW KHNKAGGFEN HIWQVSSSDF NGDYVTFGRE 
LEDAISSIEK REPKTESKRI GYIGVPPINA DIYEFIESLD ARVVYNEVQR QFTMADSVGI 
EDIVEEYRRF TYPYGIRGRL EDITVQVKKR KIDGVIHYTQ AFCFRGIEDI IIRKELGVPV 
LTLEGDRPGK LDQRTRLRIE AFIDMLDE