Gene Cthe_2882 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2882
Symbol
ID	4809089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3408444
End bp	3409751
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	47%
IMG OID	640108301
Product	histidinol dehydrogenase
Protein accession	YP_001039273
Protein GI	125975363
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAAAA TTATTGATTT AAGATGCGGC AAAGACAGCG ACATATTTGA AAACCTTGCA 
TCAAGAAGTC AGCTGGAGTA TAGGGATGTT TTGGACCGGG TGGAGGAGAT AGTGGCAAAT 
GTTCGGCGAA ACGGAGACAA AGCCGTGCTG GAATATACAG CCATGTTTGA CAAGGTTCAG 
CTCACTTTAG GAAAATTAAG GGTTACGGAG AAAGAAATAA AAGAGGCGTA CACAAAGGTT 
GACCCCAAAC TTGTTGAAGT GATAAAAAGG TCAAGGGACA ATATTTGGAA TTTTCATGAA 
AAGCAGAAGG AGAAATCCTG GTTTTCCACC GAAAAGGAAG GGGTAATTGT CGGACAGCTT 
TACAGACCTT TGGAGGTTGT CGGCGTGTAT GTTCCCGGCG GGACAGCGGC CTACCCTTCA 
TCGGTTCTCA TGTGCGCAGT GCCTGCAAAG GTGGCCGGTG TAAGCAAAAT AGTAATGACC 
ACGCCTCCCG GAAAGGATGA AAAGATAAAT CCTGCAATAC TGGTGGCAGC CAATGAAGCC 
GGGGTTGATG AAATATACAA AGTGGGTGGG GCGCAGGCCG TAGCCGCCCA GGCCTTTGGA 
ACGGAGACAA TCCCGAAAGT GGACAAAATT GTGGGGCCGG GGAACATATA TGTGGCAATG 
GCAAAGAGGA CGGTATACGG CTATTGCGAT ATTGACATGA TAGCCGGACC CAGCGAGATA 
ATGGTGGTTG CCGATGAGAC CGCAAATCCT GTGTTTGTGG CGGCGGATCT TTTATCCCAG 
GCAGAGCATG ATATACTTGC TTCATCAATT TTGGTTACAA CTTCTGAGGA TATTGCCAAA 
GAGGTTCAAA GGGAGCTTGA GGCTCAGCTC GCGGTTTTGG AAAGAAAAGA AATAGCCGGA 
AAATCGATAG CTGACTATGG AGCGATAATT ATTGTGGAAA GCCTCAAGGA TGCCGCGACG 
GTGGTTAACA GAATTGCGCC GGAGCATCTG GAACTTTGCG TAAAAGATCC CTTTGCCGCA 
CTGGGGGATA TAAAGAATGC GGGTGCGATA TTCCTTGGCA ACTATTCCAC AGAGCCTTTG 
GGAGACTATT TTGCAGGACC CAACCATGTG CTCCCCACAA GCGGTACGGC AAGATTCTTC 
TCACCTTTAA ATCTTTCGGA TTTTATGAAG AAAAGCAGCA TTATTTCATA TACAAGAGAT 
GCCCTTCAAA AGGTTAAAGA CGATGTCATA CTCTTTGCAG AGTCCGAAGG ATTGGGAGCC 
CATGCAAATG CCATTAGAGT GAGGTTTCAG GACGGACAGG ACAAATAA

Protein sequence

MIKIIDLRCG KDSDIFENLA SRSQLEYRDV LDRVEEIVAN VRRNGDKAVL EYTAMFDKVQ 
LTLGKLRVTE KEIKEAYTKV DPKLVEVIKR SRDNIWNFHE KQKEKSWFST EKEGVIVGQL 
YRPLEVVGVY VPGGTAAYPS SVLMCAVPAK VAGVSKIVMT TPPGKDEKIN PAILVAANEA 
GVDEIYKVGG AQAVAAQAFG TETIPKVDKI VGPGNIYVAM AKRTVYGYCD IDMIAGPSEI 
MVVADETANP VFVAADLLSQ AEHDILASSI LVTTSEDIAK EVQRELEAQL AVLERKEIAG 
KSIADYGAII IVESLKDAAT VVNRIAPEHL ELCVKDPFAA LGDIKNAGAI FLGNYSTEPL 
GDYFAGPNHV LPTSGTARFF SPLNLSDFMK KSSIISYTRD ALQKVKDDVI LFAESEGLGA 
HANAIRVRFQ DGQDK