Gene Cthe_3013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3013
Symbol
ID	4811161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3537193
End bp	3538170
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	44%
IMG OID	640108434
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001039402
Protein GI	125975492
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAA ACATGTCCCA CGGCAGCGGC GGAAAACAGA CAAGCGATTT AATAAACCGG 
ATATTTTTAA AGCATTTCGG CAACAACATA TTAAACAGGC TTGAAGATGC CGCAGTGCTG 
GATATAAAGG GTAAAATTGC CTATACCACC GATTCCTTTG TGGTAACTCC CCTGTTTTTC 
AAGGGCGGTG ACATTGGAAA ACTTGCCGTT TGCGGCACAG TAAACGACAT TTGCATGATG 
GGCGCCATTC CAAAATACCT CACGGCAGGC TTTATCATTG AGGAAGGAGC GGAAATTGAA 
ACCATTGATA AAATTGCCCT TTCAATGAAG CTTGCCGCGG AAGAAGCAGG AATCAAAATT 
GTTGCGGGAG ACACCAAAGT AATCGAAGGC CACGGCGGAA TCTATATAAA CACATCCGGT 
ATCGGTGAAA TAGTAAAAAG CGGCATCAGT ATTTCCAATT GCCAAAAAGG CGATGTCATC 
ATACTTTCAG GCAATTTGGG CGACCACCAC GCCGCTGTAA TGTCGGAGCG AATGGAGATT 
GAGAACAATA TAAAAAGCGA CTGCGCTCCC CTTGTCCAAA TAGTAAAAAA TCTGATTGAA 
AGCAATATAG AAATCCATTG CATGCGGGAC ATAACCAGGG GCGGTCTTGC AACAGTGCTC 
AACGAAATAT CGTCAGCCTC AAACTGCGGC ATTGAGATAC ACGAAGCCGT TTTGCCCATC 
AGCAATGAAG TAAGAGGATT TTGCAGTATC CTCGGGCTTG ACCCCCTTTA TATGGCAAAC 
GAAGGGAAAA TGATAGCCGT TATACCCGAA AATGAGGCTA ACAAGGCTCT TGAAGTAATC 
AGAAAAAGCA AATACGGAGA AAACGCCCAA ATTATCGGTC GTATTGTGGA CGGAAGCGGA 
GTAACCATGA TTACAACCCT TCAAGGAAAC AGGATATTGG ACATTCTGTA TGGCGAAGGA 
CTTCCCCGCA TTTGCTAA

Protein sequence

MKINMSHGSG GKQTSDLINR IFLKHFGNNI LNRLEDAAVL DIKGKIAYTT DSFVVTPLFF 
KGGDIGKLAV CGTVNDICMM GAIPKYLTAG FIIEEGAEIE TIDKIALSMK LAAEEAGIKI 
VAGDTKVIEG HGGIYINTSG IGEIVKSGIS ISNCQKGDVI ILSGNLGDHH AAVMSERMEI 
ENNIKSDCAP LVQIVKNLIE SNIEIHCMRD ITRGGLATVL NEISSASNCG IEIHEAVLPI 
SNEVRGFCSI LGLDPLYMAN EGKMIAVIPE NEANKALEVI RKSKYGENAQ IIGRIVDGSG 
VTMITTLQGN RILDILYGEG LPRIC