Gene Cthe_0665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0665
Symbol
ID	4810282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	819807
End bp	820775
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	41%
IMG OID	640106081
Product	HflK protein
Protein accession	YP_001037093
Protein GI	125973183
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0330] Membrane protease subunits, stomatin/prohibitin homologs
TIGRFAM ID	[TIGR01933] HflK protein

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGCAA TAAACGTGGG AGGCAATTTT AGAAAAGCTG CAAAGCTTCC AGTGAAACTG 
ATTATTGGAG CAATTGTATT AGTAATCTTT GCAATTCTTT TTTTTAACTC ATTTTACACC 
GTAACCGATC AGGAACAGGC TGTGGTGCTT ACTTTTGGCA AGGTTACAAG CATAGAAAGC 
GCGGGAATTC ATTTTAAATT GCCATATCCG ATACAGTCGG TTATAAAAGT ACCGGTACAA 
ATGACCCAAA AGCTGGAACT GGGCTACAGA GACCAAGGTG ACGGCAGGTA TGTAACTGTG 
GATGAAGAGT CAAAAATGAT TACGGGAGAT TTTAATATAG TAAAGATTGA CTTCTTTATC 
GAATGGAAGG TTTCCGATCC GAAAAAGTAT CTTTTTAATT CAGAGGATCC CAAAAACATA 
CTCAGAGACT CAAGTCTAAG TGCCGCACGT TCTGTCGTAG GTTCATCAAC CATTGATGAT 
GTGCTTACCA GCGGAAAAAT TGCAATTGAG AACGAGATTA AGGAAAAGCT GATAGCAAGC 
CTTGATGCCT ATGATATCGG AATTCAGGTG CTGGATGTAA AAATACAGGA TTCGGAACCG 
CCCACGGAAG AAGTGAAGCA GGCATTCAAG AACGTGGAAA ATGCAAAGCA GAGCAAGGAG 
ACGGCCATGA ATGAGGCAAA CAAATACAGA AACACAGAGA TTCCAAAGGC CCAGGCGGAA 
GCCGACCGTA TATTGCGCAA TGCAGAATCT CAAAAGCAGA CAAAGATAAA TGAGGCCAGG 
GGAGAAGTGG CCAAGTTTTT AAAAATGTAT GAGGAATACA AGAATTATAA AGATGTCACA 
AAGACAAGGC TTTATCTTGA GGCAATGGAA GAGATACTTC CGGGTATTAC GGTTTATATT 
GAAGATAATT CTTCCGGTGT TCAAAAGCTT GTTCCGCTAA AGCCGTTTGA TTCAGAGGGG 
GGCGAATAG

Protein sequence

MEAINVGGNF RKAAKLPVKL IIGAIVLVIF AILFFNSFYT VTDQEQAVVL TFGKVTSIES 
AGIHFKLPYP IQSVIKVPVQ MTQKLELGYR DQGDGRYVTV DEESKMITGD FNIVKIDFFI 
EWKVSDPKKY LFNSEDPKNI LRDSSLSAAR SVVGSSTIDD VLTSGKIAIE NEIKEKLIAS 
LDAYDIGIQV LDVKIQDSEP PTEEVKQAFK NVENAKQSKE TAMNEANKYR NTEIPKAQAE 
ADRILRNAES QKQTKINEAR GEVAKFLKMY EEYKNYKDVT KTRLYLEAME EILPGITVYI 
EDNSSGVQKL VPLKPFDSEG GE