Gene Cthe_2839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2839
Symbol
ID	4809676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3356345
End bp	3357583
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	35%
IMG OID	640108259
Product	hypothetical protein
Protein accession	YP_001039231
Protein GI	125975321
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0837377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGATC CGTTATGCAG TGAAAGTTAT TTGTTAGAAA CAATAGAATT TGACAAGGAA 
GAAATTTGTG AAAGAAAAAA AAAGATTATT GTGCTGAAAG ATGATATGGA AAAGGGCATA 
CAAAGATATC CAAAAGACAA TCAAAGCATA ATTTATGCTA CATATAGAGG AATGTTTATG 
TATAATACAG AAATACTTAT AGCTAAATAC TCTTTAGGTA GTCATCCGGA TGAAATGATT 
GAAGATTATT TAAACGGTAT AGAGTATTTG GAAAATGTCG GTGAAGAAAA AGTATGGTAT 
ATTGATCTTT TGTGGATGCT ATCGTTAGGT ATACTTTTAG AGGTAGACAA ACAAGATTTA 
AAAAGGCTTG CTTGTGTGAT AGAGAAGCAA AAAAAAGAAG ACGCACTGAT GGATTTTCTT 
TTAAAGGCTT GTGATATAGG ATGGAATCAT AATACAAGTG AATATGAGAG AAAAAATCCA 
TATGCAAAGA CGGCTGAAAT TATACAAATG GCATTGCATG ATAAAGACAG GGAAAAAGCT 
TCGAAAAGGC TACAACAATA TATAGAGAAA GAGTGGGTTA AGGGACATAA TGATCTGGAC 
TTCAAAAATG CGCATAAAGA ACCCGGCTAC GTTGGCTTGT GGAGTTTTGA GGCTGCAGCA 
TTGGCAAAGA TACTGGGATT GGACGACAGC GCACTGAAAG ATAACAACCA TTACCCTTAT 
GATTTGGCGC ATTATAAAAA TGGAATGAGT TTTGATTTAA GCTGGTATGG TGTGCCAGTT 
GAAGAGGAAG CCAAGGAAGA AGAGGCAATA GTGTATGGAA TACCGAACAA ACCTGAGTTG 
GAGCAAATAA TACCTGCAAA ATTCCACAGT TTTGTGAATG AAGTGATAGG AGACTACAAT 
ACATTGACTG ATGAAGAGTT TTGGAAGAAG TATAATTTGA GAGAAATCTG GTTTGATGTT 
AAGGAGTACG AGGAAGATAA TAAAGCCAAA AATATGTTGG GAACGATTAT AGTATTTTTG 
CTTGTAGAGA AGGAGTATAT TTTGCAGTTG GATTATAAGG AAGATTTGGT AGATTACATA 
GAAGATATAG ATAATTATTG GGGTAAAGAG GAAGTAAAGT TGATAAGCTT TGAAGTGGAC 
AATGACCAGC AGTATTATGC ATACGTACCG AAAACCGCAG CAATAGATTC GTTGTATGAG 
GTGAAATTGA CAGAAGTGGA GAAGATAGAG GAAGTTTAG

Protein sequence

MRDPLCSESY LLETIEFDKE EICERKKKII VLKDDMEKGI QRYPKDNQSI IYATYRGMFM 
YNTEILIAKY SLGSHPDEMI EDYLNGIEYL ENVGEEKVWY IDLLWMLSLG ILLEVDKQDL 
KRLACVIEKQ KKEDALMDFL LKACDIGWNH NTSEYERKNP YAKTAEIIQM ALHDKDREKA 
SKRLQQYIEK EWVKGHNDLD FKNAHKEPGY VGLWSFEAAA LAKILGLDDS ALKDNNHYPY 
DLAHYKNGMS FDLSWYGVPV EEEAKEEEAI VYGIPNKPEL EQIIPAKFHS FVNEVIGDYN 
TLTDEEFWKK YNLREIWFDV KEYEEDNKAK NMLGTIIVFL LVEKEYILQL DYKEDLVDYI 
EDIDNYWGKE EVKLISFEVD NDQQYYAYVP KTAAIDSLYE VKLTEVEKIE EV