Gene Cthe_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2010
Symbol
ID	4810942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2388911
End bp	2390149
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	33%
IMG OID	640107422
Product	hypothetical protein
Protein accession	YP_001038417
Protein GI	125974507
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0742406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGATT TATTATGTGA TGAAAGTTAT TTATTAGAAA CAATAGAATT TAACAAGGAT 
GAAATTTATG AAAAGAAAGA AAAGATTATT ATGTTGAAAA ATGATATGGA AAAAGGTATA 
CAAAGATATC CTAGAGACAA TCAAAGCATA ATCTATGCTA CGTATAGAGG AATGTTTATG 
TCTAATTTAG ATATACTTAT GGCTGAATAT TCTTTAGGAA ACCATCCAGA TACAATGTTG 
GAGGATTATT TAGATGGTAT AATATATTTA GAAAATATTG GTAATGAAAG AGCGGGGTAT 
ATTAGCCTTT TGTGGATGTT ATCGTTAGGT ATACTTTTAG AAGTAGATAA TGAAAATTTA 
AAAAGGCTTG CTTGTGTGAT AGAGAAGCAA AAAATAGAAG ATGCACTGAT AGATTTTCTT 
TTAAAAGCTT GTGATATAGG ATGGTATCAT AATACAAGTG AATATGAAAG AAAAAATCCA 
TATGCAAAGA CGGCTGAAAT TATACAAATA GCATTACATG ATAAAGACAG AGAAAAAGCT 
TCGAAAAGGC TACAACAATA TGTAGAGAAA GAATGGATTA AGGGACATAA TGATCTGGAC 
TTCAAAAATG CGCATAAAGA ACCCGGCTAC GTTGGCTTGT GGAGTTTTGA GGCTGCAGCA 
TTGGCAAAGA TACTGGGATT GGACGACAGC GCACTGAAAG ATAACAACCA TTACCCTTAT 
GATTTGGCAC ATTATAAAAA TGGAATGAGT TTTGATTTAA GCTGGTATGG TGTGCCAGTT 
GAAGAGGAAG CCAAGGAAGA AGAGTCAATA GTGTATGGAA TACCGAACAA ACCTGAGTTG 
GAGCAAATAA TACCTGCAAA ATTCCACAGT TTTGTGAATG AAGTGATAGG AGACTACAAT 
ACATTGACTG ATGAAGAGTT TTGGAAGAAG TATAATTTGA GAGAAATCTG GTTTGATGTT 
AAGGAGTACA AAGAAGATAA TAAAGCCAAA AATATGTTGG GAACGATTAT AGTGTTTTTG 
CTTGTAGAGA AGGAGTATAT TTTGCAGTTG GATTATAAGG AAGATTTGGT AGATTACATA 
GAAGATATAG ATAATTATTG GGGCAAAGAG GAAGTAAAGT TGATAAGCTT TGAAGTGGAC 
AATGACCAGC AGTATTATGC ATACGTACCG AAAACCGCAG CAATAGATTC ATTGTACGAG 
GTAAAATTGA CAGAAGTGGA GAAGATAGAG GAAGTTTAG

Protein sequence

MRDLLCDESY LLETIEFNKD EIYEKKEKII MLKNDMEKGI QRYPRDNQSI IYATYRGMFM 
SNLDILMAEY SLGNHPDTML EDYLDGIIYL ENIGNERAGY ISLLWMLSLG ILLEVDNENL 
KRLACVIEKQ KIEDALIDFL LKACDIGWYH NTSEYERKNP YAKTAEIIQI ALHDKDREKA 
SKRLQQYVEK EWIKGHNDLD FKNAHKEPGY VGLWSFEAAA LAKILGLDDS ALKDNNHYPY 
DLAHYKNGMS FDLSWYGVPV EEEAKEEESI VYGIPNKPEL EQIIPAKFHS FVNEVIGDYN 
TLTDEEFWKK YNLREIWFDV KEYKEDNKAK NMLGTIIVFL LVEKEYILQL DYKEDLVDYI 
EDIDNYWGKE EVKLISFEVD NDQQYYAYVP KTAAIDSLYE VKLTEVEKIE EV