Gene Cthe_0355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0355
Symbol
ID	4808432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	445334
End bp	446512
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	42%
IMG OID	640105769
Product	hypothetical protein
Protein accession	YP_001036786
Protein GI	125972876
COG category	[S] Function unknown
COG ID	[COG1379] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00375] conserved hypothetical protein TIGR00375

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAT ATTTTGTGGA CCTTCATGTG CATATCGGAA GGTCTTCAAA AGGAAAAGAG 
GTAAAGAAAG CCACTGCCAA CAATCTTACT TTTGAAAATA TAGCATTTGA ATCCTACACC 
AGAAAAGGCA TAGATGTTAT TGGTGTAGTT GACTGTTTGT CTCCATATGT CATTGAAGAT 
ATTGAAGAGC TTGTGGACAG AGGAGAGCTC ATAGAAAAAC AGGGCGGGGG AATGGAGTAT 
AGAAAGGGAC AGATATTGAT ATTGGGAGCT GAGCTTGAAA CACATGAAGA AAAAGGCGGA 
AGCTCCCATT CGCTTTGCTT TTTTCCCACA TTAAAGTCAA TCAAAGACTT TGCCAAAGCC 
ATGGAGAATC ACATAAAAAA CATCTATAAC TGTTCCTATA TGTGCAGATT AACAGCCCGT 
CAGCTTATAG ATATAGTTGA CTTTTACGGC GGCACCTTTA TTCCGGCCCA TGTTTTCACT 
CCCTATAAAA GTTTTTATGG CAATTGCTGC GACAGTCTTT TTGAAATATT TGACGAGAAA 
TCCTTTGATA AGATTCCTGC AGTGGAACTG GGGCTTAGTG CGGATTCAAT GATGGCATCG 
CAGCTTGGCG AGCTTGACGA AAAAGCCTTT CTCAGTAACT CCGATGCCCA CTCCCTGTCG 
AAGATGGGCA GAGAATATAA TATATTTGAA ATGGAAGAAG CAAATTACGA AGAAATATTA 
AAAGCTTTTA AAGGAATCGA CGGAAGAAAA ATAAAGGCAA ATTTCGGACT GGATCCCAAG 
CTTGGAAAAT ATCACAGGAC TTATTGCCTT GTTTGCGACT CGGTAATAAA AGAGGATCCG 
CCGGTGCTAA AATGTCCTGT TTCCGACAAA CACCGTGTGG TGGTGGGCGT AAAGGACAGA 
CTGATGATGA TAAGAGACAG GGAAAATCCG CTGATGGATT CAAGGCCGCC CTATTTTTAT 
CAGGTTCCCT TGGAGTTCCT TCCCAAAGTG GGCCCTAAAA CCATAGACAA GCTTATAGAG 
TTTTTCGGAA GCGAGATGAG AGTATTGCAT TATGCTTCTT ATGAGGAATT GACAAAAGTA 
GTGAGCGAGG ATATAGCAAA AAATATTGTG CTGTCAAGAG AAGGAAAGCT TTCCATTGAG 
GCCGGCGGTG GTGGAGTATA CGGAAAAATA GAGGCGTGA

Protein sequence

MKEYFVDLHV HIGRSSKGKE VKKATANNLT FENIAFESYT RKGIDVIGVV DCLSPYVIED 
IEELVDRGEL IEKQGGGMEY RKGQILILGA ELETHEEKGG SSHSLCFFPT LKSIKDFAKA 
MENHIKNIYN CSYMCRLTAR QLIDIVDFYG GTFIPAHVFT PYKSFYGNCC DSLFEIFDEK 
SFDKIPAVEL GLSADSMMAS QLGELDEKAF LSNSDAHSLS KMGREYNIFE MEEANYEEIL 
KAFKGIDGRK IKANFGLDPK LGKYHRTYCL VCDSVIKEDP PVLKCPVSDK HRVVVGVKDR 
LMMIRDRENP LMDSRPPYFY QVPLEFLPKV GPKTIDKLIE FFGSEMRVLH YASYEELTKV 
VSEDIAKNIV LSREGKLSIE AGGGGVYGKI EA