Gene Cthe_1883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1883
Symbol
ID	4809214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2234192
End bp	2236258
Gene Length	2067 bp
Protein Length	688 aa
Translation table	11
GC content	28%
IMG OID	640107302
Product	SMC protein-like protein
Protein accession	YP_001038297
Protein GI	125974387
COG category	[L] Replication, recombination and repair
COG ID	[COG3593] Predicted ATP-dependent endonuclease of the OLD family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGTAT CAAAACTTTT GATAAGAAAT TTTAGAAGCA TAGAGAAAGA AAGTATTGAT 
TTTAGACCTG GGAAGAATGT ATTGGTAGGT AAAAATAATT CTGGCAAGAG TAATATTGTT 
AAAGCATTAG ATTTAGTTTT AGGAGAGAAG AACCCAGTAT ATTTAGATAT AAATGAGAAA 
GATTTTTTTA CATATTATGA AGATGGAAAT GAAAAGGTTA AAAAAGCGTT TTTTATAGCA 
GTAAAATTAG AGGGAAATGA CATTAATGAA GAATTGTTTA AAAGTATTAG TGGAGCATGG 
TTAGCGACTG TAGGAGATAA AAATTTGATA GAGGATTTTT TTAATACAAG CAAAAATCCT 
GAATTACTCA TAAAAAATTT TGATACTCTA AGTAACAGAA AATACTGTAA GGACACAGAA 
GAGTTGTTTG ATATATTTAG AAATGCTCAA GAGTTATATA TTTATTTCTC AGTTATGAAA 
AATGCTGAAA TTGAAAACAT TGATTATGAT ATGGATAATC AGCAAGGTAA TTATTCAAAA 
ACATATTCAA TTTTTTTAAA GCATGGTAAC CAATATTATA GATGCTCAAA GTTTTCTAAT 
GATTTGAAGA ATTCACTGAT TACAAGTGCA ATTTTATCTG CGGTTAGAGA TATAAATAAA 
GAACTTAGGA TTAACACGTG GAGTTGGTAT GGAAGATTAA TAAGAGATAT TTGGGAAAAC 
TGTAATCCTA GTCAAAAAAG AGAAATAGAT AAGAAACTCA GTGAAATTAA AGAAATTACT 
GACGATATCT TTACTAATGC TGCATCAGAT ATAGAAGAAA AAATCAAAAA GGCTATTTAT 
CATAACAGTA TATCCTTCCA ACTTCTCCAA AATACTAAAG ATGATATTTA TAAAGGAATA 
AATATATTTG TTAATGATGG CGTTGAAGGT TTATTAGAGG ATAAAGGGAC AGGCATTCAG 
AGTGCAGTTG TAATATCATT ATTTTCTTAT TATTGTAGTA AATTTCATAA AAACTCTTCA 
CTGCTTGTGG TTGAAGAGCC AGAAATATAT TTACATCCGC AGGCTAGAAG AGTTGTCTCA 
AATAAATTTG ATGAGTTTGT TAACCTTAAT TCTACAAATA GAAATCAGGT GATTATTACA 
ACTCACTCAT CTGAGTTTAT AAGAAACACT GATATAGGCA ACATAATAGT AGTTAAGAAG 
GTTAGTGGAA AAACAAAAAC AAGACGTATA CAAATGGAGA CAGGTAAGCA TAAAGAACTT 
GCAAAACTTC AAAATATAAT ATCAACTAAG AATGCAGAAA TATTTTTTGC AGACAAAGTT 
ATATTGGTAG AAGGTGGTGA GGAATATTTA ATACCATTAA TAGCAGAGCA TTATTATCAA 
GAAAAAGGTT TTTTGGATTA TAACAATATT AGTGTAGCCA AAGTAGGGGG AAAATCTTTC 
TTCAAGCCGT ATATGGAGGT ATTATCTTGT TTAGGAATTG AATATTATGT TATTGCTGAT 
TTTGATATTC TCCATAATGG ATTAGAAGAT ATCGATGAAT TTATAAATGA GTTTTCTCAG 
GAAGAATTGA ATGATATTAG AAAGTCATTA AATGAAATAA TACCAATTGA TGAGCCGTGG 
ATAAAGAGCA AAGATATAAG AGAAAAATTA TTAAAACCTG ATAAAAGTAT GGATGCAAAA 
TCATTATGTA CTGTTATAGA CGAAATTTGT GCTACTGAAG AATATAATGA CAAGTTAAAA 
GAGATATGGC AGTATGTGAG ACCTAAAGTA ACCAAAAAAG TAAATTATAG AATATTAGAG 
AATTATGAAG ATATAAAAAC TAAAGTTTAC AATTACATAG ACAAATTAAA AACAAGTAAT 
ATTTTTATAC TAAAAAAAGG GGAACTAGAA GATTATATTA CTGATGATGG CCAAAAAATA 
ATTGAAGATT TAGGATTTGC GAATCAAAAA GAGTTAAAAA TTATAAAGTT ATCAGAATTG 
ATAAATAACG GTGAAATTGA AATAGAACAA GTGCTTGACA TTGAAGATTA TGTTGAAGTG 
ATTAAAAGAC TTAAATCTAA CAGTTAA

Protein sequence

MFVSKLLIRN FRSIEKESID FRPGKNVLVG KNNSGKSNIV KALDLVLGEK NPVYLDINEK 
DFFTYYEDGN EKVKKAFFIA VKLEGNDINE ELFKSISGAW LATVGDKNLI EDFFNTSKNP 
ELLIKNFDTL SNRKYCKDTE ELFDIFRNAQ ELYIYFSVMK NAEIENIDYD MDNQQGNYSK 
TYSIFLKHGN QYYRCSKFSN DLKNSLITSA ILSAVRDINK ELRINTWSWY GRLIRDIWEN 
CNPSQKREID KKLSEIKEIT DDIFTNAASD IEEKIKKAIY HNSISFQLLQ NTKDDIYKGI 
NIFVNDGVEG LLEDKGTGIQ SAVVISLFSY YCSKFHKNSS LLVVEEPEIY LHPQARRVVS 
NKFDEFVNLN STNRNQVIIT THSSEFIRNT DIGNIIVVKK VSGKTKTRRI QMETGKHKEL 
AKLQNIISTK NAEIFFADKV ILVEGGEEYL IPLIAEHYYQ EKGFLDYNNI SVAKVGGKSF 
FKPYMEVLSC LGIEYYVIAD FDILHNGLED IDEFINEFSQ EELNDIRKSL NEIIPIDEPW 
IKSKDIREKL LKPDKSMDAK SLCTVIDEIC ATEEYNDKLK EIWQYVRPKV TKKVNYRILE 
NYEDIKTKVY NYIDKLKTSN IFILKKGELE DYITDDGQKI IEDLGFANQK ELKIIKLSEL 
INNGEIEIEQ VLDIEDYVEV IKRLKSNS