Gene Cthe_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2037
Symbol
ID	4811007
Type
Is gene spliced	No
Is pseudo gene	Yes
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2419749
End bp	2421277
Gene Length	1529 bp
Protein Length
Translation table
GC content	35%
IMG OID	640278310
Product
Protein accession
Protein GI
COG category	[L] Replication, recombination and repair
COG ID	[COG3328] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.620147
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCAACAT TATCAAAAGA GCAAGTGAAA GAAATAATTA AGGGCAATAA TTTCCAAAGT 
GTTGCCGATG TAAGTGCATA CCTAAGAGAT ATCTTTAAGG ACATTATTCA AGAACTTCTT 
GAAGCAGAAC TTGAAGCTAA ATTGGGATAT GCAAAAGATG ATGTAGAAAA CAAAAATACA 
GATAATAGCC GAAACGGATA TTCACCAAAG ACCATAAAAA GTGAATTTCG AGAAGTTGAA 
ATCCAAGTAC CAAGGGATCG CAAAGGAGAG TTTAAACCCC AAATTATACC TAAGTATCAG 
AGGAATGTTT CCGGAATTGA AGAAAAAGTT ATTGCTCTGT ATGCCAGAGG AATGTCCACC 
CGGGATATTA GTGAACAAAT TGAAGAACTT TACGGCTTTA GTTTGTCGCC CGAAATGGTT 
AGTAAGATTA CAGACAGAAT AGCTCCAGAA ATCAAGGAAT GGCAACAAAG ACCGCTGGAA 
CCTATATACA CGTTTGTTTT TATGGATGAA ATTCACTAGA CAACGAATCA TTGAAATTTT 
GGCTTGGAGT ATTAAATGAT CTTAAGAACA GAGGAGTACA GGATATGCTA ATATTTTGCG 
TTGATGGACT GACAGGTATA AAAGAAGCGA TTAATGCGGC ATATCCAAAG GCCGAAGTAC 
AACGCTGCAT AATACATCAA CTTCGAAATT CCTTTAAATA TGCACCATTC AAGGACATAA 
AAGCTTTTAG CAATGACTTT AAGGAAGTAT ATCGGGCAAT TAACGAAGAC AGACATGCTA 
TAGTTAATTA TTTGAAAAGC AGGGCTGATG TAATAGTTGT AACAAGGACA GTGTTAATGG 
AATTGACTGC CAATTCTTTT GAGTTGCATC CGGTTCAAAT CAAATATTTC AAGGAACTTA 
ATAGCAGTAG TTTTAAAGTT GTTCTGTTTG ATGAAGAAAC GGTATATGAT TGTTTAAAAG 
AAGTTTTGAA TATTAGTACC GAGGAAGCAA ACAGATTGCT GGGATATGCT GTTAAAGAAG 
TATGCAGATA CAAGGCAAAA ACAAGTGAAA TTATTGAAAA CATGGACAAG CATAGATCTC 
TAAAACTTAA AAGTACAAAT CCGGGAAAGA GGGAACTTTT CAGTACTTTC TTTCGGTATG 
CCAGAACACG GAAAAGTGAG GGGAACAGTA TTGCAGAGGA GTTAATTCTT ATATGCATAA 
TAGTACTTAC AATAATTCCC ATGGGGCGGT ACATTTTAAT AAGTGATGAT ATGAGGATAA 
GGCCTCAGGT AATAAGCGTA AATGATTATA TTTTAAGACA TCACGGGAGA AAAGAGCCTT 
ACCAGCTGAC AACATCGGCA TTTGTGTATA AAATGTATAA GGATAATGTG CTTACCAACA 
GAGAAGACAT GATTGAAATC ATGAAAGCAG CTTTTAAAGA AAATGTTAGA GTCTTTTTTG 
TTGGTGAATA TGACATTCAG CAAAGATATG AGCCTTTTAA GTGTGAAGAT TTGATTGACA 
GGCTTTTAAA TGAGAGGATT TTAAGATAA

Protein sequence