Gene Cthe_2858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2858
Symbol
ID	4809138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3375991
End bp	3377127
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	40%
IMG OID	640108278
Product	transposase, mutator type
Protein accession	YP_001039250
Protein GI	125975340
COG category	[L] Replication, recombination and repair
COG ID	[COG3328] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0176632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCAGGAAG CATTGAAGGA TCTGCTCGGA GATACGATAC AAAATATGTT GGAAGCAGAG 
CTGGATGAAC ATCTCGGATA TGAAAAGTAC GAATCAACTG AAGAAGCGAA ATCAAATTAC 
CGTAACGGGT ACACATCAAA AACATTAAAG TCAAGTGTAG GGCAAGTGGA AATAGATATC 
CCGCGGGACC GGAATGCAGA ATTCGAGCCG AAAATTGTTC CCAGGTATAA AAGGGACATT 
TCAGAAATTG AAAATAAAAT AATAGCAATG TATGCGCGGG GGATGTCTAC CAGAGAAATC 
AACGAGCAGA TACAGGAAAT CTACGGATTT GAAGTATCTG CCGAGATGGT AAGTAAGATC 
ACTGATAAAA TACTACCTGA GATAGAAGAG TGGCAGAAAA GGCCTCTGGG AGAGGTTTAT 
CCGATAGTAT TTATTGACGC AATTCATTTT TCAGTAAAAA ATGACGGCAT TGTTGGGAAG 
AAGGCCGTAT ATATTGTGCT GGCGATTGAT ATAGAAGGGC AGAAAGATGT TATCGGTATT 
TATGTAGGAG AAAATGAGAG CTCAAAATTC TGGCTGAGTG TCTTAAATGA CCTTAAAAAC 
AGAGGAGTTA AAGACATCCT GATTCTCTGT GCTGATGCAC TTTCAGGGAT AAAGGATGCA 
ATCAATGCGG CTTTTCCGAA TACTGAATAT CAGAGGTGTA TAGTACACCA GATAAGAAAC 
ACGCTAAAGT ATGTGTCAGA TAAAGACCGA AAGGAATTTG CCAGGGACTT GAAACGGATA 
TATACGGCTC CGAATGAGAA GGCAGGGTAC GACCAGATGC TTGAGGTTTC AGAGAAATGG 
GAGAAGAAAT ACCCGGCAGC TATGAAGAGC TGGAAGAGCA ATTGGGATGT TATTTGTCCA 
TTTTTTAAGT ATTCGGAGGA ACTACGTAAA ATCATGTATA CGACCAATAC TATTGAGAGC 
CTGAATAGCA GTTATAGAAG GATAAACAAA TCAAGGACAG TATTTCCTGG CGACCAGTCA 
CTTTTAAAGA GCATATATTT AGCTACAGTG AAGATTACTT CAAAATGGAC GATGCGTTAC 
AAAAACTGGA GGTTGATACT GGGACAGCTA CAGATTATGT TCGAAGGGCG TATATAG

Protein sequence

MQEALKDLLG DTIQNMLEAE LDEHLGYEKY ESTEEAKSNY RNGYTSKTLK SSVGQVEIDI 
PRDRNAEFEP KIVPRYKRDI SEIENKIIAM YARGMSTREI NEQIQEIYGF EVSAEMVSKI 
TDKILPEIEE WQKRPLGEVY PIVFIDAIHF SVKNDGIVGK KAVYIVLAID IEGQKDVIGI 
YVGENESSKF WLSVLNDLKN RGVKDILILC ADALSGIKDA INAAFPNTEY QRCIVHQIRN 
TLKYVSDKDR KEFARDLKRI YTAPNEKAGY DQMLEVSEKW EKKYPAAMKS WKSNWDVICP 
FFKYSEELRK IMYTTNTIES LNSSYRRINK SRTVFPGDQS LLKSIYLATV KITSKWTMRY 
KNWRLILGQL QIMFEGRI