Gene Athe_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2110
Symbol
ID	7408819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2238688
End bp	2240226
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	44%
IMG OID	643716476
Product	transposase
Protein accession	YP_002573959
Protein GI	222530077
COG category
COG ID
TIGRFAM ID	[TIGR01765] transposase, putative, N-terminal domain [TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.228237
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAACAG TTCAGGCGAA GTTAGTGTTC GATAGAGAGG AAGACAAAAA GGCAGTATTA 
GATCTTATGA GAAGATGGTC CTCTTGTATG AGGTATGCAT ATAAGAGACT ACTGGAAAGG 
CATAAAAGGA ATGAACTCAA AAGAGAGCTG CAAGGAATTT TTAATCTTAA TTCCCGATAC 
GTTGATGATG CAATAATGAA AGCAAACAGT GTTTTAAACT TATGCAAAGG AAGAGGAGAA 
AATCCTGAAA AGGTCATTTT TGGTGGTAGG CAACTTTTTG AAAAACTAAA GAGGCGGCAC 
ATAAACGGCA AGGTATATAG GAAACTTCAA CGAGAGTGGC AGGAGAAGAG GAAGGGGAAT 
CTGTACTCAA GAGGAGACAG GAGCAAGAAA GGTAATCTCA ATACAAGGAT TGAGATAGAC 
GGGAACTTCA CAAAACTCAG GATTAACGTA GGAAAAAGAG AGTACGTATA TGCGACGATA 
CAAGCTGGAT GGAAGATGAA AGGTAAGACA TACATGGATA GGAACCTACT GCTACAAGCA 
ATAAGCAGCT TTAGTGGACC TTATTCTGTA GAACTGAAAC TCAAAAACGG TGTAGTATAT 
GCCTACTTCA CCGTTGAAGA AGTTTTCCCC AAGCCTGCGA TAACGAGAGC AAATGGAGTT 
ATAGGGATAG ACACTAACGC ATATCCAAAG AATGTTGCAT GGGCAGAAAC AGATGAGTAC 
GGACAGTTTC TAGGATATGG CAGAATACCA CTTGAGAAGC TTGAGAGTGG AAGCTCAAGC 
AAGAGAGAGT ATTACAGGTG GCAGTATGCA CACATGATAG TACAAATGGC GAAAGAGAAG 
CAAAAAGCGA TAGTGATTGA GAACCTTAGC ATACAGGACA GGGGCAGAAG AGGCGACTTT 
TCAGGTAGAA AATCAAGACG GATAAGGCAC TATTTTGGAA GCAGATTACT TTTGGAGAAG 
GTAAAACTTC TGGCAAAACG GGAAGGAGTA GAGGTTATAG AAGTAGACCC GGCGTATACT 
TCTGTGATAG GGATGTTGAA GTATGCACCG CAGTATATGG TGAGCAAGGA TATTGCGGCA 
GCGTATGTAA TAGCGCGAAG AGGACTTGGT TTGAGAGAAA GGATACCGCA CAATTATATG 
CTGCTTCTTA GTAGGCTTGA TGTAAACAAC CTGGAAGAGC TAAAAGAGTA TGTAAGGAAG 
GTAGTCAAGA ACAAACATCT GAGGAAAAAA CAACTCAAAA CGATAGATAG AGCGATAAAG 
TTTTTACAAA GCTCTGGGAG TGAGCCAGGG AGGCTATCCG TGCCTCTGGA TGGAACAAGC 
GCGGGTAGTC GTGGCAAAAA ACACAATCCC TGGCGAGTTC TCAGGGTAGC GGTGGTAACG 
CCACTCTCCC CTGACAGAGT CCTGCGTGAT ATGTCTGTCT TGAAATCGCT TTTGATTTCA 
GGGCAAGTGG GGAAGACCTG TAAGGGCGTA AGTTCCTGTT TCTTGGGGCA GGGGCTATGG 
CTTTCCCAAA TACCGCCTGC TGGGGCTGGG AAAGCCTGA

Protein sequence

MVTVQAKLVF DREEDKKAVL DLMRRWSSCM RYAYKRLLER HKRNELKREL QGIFNLNSRY 
VDDAIMKANS VLNLCKGRGE NPEKVIFGGR QLFEKLKRRH INGKVYRKLQ REWQEKRKGN 
LYSRGDRSKK GNLNTRIEID GNFTKLRINV GKREYVYATI QAGWKMKGKT YMDRNLLLQA 
ISSFSGPYSV ELKLKNGVVY AYFTVEEVFP KPAITRANGV IGIDTNAYPK NVAWAETDEY 
GQFLGYGRIP LEKLESGSSS KREYYRWQYA HMIVQMAKEK QKAIVIENLS IQDRGRRGDF 
SGRKSRRIRH YFGSRLLLEK VKLLAKREGV EVIEVDPAYT SVIGMLKYAP QYMVSKDIAA 
AYVIARRGLG LRERIPHNYM LLLSRLDVNN LEELKEYVRK VVKNKHLRKK QLKTIDRAIK 
FLQSSGSEPG RLSVPLDGTS AGSRGKKHNP WRVLRVAVVT PLSPDRVLRD MSVLKSLLIS 
GQVGKTCKGV SSCFLGQGLW LSQIPPAGAG KA