Gene Teth514_0197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_0197
Symbol
ID	5877392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	+
Start bp	198013
End bp	199233
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	39%
IMG OID	641540539
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001661851
Protein GI	167038866
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTAG TTTACTCTCA CGTTTGCGGA TTAGATGTCC ATAAAAAGAA TGTCGTAGCT 
TGTATAATAA CACCAGAAGG TAAAGAAATC CGCACTTTTT CAACTATGAC CGATGACCTT 
ATTGCATTAA AAGAATTTAT TAAAGCTAAA GGTTGTTCTG TTGTTGCTAT GGAAAGTACC 
GGCTCTTATT GGAAACCTAT TTACAATCTA CTTGAGCTTG AGAGCATTAA AATCCTACTC 
GTCAATGCTA AGCATATTAA AAATGTCCCT GGTAGAAAAA CCGATGTAAA AGATGCTGAG 
TGGATAGCAA GTCTCTTACA ACATGGCCTT TTGCAAGGCA GCTTTGTGCC AGATCGTGAA 
CAAAGAGAAC TTCGCGAGCT TGTACGCTAT AGAAAAAGCC TCATTGAAGA AAAATCAAGA 
GAACTTAATC GCATACAAAA GGTTTTAGAA GGAGCTAATA TCAAACTGTC TTCGGTAGTC 
TCTGATATCA ACGGGGCATC CAGTCGTTCT ATACTTGAGG CTATTATAAA TGGTGAAGAA 
AATCCCGAAA CCCTGGCTGA GCTTTCTCAA GGCAAGCTAA AAAATAAAAT GGATGAACTA 
AAACGCGCTT TAAAAGGCTT GATCAATCAT CACCAAAGGA TGCTTCTGGA AATACAGCTT 
AGACATATTG ATTACCTTGA TGAAGAAATA GCAAAATTAG ACGAAGAAAT TAAAAATCGA 
ATGCTCCCTT TTGAAAAAGA CCTGGCACTG CTGGATACAA TCCCTGGAGT CGGAAGAAGA 
ACTGCAGAAC AAATAATAGC CGAAATCGGC ACGAATATGG AACAGTTCCC CTCTGCTGCC 
CATTTGTGTT CTTGGGCAGG GTTGTGTCCA GGTCATAATG AAAGTGCTGG TAAACAAAAG 
TCTGCAAGAA CTCGAAAAGG TAACCAAAAA TTGCGAAGCT CTCTTATTGA AGCTGCCAGA 
GCTGCCTCAA GGGCAAAAGA TACTTATCTC TCAAGTCAGT ACCACCGCAT CGCTGCTCGA 
AGAGGAGCAA ACCGTGCAGC AGTTGCAGTG GCACATAGCA TTTTAATTAT AGTTTATCAT 
ATTCTCAAGC AAAAGCAACC ATATATTGAA TTAGGTCCTA CTTATTATGA AGAGAAAAAG 
CGTAATATGA TTATTCGTCA ATCTTTAAAA AAGCTAGAGT CTTTAGGCCT TAAGGTCACG 
GTCGAATCTG CAGTGTCTTA A

Protein sequence

MDLVYSHVCG LDVHKKNVVA CIITPEGKEI RTFSTMTDDL IALKEFIKAK GCSVVAMEST 
GSYWKPIYNL LELESIKILL VNAKHIKNVP GRKTDVKDAE WIASLLQHGL LQGSFVPDRE 
QRELRELVRY RKSLIEEKSR ELNRIQKVLE GANIKLSSVV SDINGASSRS ILEAIINGEE 
NPETLAELSQ GKLKNKMDEL KRALKGLINH HQRMLLEIQL RHIDYLDEEI AKLDEEIKNR 
MLPFEKDLAL LDTIPGVGRR TAEQIIAEIG TNMEQFPSAA HLCSWAGLCP GHNESAGKQK 
SARTRKGNQK LRSSLIEAAR AASRAKDTYL SSQYHRIAAR RGANRAAVAV AHSILIIVYH 
ILKQKQPYIE LGPTYYEEKK RNMIIRQSLK KLESLGLKVT VESAVS