Gene Teth514_1903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_1903
Symbol
ID	5877409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	-
Start bp	1916686
End bp	1917906
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	39%
IMG OID	641542255
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001663519
Protein GI	167040534
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTAG TTTATTCTCA CGTTTGCGGA TTAGATGTCC ATAAAAAGAA TGTCGTAGCT 
TGTATAATAA CACCAGAAGG TAAAGAAATC CGCACTTTTT CAACTATGAC CGATGACCTT 
ATTGCATTAA AAGAATTTAT TAAAGCTAAA GGTTGTTCTG TTGTTGCTAT GGAAAGTACC 
GGCTCTTACT GGAAACCTAT TTACAATCTC CTTGAGCTTG AGAATATTAA AATCCTACTC 
GTCAATGCTA AGCATATTAA AAATGTCCCT GGTAGAAAAA CTGATGTAAA AGATGCCGAG 
TGGATAGCAA GTCTCTTGCA ACATGGCCTT TTGCAAGGCA GCTTTGTCCC AGACAGAGAA 
CAAAGAGAGC TTCGCGAACT TGTCCGCTAT AGAAAAAGCC TCATTGAAGA AAAATCAAGA 
GAGCTTAACC GCATACAAAA GGTCTTAGAA GGTGCTAATA TTAAACTGTC TTCGGTAGTC 
TCTGATATTA ATGGAGCTTC TAGTCGCTCT ATTCTTGAGG CTATCATAAA TGGTGAAGAA 
AATCCTGAAA CCTTAGCACA GCTTTCCCAA GGTAAATTGA AAAATAAAAT GGATGAACTA 
AAACGCTCTT TAAAAGGCCT AATTAATCAT CACCAAAAAA CTCTCATTGA AATTCAACTC 
AGGCATATTG ATTATCTTGA CCAAGAAATA ACTAAATTAG ATGAAGAAAT TAAAAATAGA 
ATGCACCCTT TTGAACAAGA CCTGGCACTG CTGGATACTA TCCCTGGTGT CGGAAGAAGA 
ACTGCAGAAC AAATAATAGC CGAAATCGGT ACAAATATGG AACAGTTCCC CTCTGCTGCC 
CATTTGTGTT CCTGGGCAGG GCTGTGTCCA GGTCATAACG AAAGTGCTGG TAAACAAAAG 
TCTGCCAGAA CTCGAAAAGG TAACCAAAAA TTGCGAAGCT CTCTTATTGA AGCTGCCAGG 
GCTGCCTCAA GGGCAAAAGA TACTTATCTC TCAAGTCAGT ACCACCGCAT CGCTGCTCGA 
AGAGGAGCAA ACCGAGCAGC AGTTGCAGTG GCACATAGCA TTTTAGTTAT AGTTTATCAT 
ATTCTCAAGC AAAAGCAACC ATATATTGAA TTAGGTCCTA CTTATTATGA AGAGAAAAAG 
CGTAATATGA TTATTCGTCA ATCTTTAAAA AAGCTAGAGT CTTTAGGTCT TAAGGTCACG 
GTCGAATCTG TAGCGTCTTA A

Protein sequence

MDLVYSHVCG LDVHKKNVVA CIITPEGKEI RTFSTMTDDL IALKEFIKAK GCSVVAMEST 
GSYWKPIYNL LELENIKILL VNAKHIKNVP GRKTDVKDAE WIASLLQHGL LQGSFVPDRE 
QRELRELVRY RKSLIEEKSR ELNRIQKVLE GANIKLSSVV SDINGASSRS ILEAIINGEE 
NPETLAQLSQ GKLKNKMDEL KRSLKGLINH HQKTLIEIQL RHIDYLDQEI TKLDEEIKNR 
MHPFEQDLAL LDTIPGVGRR TAEQIIAEIG TNMEQFPSAA HLCSWAGLCP GHNESAGKQK 
SARTRKGNQK LRSSLIEAAR AASRAKDTYL SSQYHRIAAR RGANRAAVAV AHSILVIVYH 
ILKQKQPYIE LGPTYYEEKK RNMIIRQSLK KLESLGLKVT VESVAS