Gene Tmz1t_4074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_4074
Symbol
ID	7873301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	4472694
End bp	4474016
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	67%
IMG OID	643701005
Product	transposase IS4 family protein
Protein accession	YP_002891028
Protein GI	237654714
COG category	[L] Replication, recombination and repair
COG ID	[COG3666] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAGCT ATCTGCCCTA TTGCCCGCAG CAGCAGATGC TGCTGCCCCA GGCGCTGCAG 
GAGTGGCTAC CCGAAGGCCA CTTGGCGTAC TTCATCAGCG ACGCGGTCGA CGGGTTGGAT 
CTGAGCGCGT TCCACGCCCG GTATGCCGGT GGCGGACCGC GCAACCAGCC GTTTCATCCG 
GCCATGATGG TCAAGGTGCT GCTGTATGCG TACGCCACGG GCGTGTTCAG TTCGCGCAAG 
ATCGCGCGCA AGCTGCACGA GGATGTGGCG TTCCGGGTCC TGGCGGCAGA CAACTTCCCG 
GCCCACCGCA CGCTGAGCGA CTTTCGCGCG GTCCATTTGA AGGAGCTGAG CGAGTTGTTC 
GTGCAGGTGG TGCGACTGGC CCGCGAGATG GGGCTGGTCA AGCTCGGGAC GGTGGCCATC 
GACGGCACCA AGGTCAAGGC AAACGCCAGC CGCCACAAGG CGATGAGTTA CGGCCATATG 
GTGAAGGCGG AGGCCGAGTT GAAACGGCAG ATCGAGGCGC TGCTCAATCG GGCCAAGGCC 
GCCGACGACG CCGAGCGGAA CGAGCCCGAG TGGGATGTGC CGGCCGAGAT CGCGCGGCGC 
GAGGCGCGGC TGACGGCGAT TGCTGAAGCC CGGGCGCGGC TCGAGCAGCG CCAGCGCGAG 
GCCGATCAGG CGCGCGGGCG CAGCGACGAT GACGAGCGTC GCCCGCGCGG CGGTGACGGC 
AAACCGAAGG GCGGGCGCTA CAAGCGCGAC TTTGGAGTGC CCGAGGACAA GGCGCAGGAG 
AACTTCACCG ATCCGGACAG CCGCATCATG AAGCGCGCCG GCGGCGGTTT CGATCCGAGC 
TACAACGCCC AGACGGCGGT CGACGAGACC GCCCACATCA TCGTGGCGGC CGAGCTGACC 
AACAACGCCA GCGACGCCGG GCAACTGGCG GGGGTACTGC AGGCCGTGCG CGACAACGTC 
GAACACCGAC CGCGCCAGGC GCTGGCCGAC ACCGGCTACC GCTCGGAGCA AACGTTCCGG 
GAACTCGACG GGTGCGGGAC CGAACTGGTG GTGGCGCTGG GCCGGGAAGG TAAGCGCCGA 
CTCGGCTTCG ATCGCGAACG CAATCCGCAC ACCGCGCAGA TGGCCGACAA GCTCGAGAGC 
GAGGCGGGCA AGAGCGCCTA CCGAAAACGG AAATGGATCG CCGAACCGCC CAACGGCTGG 
ATCAAGAACG TGTTGGGATT CCGGCAGTTC AGCCTGCGGG GCCTGGAGCG CGTCAAAGCG 
GAGTGGAAGC TCGTCTGTAT GGCGCTGAAC CTGCGCAGGA TGAGCACATT GAGGACGGCA 
TGA

Protein sequence

MTSYLPYCPQ QQMLLPQALQ EWLPEGHLAY FISDAVDGLD LSAFHARYAG GGPRNQPFHP 
AMMVKVLLYA YATGVFSSRK IARKLHEDVA FRVLAADNFP AHRTLSDFRA VHLKELSELF 
VQVVRLAREM GLVKLGTVAI DGTKVKANAS RHKAMSYGHM VKAEAELKRQ IEALLNRAKA 
ADDAERNEPE WDVPAEIARR EARLTAIAEA RARLEQRQRE ADQARGRSDD DERRPRGGDG 
KPKGGRYKRD FGVPEDKAQE NFTDPDSRIM KRAGGGFDPS YNAQTAVDET AHIIVAAELT 
NNASDAGQLA GVLQAVRDNV EHRPRQALAD TGYRSEQTFR ELDGCGTELV VALGREGKRR 
LGFDRERNPH TAQMADKLES EAGKSAYRKR KWIAEPPNGW IKNVLGFRQF SLRGLERVKA 
EWKLVCMALN LRRMSTLRTA