Gene Tmz1t_3151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3151
Symbol
ID	7874293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3410789
End bp	3411907
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	64%
IMG OID	643700081
Product	transposase IS4 family protein
Protein accession	YP_002890125
Protein GI	237653811
COG category	[L] Replication, recombination and repair
COG ID	[COG5433] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.683111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTATC TGGACGAAAT CGATGATCCG CGCAAGCCGA GCAACGGCAC CTTGCACGAC 
TTCCGGGAGA TCCTGGTGAT CCTGATCGCC GCTGTGCTCT CGGACTGCGA CACGGTCGAG 
GACATCACCT TCTGGGCGCG CACCAAGGAG GCGTGGCTGC GCCGCTTCCT CGTGCTCAAG 
AACGGCATCC CGTCCGAAGA GACGTTCCTG CGGATCCTGC GTGCGCTCGA TCCGAAGCAG 
TTCGAGAACA TGTTCCGGCG CTGGGTGGGC GGCGTGGTCG GTGCGCTCAG CGACGATGCG 
GGCCTCGCCG GCACGATCGC AATTGACGGC AAGACCGTGC GCGGCTCGGG CAGCGGCGGC 
GAGAGCGCGA TCCACATGGT CAGCGCCTTC GCCACCGAGT TGGGACTGGT GCTCGGCCAG 
GAGAAGGTCG CCGCCAAGAG CAACGAGATC ACCGCGATTC CGGAGTTGCT GGAGGCGCTC 
TCGATCAAGG GGCTGCTGGT CACGATCGAC GCCATGGGCT GCCAGAAAAG CATTGCCAAA 
CAGATCGTTG CGAAGAAAGG CGACTACCTG CTGATGGTCA AGGGCAACCA GCCCAAGCTG 
CTCGAAGCGA TCGAGACCGC CTTCATCGAT CAGCACGGCG TCGAGTCGGT CGACCGCAGT 
TCGCTGGTCG AGCGCGGCCA CGGCCGCACC GTCGGGCAGA TCGCCTCGGT GCTCTCGGCC 
AAGGGCATCG TCGATCTGGC CGACTGGCCC AAGTGCGTGA CGATCGGGCG CATCGACTCG 
ATGCGGGTGG TCGGCGACAA GCAATCCGAT CTCGAGCGGC GTTACTACAT CAGTTCGCGC 
GCACTGAGCG CCGAGCAACT GGCCGCAGCG ATACGTGCGC ATTGGGGTGT GGAGAACCGG 
CTTCATTGGA TCCTCGATGT CAGCTTCAGC GAGGACGCCA GCACGGTGGC CAAGGACAAC 
GCGCCGCAGA ACCTTTCGCT GCTGCGCAAG ATCGCGCTCA ACATCATCCG TGCCGACAAG 
ACCGACACGC GCAAGAGCAG CCTTCGGCTC AAGCGCAAGG GGGCGGCGTG GGATGACGGG 
GTGCGGGAGC GCATGCTGGG GATCCGGGCG ATATGCTAG

Protein sequence

MSYLDEIDDP RKPSNGTLHD FREILVILIA AVLSDCDTVE DITFWARTKE AWLRRFLVLK 
NGIPSEETFL RILRALDPKQ FENMFRRWVG GVVGALSDDA GLAGTIAIDG KTVRGSGSGG 
ESAIHMVSAF ATELGLVLGQ EKVAAKSNEI TAIPELLEAL SIKGLLVTID AMGCQKSIAK 
QIVAKKGDYL LMVKGNQPKL LEAIETAFID QHGVESVDRS SLVERGHGRT VGQIASVLSA 
KGIVDLADWP KCVTIGRIDS MRVVGDKQSD LERRYYISSR ALSAEQLAAA IRAHWGVENR 
LHWILDVSFS EDASTVAKDN APQNLSLLRK IALNIIRADK TDTRKSSLRL KRKGAAWDDG 
VRERMLGIRA IC