Gene Tmz1t_4059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_4059
Symbol
ID	7873286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	4458352
End bp	4459572
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	73%
IMG OID	643700990
Product	toxic anion resistance family protein
Protein accession	YP_002891013
Protein GI	237654699
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3853] Uncharacterized protein involved in tellurite resistance
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTGC CGCTGCGATC CCTTCTCCGT ATCCTCCCGC ACGCCCCCGA GGGCGACCCG 
GGCGGCGGCG GGCGCCCGCG CTCGGGCCTG TCGCTGCCGC CGATCGAGGA CATCGCGCGC 
GAGACCCTGC CGCCGCAGGA CGCCGAGCCG GCGGAGGACG CCGAGCTCGC CCCGCTCGCC 
GACGCCTTCG TGCGCGACGC GCTCGCCGCC GGCGAGGAGG CCCTGCAGCG CCAGCGCGAG 
GCGGTCGACA CCATGGGCAT CGAGCTGCAG CGCCAGGCCG CCTGGCGCAG CGAGATGCTG 
CAGGCGCCGA TCCGCAAGCT CGCCCACCAG GGCGACGAAG GCGGCCCGGT CGCGCAGGCC 
CTGCTCGCGC TGCGCGACAA GATGCAGGAC CTCGACCCTG CGCGCCAGAA GCTGAGCGGC 
GAGGGCCTGT CGCGCGCGCT GTCCTTCATC CCCGGCGTCG GCAAGCCGAT GCAGCGCTAC 
TTCCAGAAAT ACGAGAAGGC GCAGGACGCG CTCGACGCCA TCATCCGCGA CCTGCAGGGC 
GGCGCCGACA TGCTGCGCCG CGACAACCTC ACCCTGGCCG ACGACCAGCA ATCCCTGCGC 
GCCATCCTCG CCCAGCTCGA ACGCCAGGTC GAACTCGGCC GCATGATCGA CCGCCGCCTG 
GCCTGCGAGG CCGCCTCCGC CAGCCTGCCC GCGCCGCGGC GCGCCTTCGT CGAGGAAGAG 
CTGCTCTTCC CGCTACGCCA GCGCGTCATC GACCTGCAGC AGCAGGTGGC GGTGAGCCAG 
CAGGGCGTGC TCGCGCTCGA GGTGGTGATC CGCAACAACC GCGAGCTCAT CCGCGGCGTG 
GACCGCGCGA TCAACGTCAC CGTCTCGGCG CTCAACGTCG CCGTCACCGT CGCGCTCGGG 
CTGGCCAACC AGCGCCTCGT GCTCGACCGC GTCGCCGCGC TCAACGAGAC CACCTCCGCG 
CTCATCGCCG GCACTGCCCA GGCCCTGCGC ACCCAGGGGG TGGACATCCA GACCCGCGCC 
TCTTCGTCCA TGCTCGACAT GGGCCGGCTC GAACAGGCCT TCGGCGATGT GCTCGGCGCC 
ATCGACGATC TGTCGCGCTA CCGCCGCGAG GCCCTGCCCA AGCTCGATGC CCAGATCGAC 
CGCCTCGCCG CGCTGGCGCG CCAGGGCGCG CAGGCCATCC GGCGCATGGA CGAAGGCAAC 
CGCGCCGAGC CGCAGCCTTA A

Protein sequence

MSLPLRSLLR ILPHAPEGDP GGGGRPRSGL SLPPIEDIAR ETLPPQDAEP AEDAELAPLA 
DAFVRDALAA GEEALQRQRE AVDTMGIELQ RQAAWRSEML QAPIRKLAHQ GDEGGPVAQA 
LLALRDKMQD LDPARQKLSG EGLSRALSFI PGVGKPMQRY FQKYEKAQDA LDAIIRDLQG 
GADMLRRDNL TLADDQQSLR AILAQLERQV ELGRMIDRRL ACEAASASLP APRRAFVEEE 
LLFPLRQRVI DLQQQVAVSQ QGVLALEVVI RNNRELIRGV DRAINVTVSA LNVAVTVALG 
LANQRLVLDR VAALNETTSA LIAGTAQALR TQGVDIQTRA SSSMLDMGRL EQAFGDVLGA 
IDDLSRYRRE ALPKLDAQID RLAALARQGA QAIRRMDEGN RAEPQP