Gene Tmz1t_2852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_2852
Symbol
ID	7873260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3087019
End bp	3088008
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	74%
IMG OID	643699773
Product	putative sulfonate ABC transporter, periplasmic sulfonate-binding protein
Protein accession	YP_002889828
Protein GI	237653514
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.174204
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCAGC TGTTCGCCCG CCTGATCGGC ATCGTCCTGC TGGCGCTCGC CGCGGGCGGC 
GCCGCATTCG CCGCAGACCG GCCGGTGGTC CGTGTCGGCG TGCTGCAGTT CGGCACGGTG 
AGCTGGGAGC TCGAGACCAT GCAGCGACAC GGCCTGCTCG AGCGCGAGGG CGTGGACATC 
CGCGTCGTGC CGCTCGCGCT CAAGGACGCC GCCAACGTCG CCCTCCAGGG CGGCGAGGTC 
GATGTGATCG TCAACGACTG GCTGTGGGTG ACGCGCATGC GCTCGGAGGG GGCGGATTTC 
GTCTTCGTGC CCTTCTCGCA GGCGGTCGGC GGCATCCATG CGCGTCCGGA CGCCGGCATC 
GCCAGCCTCG CCGACCTGCG CGGCAAGCGC CTGGGCGTGG CTGGCGGCGC GCTCGACAAG 
AGCTGGCTGC TGCTGCGCGC GTATGCCCGC AAGACCGTGG GCGAGGACGC CGCGAGCTTC 
CTGCGCCCGC AGTTCGCCGC GCCGCCGCTG CTCAACGAGC TGGTGACGCG CGGCGAGCTG 
CCGGCGGCGA TGAACTTCTG GCATTACGGT GCCCGCCTCG CCGCCGCCGG CATGCCCGAA 
GTGCTGGGCA TGAAGGAGAT CCTCGCCACG CTCGGCATCG GCGACGAGAT GCCGCTGGTC 
GGCTGGGTGT TCGGCGAGCG CTGGGCGCGC GCCAACCCGG CGGCGATCGC GGGCTTCCTG 
CGCGCCTCCG CGGCGGCCAA GGCGTTGCTG CGCGAGTCCG ACGCGGCCTG GGAGGCGCTG 
CGTCCGTCGA TGCGCGCCGA GGACGAGGCC AGCTTCGTCG CGCTGCGCGA GGGTTTCCGC 
GCGGGCATCC CGCACGCATC GGGCGAAGAG GGCGAGCGCG CCGCCGCGCG CGCCTTCGCG 
ATCCTCGCTG CGGAAGGGGG CGAGGCCCTG GTCGGGCGCG CCCGCGAGAT CGCGCCGGGC 
ACCTTCTGGC ATGGAGGCGG AGGGCGGTGA

Protein sequence

MLQLFARLIG IVLLALAAGG AAFAADRPVV RVGVLQFGTV SWELETMQRH GLLEREGVDI 
RVVPLALKDA ANVALQGGEV DVIVNDWLWV TRMRSEGADF VFVPFSQAVG GIHARPDAGI 
ASLADLRGKR LGVAGGALDK SWLLLRAYAR KTVGEDAASF LRPQFAAPPL LNELVTRGEL 
PAAMNFWHYG ARLAAAGMPE VLGMKEILAT LGIGDEMPLV GWVFGERWAR ANPAAIAGFL 
RASAAAKALL RESDAAWEAL RPSMRAEDEA SFVALREGFR AGIPHASGEE GERAAARAFA 
ILAAEGGEAL VGRAREIAPG TFWHGGGGR