Gene Tbd_1426 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbd_1426
Symbol
ID	3672267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiobacillus denitrificans ATCC 25259
Kingdom	Bacteria
Replicon accession	NC_007404
Strand	+
Start bp	1515546
End bp	1516646
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	66%
IMG OID	637710111
Product	ACR3 family arsenite transporter
Protein accession	YP_315184
Protein GI	74317444
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.653925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCGC AGTGTGAAGT CACCGCCAAG CGCGCGGCCG CCATGGGCGG CCCGCCGGCG 
CCGATGAGCG TGTTCGAGCG CTGGCTCACC CTGTGGGTCG CGCTGTGCAT CGTCGCCGGC 
GTGGCACTCG GGCAACTGTT CCCGGCGCCA TTCCAGGCGC TCGGGCGGAT GGAGGTGGCG 
CAGGTCAATC TGCCGGTCGG CCTGTTGATC TGGATCATGA TCATCCCGAT GCTGATGAAG 
ATCGACTTCG GCGCGCTGCA TCAGGTGAAA TCGCACTGGC GCGGCATCGG CGTCACGCTC 
TTCGTCAACT GGGCGGTGAA GCCGTTCTCG ATGGCACTCC TGGCGTGGAT CTTCATCCGC 
CATTTGTTCG CGCCCTGGCT GCCCGCCGAG CAGCTCGACA GCTACGTCGC CGGCCTGATC 
CTGCTCGCGG CCGCGCCGTG CACGGCGATG GTGTTCGTGT GGAGCCGCCT GACCGGCGGC 
GATCCATATT TCACGCTGTC GCAGGTGGCG CTCAACGACA CCATCATGAT CTTCGCCTTC 
GCGCCGATCA TCGGGCTGCT CCTGGGCCTT TCCGCGATCG TGGTGCCGTG GGACACGCTC 
ATGATTTCGG TCGCGCTTTA TATCGTGCTT CCGGTGATCC TCGCGCAGGT CTGGCGCAAG 
CGGCTGCTGA AGCGCGGGCA GGCGGTGTTC GACCGGGTGA TGGCGCAGCT CGGCCAGGCT 
TCGATCCTCG CGCTGCTGGC GACGCTGGTG CTGCTGTTCG CCTTTCAGGG CGAGCAGATC 
CTCGCGCAGC CGTTGATCAT CGCGTTGCTC GCAGTGCCGA TCCTGATCCA GGTCTTCTTC 
AACTCGGGCT TGGCCTACTG GCTGAACAGA AAAGTGGGCG AGAAGCACGC CGTCGCCTGC 
CCGTCGGCGC TGATCGGCGC GTCGAACTTC TTCGAGCTGG CGGTGGCGGC GGCGATCGCG 
CTGTTCGGCT TCGAGTCGGG CGCGGCGCTG GCGACCGTGG TCGGCGTGCT GATCGAGGTG 
CCGGTGATGC TGCTGGTGGT GAAGCTCGTC AACCGCAGCA AGCGCTGGTA CGAGCGCGGC 
CTGCCAGCGG GACGGGCCTG A

Protein sequence

MSAQCEVTAK RAAAMGGPPA PMSVFERWLT LWVALCIVAG VALGQLFPAP FQALGRMEVA 
QVNLPVGLLI WIMIIPMLMK IDFGALHQVK SHWRGIGVTL FVNWAVKPFS MALLAWIFIR 
HLFAPWLPAE QLDSYVAGLI LLAAAPCTAM VFVWSRLTGG DPYFTLSQVA LNDTIMIFAF 
APIIGLLLGL SAIVVPWDTL MISVALYIVL PVILAQVWRK RLLKRGQAVF DRVMAQLGQA 
SILALLATLV LLFAFQGEQI LAQPLIIALL AVPILIQVFF NSGLAYWLNR KVGEKHAVAC 
PSALIGASNF FELAVAAAIA LFGFESGAAL ATVVGVLIEV PVMLLVVKLV NRSKRWYERG 
LPAGRA