Gene Sare_2083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2083
Symbol
ID	5706803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2397979
End bp	2399226
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	69%
IMG OID	641271569
Product	arsenical pump membrane protein
Protein accession	YP_001536940
Protein GI	159037687
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.964654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.119821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACAT TCGTGTCGGT TGTCATTCTG GTCGGTGTAC TGGGGTTTGC CCTTGTCCGG 
CCGTGGGGGT TGCCGGAGGC GGTGGGAGCC GTCCCAGGGG CCGGCCTGGT GGTGCTGCTT 
GGCCTGGTGT CCTGGCAGGA TGCGGGACGG GAACTGGTCG TGTTGGGCCC AACCGTGGGA 
TTCCTGGCGG CGGTGCTGAC ACTCGCCCAC CTGGCCGACG ACGCGGGCGT CTTCAGATAT 
GCCGGTTGGG TGGCTGGGCG GGTGAGCCGC GGTTCACCGC GACGGTTGCT CGGTGTGCTA 
TTCGTGATCG CGTCTGCGGT TACCGCTGTT TTGAGTCTGG ACGCGACGGT GGTGCTGTTG 
ACGCCGGTGG TGTTGGCAAC CGCGATGAGG ATGCGGGTAC GCGCCAAACC CCACCTGTAC 
GCGTGTACCC ATCTGGCGAA CTCCGCGTCT CTGCTGTTGC CGGTGTCGAA TCTGACGAAC 
CTGTTGGCGT TCGCCGCGAG CGGATTGACC TTCGCCCGGT TCGCTGGGTT GATGGCGTTG 
CCGTGGCTGG CCGTGGTGGC CACCGAGTAT CTGCTGTTTC GTTGGTTCTT CGCCGGTGAC 
CTGGCCGCTC CCGCGCGTCG GGGTCCGCCC GCGACGCCGG TGCAGGCGCC GCGGTTCGCA 
CTGGTGGTGT TGGCGGTCAC GTTGGTCGGG TTCGGGCTGG CCGAGCCGGT GGGCGTGCAT 
CCGGCGTGGG TGGCCGCGGG CGGGGCGCTG GTACTAGCCA CCAACCGGCT GGTCCGGCGA 
CCCTTGGCCG AGGTGGGACG GCTGGCGCGG GCCGCGAATC TGCCGTTCTG CGGGTTCGTG 
TTCGGGTTGG GCATCGTGGT GCTGGCGGTG CGTTCCGGCG GGGTGGGCCT GGTGGTCGGC 
CGGCTGATTC CCGCCTGGGG TGGGCTGGCG GGCCTGCTGG CCGTCGCGGT GCTGGCCGCG 
GTGCTGGCGA ACCTGATGAA CAATCTGCCG GCCACGTTGA TGCTCACACC GCTGGTCGCG 
CACTCGCCGG GGCTGGTTCT GGCGGCCCTA CTGGGGGTGA ACATCGGGCC CAATCTGACC 
TATGTCGGCT CGCTGGCCAC CCTGTTGTGG CGGCAGATCC TGCACGCGAC CGCCCACCGG 
CCTGCGGGGC GGGAGTTTCT ACGGCTGGGC GCGTTGACGG TGCCGGCGTG CCTGATGGCC 
GGGGTGGCGG CGTTGTGGCT GGGGTTGCGA GTGTCGGGGA CGTCATGA

Protein sequence

MSTFVSVVIL VGVLGFALVR PWGLPEAVGA VPGAGLVVLL GLVSWQDAGR ELVVLGPTVG 
FLAAVLTLAH LADDAGVFRY AGWVAGRVSR GSPRRLLGVL FVIASAVTAV LSLDATVVLL 
TPVVLATAMR MRVRAKPHLY ACTHLANSAS LLLPVSNLTN LLAFAASGLT FARFAGLMAL 
PWLAVVATEY LLFRWFFAGD LAAPARRGPP ATPVQAPRFA LVVLAVTLVG FGLAEPVGVH 
PAWVAAGGAL VLATNRLVRR PLAEVGRLAR AANLPFCGFV FGLGIVVLAV RSGGVGLVVG 
RLIPAWGGLA GLLAVAVLAA VLANLMNNLP ATLMLTPLVA HSPGLVLAAL LGVNIGPNLT 
YVGSLATLLW RQILHATAHR PAGREFLRLG ALTVPACLMA GVAALWLGLR VSGTS