Gene Sala_2538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2538
Symbol
ID	4081512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2678373
End bp	2679464
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	65%
IMG OID	638010915
Product	bile acid:sodium symporter
Protein accession	YP_617577
Protein GI	103488016
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.344052
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG GAATCGCTGC GGCTGCCCCT GCCGAAACGC AGAACCGACC CGGTATCGGC 
TTCTTCGAGC GTTATCTGAC GCTTTGGGTC GCACTGTGCA TCGTCGCCGG CATTGCGCTG 
GGATCATGGC TGCCGGCGCT GTTCGCGACG ATCGCTTCGG CCGAGATCGC CCGCGTCAAT 
CTCGTCGTCG CGGTGCTGAT CTGGCTGATG ATCGTGCCGA TGCTCTTGAA GATCGATTTC 
GGCGCACTCG GCTCGGTCAG GCAGCACTGG AAGGGCGTCG GCGTCACGCT GTTCATCAAC 
TGGGCGGTCA AGCCCTTCTC GATGGCGCTG CTCGGCACGC TGTTTATCGG TTGGTTGTTC 
GCGCCGCTGC TGCCGCAGGG CGAGATTTCC TCCTACATCG CCGGGTTGAT CCTGCTCGCG 
GCCGCGCCCT GCACGGCGAT GGTGTTCGTC TGGTCGAACC TTTGCGAGGG CGAGCCCAAC 
TACACGCTCA GCCAGGTTGC CTTGAACGAC CTCATTATGG TGTTCGCCTT TGCGCCGATC 
GTCGGCCTCT TGCTCGGGGT CGCTTCGATC ACCGTACCGT GGGAAACGCT GCTGCTCTCC 
GTCGCGCTCT ATATCGTAGT GCCGGTGATG GTCGCGCAGG TCATCCGGCG GGCGGTTCTC 
GCCCGCGGCG GTGCGGACGC GCTGCAGACA CTGCTCGACC GTCTCGGTCC GGTCTCGCTG 
CTGGCGCTGC TCACCACGCT GGTGCTGCTG TTCGGCTTTC AGGGCGAGCA GATCCTTGCC 
CGGCCACTCG TCATCGCTCT GCTCGCGGTG CCGATCCTGG TCCAGGTCTA TTTCAATGCA 
GGGCTTGCCT ACTGGCTGAG CAAACGATTC GGCGTCGCAT GGTGCGTGGC CGCGCCGGCT 
GCGCTGATCG GCGCCTCGAA CTTTTTCGAG TTGGCTGTCG CCGCCGCCAT CAGCCTGTTT 
GGCCTCAACT CGGGGGCGGC GCTCGCGACT GTGGTCGGCG TGCTGGTGGA GGTGCCGGTG 
ATGCTCTCGG TCGTGGCGAT CGTGAAGCGC ACCCGGAGTT GGTACGAGAA CCGCCCAGCG 
AGCCTCGCCT AA

Protein sequence

MSDGIAAAAP AETQNRPGIG FFERYLTLWV ALCIVAGIAL GSWLPALFAT IASAEIARVN 
LVVAVLIWLM IVPMLLKIDF GALGSVRQHW KGVGVTLFIN WAVKPFSMAL LGTLFIGWLF 
APLLPQGEIS SYIAGLILLA AAPCTAMVFV WSNLCEGEPN YTLSQVALND LIMVFAFAPI 
VGLLLGVASI TVPWETLLLS VALYIVVPVM VAQVIRRAVL ARGGADALQT LLDRLGPVSL 
LALLTTLVLL FGFQGEQILA RPLVIALLAV PILVQVYFNA GLAYWLSKRF GVAWCVAAPA 
ALIGASNFFE LAVAAAISLF GLNSGAALAT VVGVLVEVPV MLSVVAIVKR TRSWYENRPA 
SLA