Gene Sala_1509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1509
Symbol
ID	4080022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1572460
End bp	1573788
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	66%
IMG OID	638009876
Product	general substrate transporter
Protein accession	YP_616555
Protein GI	103486994
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.386131
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCCG ACACCGTCCC GACGACCGAG GCCGAACGCG ACGCTCGCGC CCTCCACGAC 
CATGACGGCC ACCGCATCGA CCCCGCCGAA ATCGCCATCG GCGTCATCAT CGGCCGGACC 
TCAGAGTTTT TCGACTTCTT CGTCTATGCG ATCGCTTCGG TGCTGGTATT TCCCAAGCTC 
GTCTTTCCGC ACCTCGATCC GCTGGCGGGC ACACTCTGGT CCTTCGCGAT CTTTGCCCTC 
GCCTTTGTCG CGCGCCCGGT CGGAACGGTC ATCTTCACCG CGATCGACCG CGGTTATGGC 
CGTGGCGCCA AGCTCACCAT TGCGCTGTTC CTGCTTGGCG GATCGACCGC GGCGATCGCC 
TTCCTGCCCG GCTATGAATC GATCGGCATC GGCGCCGCGC TGCTGCTCGC GCTGTTCCGC 
ATGGGCCAGG GCGTCGCGCT CGGCGGCTCA TGGGACGGCC TCGCCTCGCT GCTCGCATTG 
AACGCCCCCG AATCGAAACG CGGCTGGTAT GCGATGATCC CGCAGCTCGG CGCGCCGCTT 
GGCCTCATCG TCGCCAGCCT GCTCTTCATG TTCCTGATCT CCGCGCTCCC GGCCGAAGAC 
TTTCTCGCCT GGGGTTGGCG CTATCCTTTC TTCGTCGCCT TTGCGATCAA CGTCGTCGCG 
CTGTTCGCGC GGCTGCGCAT CGTCGTGACC CCCGACTATG CCGAGCTGTT CGAAAACCGC 
GCGCTTCAGC CCGCGCCGCT CCTCGAAACG GTACGGTCGG AATGGAAAAC CATCGTCACC 
GGCGCCTTCG CCCCGCTCGC CAGCTTCGCG ATGTTCCACA TGGTCACTGT CTATCCGCTG 
TCGTGGGTGT TCCTGTTCAC CGACGAAACC CCCGCACGCT TCCTGATGAT CGAGGCGATC 
GCTGCGGTCG GCGGCGTGAT CGCGATCATC GCCTCGGGCT ATCTTGCCGA CCGCTTCGGG 
CGCCGCACCG TGCTTGCCGC GACGGCGGCG GCGATCGCGG CGTTCAGCGG CTTTGCCCCG 
CAATTGCTCG ACGCGGGCCA GGCGGGTGAG GCGAGCTTCA TGATCCTCGG CTTCCTCCTG 
CTCGGCCTGT CGTTCGGGCA ATCGTCGGGC GCGCTCTCAT CGAACTTCAC GCCGCGCCAC 
CGCTACACCG GGTCGGCCTT CACCGCCGAC CTCGCCTGGC TGTTCGGTGC TGGTTTCGCA 
CCGATGGTGG CGCTCTGGCT GTCGAGCGAA TTCGGGCTGA TCGCCGCGGG TGCCTATCTG 
CTGTCGGGCG CGATCGTTAC GCTCGTCGCG CTGTGGCTCA ACCGCGAACT TGCACGCACG 
ATCGATTGA

Protein sequence

MAADTVPTTE AERDARALHD HDGHRIDPAE IAIGVIIGRT SEFFDFFVYA IASVLVFPKL 
VFPHLDPLAG TLWSFAIFAL AFVARPVGTV IFTAIDRGYG RGAKLTIALF LLGGSTAAIA 
FLPGYESIGI GAALLLALFR MGQGVALGGS WDGLASLLAL NAPESKRGWY AMIPQLGAPL 
GLIVASLLFM FLISALPAED FLAWGWRYPF FVAFAINVVA LFARLRIVVT PDYAELFENR 
ALQPAPLLET VRSEWKTIVT GAFAPLASFA MFHMVTVYPL SWVFLFTDET PARFLMIEAI 
AAVGGVIAII ASGYLADRFG RRTVLAATAA AIAAFSGFAP QLLDAGQAGE ASFMILGFLL 
LGLSFGQSSG ALSSNFTPRH RYTGSAFTAD LAWLFGAGFA PMVALWLSSE FGLIAAGAYL 
LSGAIVTLVA LWLNRELART ID