Gene Sala_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0101
Symbol
ID	4082096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	102403
End bp	103683
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	66%
IMG OID	638008461
Product	major facilitator transporter
Protein accession	YP_615159
Protein GI	103485598
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCGG CGATGGATAG CATGCGGTCG GCGGGCCGAC GTGGCCTCAA GCTCGCACCG 
GTGGCGGCGT TGCTGGCGAG CGTCGCGGCT CTGCTGCTGG GTAATGGTTT GCTGGGCACG 
CTCCTGATCG TCAGGGCCGG CCAGGAGGGC TTCTCGTCCG GCGCGATCAG CGCGATGATG 
TCGTTCTACT TCGCCGGTTT CACGATCGGC GCGCTCATGT TGCCGCGGAT CATCGTCGCC 
GTGGGTCATG TCAGAACCTT TGCCGGCTTT GCGGCGATCG CCTCGATGAC TGCCCTTCTC 
CATGTTGCGC TCGTGGAACC GATCGCCTGG ATACCGCTTC GCCTGATCAC GGGCTTCGCC 
TACGCGGGCA TGATCCTCGC AACGGAGAGC TGGCTCAACG CCCATGCAGT GCCATCCACG 
CGCGGCCAAC TTCTGTCGAT CTTCGGAGTC GTCTCGATGG GCTCATGGGC CATCGGCCAG 
GCCTTGCTCA ACGTCGCCCC GCCCGCCGAC ATGACCTTGT TCCTTATCGT GTCGCTGTTA 
ATTTCCGCGG CGGTGGTTCC GATCACCTTG CTGCCCAGCC ATCCGCCGGC GCAGGTGACA 
CAGGAACGGG TCGCGTTCAG CGACCTCGTG CGCGCATCAC CGCTCGCTGC GGCTGGCGCT 
TTCCTCGCTG GCCTGGCTAT CGGCGGTTTT TGGGGCATGG GCCCGAACTT CGCCCAGAGG 
ATCGGACTCG ATGTCGGCGG CATCTCCGCT TTCATGGCTG CGGTGCTGGG TGGGACGCTC 
CTATTGCAGT GGCCCCTCGG CTGGCTTTCG GATCGCGTGT CGCGGAACCT TGTCATCGCC 
GCTGCGGCCC TGGCGTCCGC AGCGGCGGCC GTCGGCGTCG CCCTCGCGGT AGGGGCGCCC 
CTGCCGCTGC TCCTCGCGGC GGGCGCGCTG TTCGGCGGCT TTGGCATCCC GATCTATTCA 
TTGTGTCTCG CGGTTGCCAA CGACGACCTT CCGGCCGGCC GGCTGCTCGG TACCGCCCGC 
GGGCTTCTGC TGCTCAACGG GATCGGGACA GCCGCCGGAC CCCTTATCGG GGGTGCTGCG 
ATGACTATCG CCGGCCCCGG TGGGCTGTTC CTTTATGCGG CCGCATTGCT TGCCATATTG 
GCGGTGTTGG CTATCGGGAG CAGCCAGCCA AGGCGCCGCA TCCACGCCAA GGCTGCCCGC 
TCTCCAAGCA CACCGATGAT CACGGGATCT CTTGATGTGA TGATATGCAT GGAGTCAGAG 
ACGGAGGCCG CCCGGCACTA G

Protein sequence

MSPAMDSMRS AGRRGLKLAP VAALLASVAA LLLGNGLLGT LLIVRAGQEG FSSGAISAMM 
SFYFAGFTIG ALMLPRIIVA VGHVRTFAGF AAIASMTALL HVALVEPIAW IPLRLITGFA 
YAGMILATES WLNAHAVPST RGQLLSIFGV VSMGSWAIGQ ALLNVAPPAD MTLFLIVSLL 
ISAAVVPITL LPSHPPAQVT QERVAFSDLV RASPLAAAGA FLAGLAIGGF WGMGPNFAQR 
IGLDVGGISA FMAAVLGGTL LLQWPLGWLS DRVSRNLVIA AAALASAAAA VGVALAVGAP 
LPLLLAAGAL FGGFGIPIYS LCLAVANDDL PAGRLLGTAR GLLLLNGIGT AAGPLIGGAA 
MTIAGPGGLF LYAAALLAIL AVLAIGSSQP RRRIHAKAAR SPSTPMITGS LDVMICMESE 
TEAARH