Gene Saro_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0804
Symbol
ID	3915858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	854402
End bp	855700
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	67%
IMG OID	640443535
Product	major facilitator transporter
Protein accession	YP_496083
Protein GI	87198826
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACAAA CCCCGCGCGA GGTGATCGAG CAGACGCCGA TGGGCGTCCG CCAGTGGATC 
GCCGTGGTCC TGATGATCGC GCTGAACGCG CTCGACGGGT TCGACGTCCT GTCCAGCGCC 
TTTGCCGCCC CCGGCATCGC CAAGGAATGG GGCATCCAGC GCGACGCGCT GGGTGTCGTG 
CTGTCGATGG AACTGGTCGG CATGGGCTTT GGCTCGATCC TGCTGGGCGG CGCGGCGGAC 
CGCTTCGGGC GGCGTCCGAC TATCCTCGGC TGCCTGTTGG TCATGGCCAC CGGCATGTGG 
CTGGCGACGA CTTCGGCGAG CCCGTCGGGC CTTGCCCTGT GGCGCTTCAT CACCGGCCTC 
GGCATCGGCG GCATGCTGGC GGCGATCAAC GCGGTGACGG CCGAATTCTC CAGCCTCAAG 
GGCCGTTCGC TGGCCATGGC GCTGATGGTC ATCGGATACC CGATCGGCGC GACGGTGGGC 
GGGACCATCG CCGGAATGCT GCTGAAGGGT GGCGACTGGC GGCTGGTCTT CGAATTCGGC 
GCGATCGCCA CGGCGGTGTT CATCCCGCTC GTGTTCCTGT TCGTGCCCGA GACGCCGGAT 
TACTACGTCA CCCGTCGCGA GCCGGACGCG CTCGACAAGG TCAACGCCAG CCTGCGCAAG 
CTGGCCCTGC CGCTCGCCAC GATCCTGCCG CCTGCGCCGG CAGTGGTCGA CAAGCCGAGC 
GTGTTCGACA TCTTCAAGCC CGGCCTGATC CGGACGACCC TGCTGTTCAC GCTAGGCTAT 
TCGTTCCACG CGGTGACGTT CTACTACATC CTCAAGTGGA GCCCCAAGAT CGTCGCGGAC 
TTCGGTTACA CCCAGCCCGA GGCTGCGAGC GTGCTGGTCT GGGCGAACAT CGGCGGGGCG 
ACCGGCGGGG CGCTGTTCGG ATTTGCCATG CACAAGTTCG GGTTGAAGTG GCCGACCATC 
GCGATGCTGG TTGGCGGCGC GATTGCGGTC GTGGCTTTCG GCTTCGGACG AGAGAGCCTC 
GACGGGTGGA AGATGGCGGT GTTCTTCACC GGCTTCACCA CCAACGCCGC GATCGTCGGC 
TTCTACGCCC TCTTCGCCAA GGGCTTCCCG ACCCACGTGC GGGCGACCGG CACCGGCTTT 
GCCATCGGCG CCGGACGCAT CGGCGCAGCG GGTTCGCCGA TCCTGGCGGG CGTGCTGTTC 
ACGCAGGCAG GCCTCGGTCT GCTGGGCGTC TCGGTCGTGA TGGCGATGGG ATCGGTCGTG 
GCAGCGCTGC TGCTGCTGAT GCTGCGCAAG GAAGTCTAG

Protein sequence

MSQTPREVIE QTPMGVRQWI AVVLMIALNA LDGFDVLSSA FAAPGIAKEW GIQRDALGVV 
LSMELVGMGF GSILLGGAAD RFGRRPTILG CLLVMATGMW LATTSASPSG LALWRFITGL 
GIGGMLAAIN AVTAEFSSLK GRSLAMALMV IGYPIGATVG GTIAGMLLKG GDWRLVFEFG 
AIATAVFIPL VFLFVPETPD YYVTRREPDA LDKVNASLRK LALPLATILP PAPAVVDKPS 
VFDIFKPGLI RTTLLFTLGY SFHAVTFYYI LKWSPKIVAD FGYTQPEAAS VLVWANIGGA 
TGGALFGFAM HKFGLKWPTI AMLVGGAIAV VAFGFGRESL DGWKMAVFFT GFTTNAAIVG 
FYALFAKGFP THVRATGTGF AIGAGRIGAA GSPILAGVLF TQAGLGLLGV SVVMAMGSVV 
AALLLLMLRK EV