Gene Saro_1540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1540
Symbol
ID	3917215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1589321
End bp	1590565
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	64%
IMG OID	640444281
Product	major facilitator transporter
Protein accession	YP_496815
Protein GI	87199558
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGCGC GCATTTCAGA CAATCCCACG GTGCCCGTCC GCGAAAACTG GCTGCTGCTC 
ATTCCGCTGG CACTCGCCGG CTTCGTCCTC ATCGGCGGCA TGCTCGTCTC GCTGACCGTC 
TATACCGCGG TCATGCAAGC AAGGTTCGGG TGGAACGAGA CCGAGCTAGG CGCAGGGCCC 
GTTGCGCTTC TGCTGGGCAT GAGTGTCGCA AATCTCGCGG TCGGCCCGGC CATGCAGCGT 
CTCGGCGTGC GGGCGATTTT CGCCGGCGGT TGCCTGGTTG CCGCCGCCGG ATGGGCGGCG 
GCGGGATCGG TCACCCAGCT TTGGCAATTC ATGGTAGCAA TGGGCCTTGC CGGTTTTGGC 
GCAGGTGCGG CGACGATCGT CCCCGGTATC GCCGTCATCA CCAGCGCGTT CCGCAAGAAC 
AGGGGCTTGG CCATCGCACT GTTCATCGGA AGCTGTGCTC TTGCCAGTTC GGCGATGCCG 
ATCTTCACCG CATACCTGAT CGAAACCGTG GGCTGGCGCA CCGCCTTCCG GATCGTCGGC 
ATGGCTGGTG TGCTGCTTTG CCCGCTGCTC GTGCGCTTCC TGCCCGGCAC GCTCTCGATC 
GGCCAGCACG ACGAATGCAT CGATCCCGGC GACGCGGCGC GCCGGCCCCG AACCGCCGCA 
CTGCGGCTTC CTGCCTTCTG GATATTGACG GCCGCATTGA CCGTCAGCCA ACTGTGCATG 
AACGGTGTCC TGTTCAATAT CGTCGCCTTT CTCCGCAAGA ACGGCCTGAC TGACAGCGCG 
GCGGTCGACC TCTACAGCCT CACCAATTTC ATGAGCCTGC CCGGCCTTCT GATCGGCGGC 
CTTCTTTCCG ATCGCGTTAG CGCCCACAGG CTCCTTCCCG CTATCGTCGC AGTGCAGGCT 
CTCGGGACCT TCGCCTTGCT TGGCATCGGT CACCAAGGGG CGCTTGGACT TTTCGCGACG 
ATCGGCTTCG TCGTTTTTTG GGGCGGCGTG GCAGGCCTTC CGTCGCAATC CGCGTCGCTG 
CTTCTGGGCG AATTGGTAGG CCCGCAAAGC TTTGCCTCCC TGCTCGGCAT CGTCTTCACC 
ATAAACGGCT TCGTAGGTGC CCTCGCCCCC GTACTGACTG GCTGGCTGCA TGACGTAAGC 
GGAAGCTACG TCCTGCCATT TGGCCTGTTC GCCGCGTGCC TTCTGGCGGC GGCCCTTGCC 
TGTCGCCTTG GCTCCATGAG CCAGCCCAAT TCCATGCATG CGTGA

Protein sequence

MHARISDNPT VPVRENWLLL IPLALAGFVL IGGMLVSLTV YTAVMQARFG WNETELGAGP 
VALLLGMSVA NLAVGPAMQR LGVRAIFAGG CLVAAAGWAA AGSVTQLWQF MVAMGLAGFG 
AGAATIVPGI AVITSAFRKN RGLAIALFIG SCALASSAMP IFTAYLIETV GWRTAFRIVG 
MAGVLLCPLL VRFLPGTLSI GQHDECIDPG DAARRPRTAA LRLPAFWILT AALTVSQLCM 
NGVLFNIVAF LRKNGLTDSA AVDLYSLTNF MSLPGLLIGG LLSDRVSAHR LLPAIVAVQA 
LGTFALLGIG HQGALGLFAT IGFVVFWGGV AGLPSQSASL LLGELVGPQS FASLLGIVFT 
INGFVGALAP VLTGWLHDVS GSYVLPFGLF AACLLAAALA CRLGSMSQPN SMHA