Gene Saro_1298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1298
Symbol
ID	3917930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1342714
End bp	1344042
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	66%
IMG OID	640444035
Product	major facilitator transporter
Protein accession	YP_496576
Protein GI	87199319
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCAG AGACGGCAGA CGAGCGTAGC CTGTGGGATT CGGTGCGGCC CTATCTTGAA 
AAGGAATCGC TGGCCGCCTT CTTCCTCGGC GTATCCTCGG GCTTTCCCTA TGCGATGATC 
GGCGCGACGC TGACGACGCG GCTGGCGCAG GACGGGATCG ACAAGAAGAC CGTTACCGCC 
TTCACGCTGG CTTTCCTCGT CTACAACCTC AAGGTCTTCT GGGCCTGGCT GGTCGATGGC 
GTGCGCCTGC CGTTGCTGGG CAGGCTGGGG CAGCGCGTTT CGTGGATGCT GCTGGCAGGG 
TCGCTGGTCA TGGCGGCGGT CGCCAACCTT GCGCTGGTCG ATCCGGCGGC GGACCTTGGC 
GCGACGGTGC TTGCCGCCGT GCTGGTAGGC GTTGCGGGCG CGACGTTCGA CATCGTGATC 
GACGCCTATC GCATCGAGAC ATTGAAGCCA TATCAGCTCG GCACCGGTTC GGGCATGAGT 
CAGTACGGCT GGCGCATCGG TTCGGCCGGG GCGGGCGCGC TGGCGCTGAT CGTGGCCGGG 
CGTTCGGGGT GGAGCGCGGC CTATCTTGCC TGCGCGCTCT TCGCGCTGCC CGCCATGCTT 
ACCGCGCTGT TCCTGGGAGA ACCCGCACGG CACCGCGAGC CGACCAGGCG GAAAGGCGTG 
GGCGAGGTCG TGGCATCGAT CATCGGCCCG TTCGGCGAGT TCTTCCGCCG GCACGGCGCG 
TGGCTCGTCC TGCTGTTCAT CCTCGTCCAC AAGGTCGGCG ACACGCTGGC GAACCTGACC 
TTCCGCCTGT TGTTCGACGA CCTCGGCTTC ACCAACGACG AAATCGCCAT CTGGGACGTG 
GGCGTGGGCT TCTGGGCCTA CCTGATCGGC GTGTTCATCG GCGGCGTGGC CTATGCCCGG 
ATGGGACTCA AGCGCTCTGT CCTTCTGGCG CTGGTGCTGA TGGCGGTGTC GAACCTGTCG 
TTCGCGGCGC TCGCGGCGGC TGGTCATTCC AACATCGGCA TGGCGGGCGC CATCGGCTTC 
GAAAACATGG CCTCGGGTTA TGGCGGCGTC GTCGTGGTCG CCTATTTCTC GGCGCTGTGC 
GACCTGCGCT ACACCGCCGC GCAATACGCG CTGATTTCGG CCGGGGCGAG CGTGGTCGGA 
CGTTTCGCCA CCGGGACCAC AGCGGGCGCG TTGATCGAGG GCATGGGCTA CGTGAACTTC 
TACCTGCTTA CGACCGTGCT GGCGCTGCCG GGCATCGTGC TGTTCTGGTG GATGAGCCGC 
AGCGGCCTGG TCGATGCGGC GATGGGCACG GCCGGCGAAG AGAAGTCGGA CGCCGATCCG 
CTTACCTGA

Protein sequence

MSAETADERS LWDSVRPYLE KESLAAFFLG VSSGFPYAMI GATLTTRLAQ DGIDKKTVTA 
FTLAFLVYNL KVFWAWLVDG VRLPLLGRLG QRVSWMLLAG SLVMAAVANL ALVDPAADLG 
ATVLAAVLVG VAGATFDIVI DAYRIETLKP YQLGTGSGMS QYGWRIGSAG AGALALIVAG 
RSGWSAAYLA CALFALPAML TALFLGEPAR HREPTRRKGV GEVVASIIGP FGEFFRRHGA 
WLVLLFILVH KVGDTLANLT FRLLFDDLGF TNDEIAIWDV GVGFWAYLIG VFIGGVAYAR 
MGLKRSVLLA LVLMAVSNLS FAALAAAGHS NIGMAGAIGF ENMASGYGGV VVVAYFSALC 
DLRYTAAQYA LISAGASVVG RFATGTTAGA LIEGMGYVNF YLLTTVLALP GIVLFWWMSR 
SGLVDAAMGT AGEEKSDADP LT