Gene Saro_2604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2604
Symbol
ID	3917019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2815108
End bp	2816343
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	66%
IMG OID	640445363
Product	major facilitator transporter
Protein accession	YP_497874
Protein GI	87200617
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGACC AGAGCAATTC AGATGCCATC CGGGCAGGCG CTATCCGGAG CGCGCCGTCG 
CCTGCCGACG TCAACGGCTG GCCCGCCGTC GCGAGTGCCA TTCTCCTTGG CACGATCGGA 
GTGCTCTCGT TCATCATCCA GCCGGGGCTG GTGCAGGGCT ATGTGACACA TCTGGGCCTT 
GGCGAGGCCG CGGCGGTGGA CCTTGCCGGC ATCGAGATGC TGGGCGTCGC CCTTGCCACC 
ATCGCGCTGG CCATGTTCGG CGGGCGGGTG GACTGGCGGC ACGTGGTCCT TGCCGGTCTC 
GGCCTTGCCG TGGTGGGCAA TGCCGGTTCA GCCGCGACGC AGGGCGCGCT CTTCGCGCTG 
TTCCGGTTCG TGTCGGGCCT TGGCGAAGGC ACGATCATAT CGATCAGTTT CACGTTCGTC 
GGCGTGACCC GCCGGACCGA GCGCAACGTG GCGCTCTATC TCGTGCTCCT GCTGACGTAT 
GGCGCATTTA CCCTGTGGCA GTTGCCGGCC ATTCTCGACG CCATCGGCCT GCCGGGCCTG 
TTTGCCGCCT TCGCCGCGCT ATCGGCCCTG GCGGTGGTGA CGGTACCGCT TGTCCCAAGG 
GCCTATCACG CCCAGGAAAT GGCCAATCCC GAAGCCCGCC AGCTTTCCCG CGTCCTACTG 
GCGGTCGCTC TGGCCGGGGT TCTTGCCTAC AACCTTGCCC AGGGAATCGC ATGGGCCGTT 
CTGTTCCTTG TCGGCATCGG AGCCGGGCTT GGCGAGCAGC AGGTGGCCGA CAGCCTGTTC 
CTGTCGCAGG TCGTGGCGAT TGCCGGCGCG CTGGCATCGG TGTTCCTCGC CGCCAGGCTG 
AACCGCAACG CCGCCATCGC TTTCGGCATA CTGGTGGGCG CTGCCAGCAT TGCCCTGCTT 
GAAGGCGCGC CTTCGGCGGC GTTCTTCACC GTGGGCGTGT GCGGCTTCAA CTTCCTGTGG 
AACTTCGTCC TGCCCTTCAT TCTCGGCCGC ATCTGCGATT TCGATACGAG CGGGCGGATG 
ATGTCGCTTG CCATCGCCAT GCAGATGACC GGGCTGGGCG GAGGCCCCCT GCTGGCGGCG 
CGGCTGATCG ACGGTAACGG CTACGGTCCG GTACTGACGC TCTGCATCGG CCTGTTCATC 
GCCAGCTTCC TGCTGCTGCA ATTGCCCATG CGCAGGCACG GAGCGCTTCT TGCGTCCACC 
CCCGCTCCTG CGGCTGTCCT TTCAAACGCC ATCTGA

Protein sequence

MSDQSNSDAI RAGAIRSAPS PADVNGWPAV ASAILLGTIG VLSFIIQPGL VQGYVTHLGL 
GEAAAVDLAG IEMLGVALAT IALAMFGGRV DWRHVVLAGL GLAVVGNAGS AATQGALFAL 
FRFVSGLGEG TIISISFTFV GVTRRTERNV ALYLVLLLTY GAFTLWQLPA ILDAIGLPGL 
FAAFAALSAL AVVTVPLVPR AYHAQEMANP EARQLSRVLL AVALAGVLAY NLAQGIAWAV 
LFLVGIGAGL GEQQVADSLF LSQVVAIAGA LASVFLAARL NRNAAIAFGI LVGAASIALL 
EGAPSAAFFT VGVCGFNFLW NFVLPFILGR ICDFDTSGRM MSLAIAMQMT GLGGGPLLAA 
RLIDGNGYGP VLTLCIGLFI ASFLLLQLPM RRHGALLAST PAPAAVLSNA I