Gene Saro_1866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1866
Symbol
ID	3917087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1966737
End bp	1968014
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	66%
IMG OID	640444610
Product	major facilitator transporter
Protein accession	YP_497140
Protein GI	87199883
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.591814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGGACG ACCACATGGG CGATGCCGGA CAGGGTACCG GCGCCGGACA GGCAAGGGGG 
AAGGGCTACC AGATCTGGGT GACCGCCCTG CTCAGCCTCA ACTTCGGCAT CCTGTTCTTC 
GACCGCAACG CGGTGAACTT CCTCATGCCG TTCGTGCAGC CGGACCTGAA GCTGACCAAT 
ACCCAGGTCG GCATGTTCAG TTCCGCCCTG TCGCTGACAT GGGCGCTTTC GGGGCTTTTG 
GTCGGGCGGA TATCGGACAA GCTGGGGTCG AAGAAGCCAG TCGTCGTGAT CGCGACGATC 
GCATTCTGCC TGTGCTCGTT CATCTCAGGC GCGGCCTCGT CATTCCTGAT GCTTCTGGGG 
GCGCGCCTCC TGATGGGCGC GGCGGAAGGC GGCGTGATGC CGGTCAGCCA CGCGATGATC 
GTTTCGGAAG TCGCGCCCGA ACGCCGTGGG CTTGCCATGG GCGTCGCGCA GAACCTCGGG 
TCGAACCTGC TGGGCTCGGG CCTCGCGCCG ATCCTGCTGG TCCCGGTCGC GGCGGCAGTG 
GGCTGGCGGA CGGGTTTCTA TCTTGCCGCC CTGCCGGGCC TCGTCACGGC GGCGCTTATC 
TGGTTCACCC TGCGTGAGCC GCCGGCCGAG GTCCATGACG AGGCGACGCC CAAGGTGACG 
CTGCGCGAGG CCTTCGCCCA CCGCAACGTG ATCCTGTGTG CGCTGATCGC GATCCTGCTC 
GTGTCATACC TCGTCGTGTG CTGGGCATTC ATGCCTCTCT ACCTGACCAA GGCACGCGGC 
TTCGCGCCCG AGACGATGGG CTGGCTGATG GCCACGCTGG GGATTTCGGC GGGTATCGGC 
AGCTTCGTGG TGCCGGCCAT TTCCGATGCC ATCGGACGGC GTCCCGTCAT GATCTTCTTC 
TCGTTCCTGG GCGTCATCCT TCCACTCGGC GCGCTGTACT ACCAGGGCTC GACGCTGGTG 
CTGGCCGCGA TCTTCTTCAT CGGATGGGGC CTGAACGGTC TGTTTCCGAT GTTCATGGCG 
ACCATCCCGG CGGAATCGGT GGACCCGCGC CTGACGGCGA CGCTGACCGG CGTCGTCATG 
GGCACGGGCG AGGTGCTTGG CGGCGTGCTG AGCCCGTTCT TCGCAGGCGC GCTGGCCGAC 
TCCTACGGCC TTTCGGCTCC GCTCTGGCTG ATGCTGGTGT GCACGGTTCT GGCGGGGATG 
CTGACGCTGG GACTGATCGA ATCCGCACCG CGCGTGGTGG CGCGGCGCCT AACCCCGGCC 
TTGGCAGCCG GGACCTGA

Protein sequence

MRDDHMGDAG QGTGAGQARG KGYQIWVTAL LSLNFGILFF DRNAVNFLMP FVQPDLKLTN 
TQVGMFSSAL SLTWALSGLL VGRISDKLGS KKPVVVIATI AFCLCSFISG AASSFLMLLG 
ARLLMGAAEG GVMPVSHAMI VSEVAPERRG LAMGVAQNLG SNLLGSGLAP ILLVPVAAAV 
GWRTGFYLAA LPGLVTAALI WFTLREPPAE VHDEATPKVT LREAFAHRNV ILCALIAILL 
VSYLVVCWAF MPLYLTKARG FAPETMGWLM ATLGISAGIG SFVVPAISDA IGRRPVMIFF 
SFLGVILPLG ALYYQGSTLV LAAIFFIGWG LNGLFPMFMA TIPAESVDPR LTATLTGVVM 
GTGEVLGGVL SPFFAGALAD SYGLSAPLWL MLVCTVLAGM LTLGLIESAP RVVARRLTPA 
LAAGT