Gene Saro_2097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2097
Symbol
ID	3917745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2233152
End bp	2234426
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	68%
IMG OID	640444850
Product	general substrate transporter
Protein accession	YP_497370
Protein GI	87200113
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00320357
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCGCGC AGACACTCGA TGAGCGAAGA CTTGCCCGCC GCGCCGTGAT TGCCGCGACC 
ACAGGCAACG CGCTGGAATT CTACGATTTC ATCACGTTCA GTTTCTTTGC CATCCAGATC 
GGCAGGGTCT TCTTCCCGTC GGAGGACCCT TTCGTCAGCC TGATGGCCTC GCTCGCCACG 
TTCGGAGTCG GCTTCATCGG CCGCCCGCTC GGCGCATGGG CCATCGGCGC GTGGGCGGAC 
CGGCACGGGC GCAAGCCGGC GATGCTGCTC AGCATGACGC TGATGGGCAT CTCCGTCGCG 
GTCCTCGCGC TCACGCCGTC CCATGCCGCC ATCGGCGCCG CCGCCCCGGT CATCGTCGTG 
CTGGCCCGGC TGGTCCAGGG CTTCGCGCTC GGCGGAGAGG TCGGCTCGGC AACCACCTAC 
ATGATGGAAT GCGCCAGCCA TGATCGCCGG GCCTGGGCGA TAAGCTGGCA AGGCGCCAGC 
CAGGCCATCG CATCTTCCGC CGGATCGCTG GTCGGCCTCG GCCTCAGCCT TGTCCTGACG 
CCGGACCAGC TGACCGACTG GGGCTGGCGC GTGGCCCTGC TCGCGGGGAC GGTGATCGTG 
CCGTTCTCTC TCGTCATCCG CCGGTCGCTT CCCGAAACGA TCGATGCGCC CGATCACGTG 
CCCGCCGGGC ACATCCCGCC CGGCGTGTGG CGGACGGTCG TGCTGGGCAT GATGATGGTC 
TCCGGGGCGA CCATCGCAAC CTACCTGTTC AATTACATGG CGACCTATGG CCAGAACACG 
CTCGGCTTCA CGGCCAGCGT CTCGCTGGGC ACGACGCTGG CCGTCAACGT CGCGCGCTTC 
GCCGCGATCC TGCTGGGCGG CTGGCTCAGC GACCGCTTCG GGCGGCGTCC CCTGATGATC 
CTGCCCTGGG CGGTCTTCGC CGCGGCCATC GTGCCGGCCT ATGTCTGGCT GACATCGGCG 
CACGACGCCT TCGTCTTCAT CGCGGTCAAC ACCGCGCTCG CCTTCTGCTC GACGGTGCCT 
TCCGGCGCTG TCTACGCCGC GATTGCCGAA AGCCTGCCCA AGGCCAGCCG CGCGAAGACC 
TTCGCGCTGG TCTACGCGCT GCCGGTCACT TTCCTGGGCG GATCGACGCA GTTCGTCATC 
ACCTGGCTGC TCAAGGTCAC CGGAGAACCC ATGGCGGTCG CCTGGTACAT GCTCGGCGCC 
GCGCTCCTCG CGCTTGCCGG GATGGTTCTC GTTCGCGAGA GCGCGCCCTC CCGCCTGCGC 
GCCTCTCCGG CCTGA

Protein sequence

MAAQTLDERR LARRAVIAAT TGNALEFYDF ITFSFFAIQI GRVFFPSEDP FVSLMASLAT 
FGVGFIGRPL GAWAIGAWAD RHGRKPAMLL SMTLMGISVA VLALTPSHAA IGAAAPVIVV 
LARLVQGFAL GGEVGSATTY MMECASHDRR AWAISWQGAS QAIASSAGSL VGLGLSLVLT 
PDQLTDWGWR VALLAGTVIV PFSLVIRRSL PETIDAPDHV PAGHIPPGVW RTVVLGMMMV 
SGATIATYLF NYMATYGQNT LGFTASVSLG TTLAVNVARF AAILLGGWLS DRFGRRPLMI 
LPWAVFAAAI VPAYVWLTSA HDAFVFIAVN TALAFCSTVP SGAVYAAIAE SLPKASRAKT 
FALVYALPVT FLGGSTQFVI TWLLKVTGEP MAVAWYMLGA ALLALAGMVL VRESAPSRLR 
ASPA