Gene Saro_3402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3402
Symbol
ID	5077551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	1392
End bp	2579
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	72%
IMG OID	640481126
Product	Bcr/CflA subfamily drug resistance transporter
Protein accession	YP_001165788
Protein GI	146275628
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00710] drug resistance transporter, Bcr/CflA subfamily

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.762536
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGGCAG CCGCCGCGCC CGGGCCCGCA ACGATCATCA CTCTCGCCGC GATCGCGGCA 
ATGGGGTCGA TGGCGATCCA CATGCTCGTC CCGGCGCTGC CTCTCCTCGC GCACGAAATG 
GCGGTGGGCG AGGCCCGCGC GCAACAGGCG GTCAGCGTCT ATCTGGCGGG GCTCGCCGGA 
GGCCAGCTGA TCGCCGGCCC GCTGGCCGAC CGGCTCGGCC GCCGCCCGGT CATGCTCTGG 
GGCCTTGCCT GCTACATCGC GGGCGCACTG GGCGCCGCGC TCTCACCTGC CATGCCCATC 
CTGCTTGCGG CGCGGCTGCT CCAGGCGCTT GGCGGCGCGG CGGGGGTGGT CAGCGCACGG 
GTCATCGTCG GCGAACTCTA CGGCCGCGAG GAAGCGGCCG CGCGGCAGGC GACGCTCATG 
TCCATCGTTC TGATATCCCC CGCTCTCGCG CCGGTCGTTG GCGGCGTGAT CGCGGATTTC 
GCAGGCTGGC GCACGGTTTT CCTGATGCTT GCCGCCACGG GTCTCGCAGG CCTCGTGTCC 
GCCAGAATGA TCCTGCCCGC TCACACCCCG GCCGTCGCCG CCACCGCAGA GGGCACGCAC 
CTGCGCCCGC CCCTCATCCA CGGCTATGCC CGCCTGTTCC GCAACCGTCG CTTCGTCCTC 
ACAACCGTCG CGCTCGCGGC GTCGAGCGGC AGCCTCTACA TGTTCCTGGG CGCGGCCCCG 
TTCCTGCTGA TCGGCAAGGG CGGGCTCAGC CCGTCCGAGG CCGGCATCGG CCTTCTGATC 
GTGGCCGGCG CTGGCATTGT CGGCACTCGT CTCATGCGCC TTGTCCAGCG ACGCGGCGAT 
GCGGTGGTCT TCGGCACGGC AAGCGCCGCC ACGGGCGCCA TCTCGGCACT GCTCCTGGCT 
GCGCTGGGCT TTCACGACCC TTTCGCCCTG CTCGCGCCCG TTACCCTTCT CGGCCTTGGC 
GCCGGCCTTA CCGGGCCCGC CGCGATCAGC GAGGTCGCCT ATGCCGAGGC CGGGCTCGCG 
GCCACCGCCA CCAGCCTCGC CGGGGCTCTG CAGATGCTGG CCAGCAGCCT TGCCATGACC 
GCGCTCGGCC TCTTCGCCCC GCTCGATTCG CTGCGGGTCT GCCTTGCCCT TGCGCTGTCG 
TCCGCAGTGG GCCTGACAAG CGCCCTGTTG CGTCGGGGCA ACGCCTGA

Protein sequence

MKAAAAPGPA TIITLAAIAA MGSMAIHMLV PALPLLAHEM AVGEARAQQA VSVYLAGLAG 
GQLIAGPLAD RLGRRPVMLW GLACYIAGAL GAALSPAMPI LLAARLLQAL GGAAGVVSAR 
VIVGELYGRE EAAARQATLM SIVLISPALA PVVGGVIADF AGWRTVFLML AATGLAGLVS 
ARMILPAHTP AVAATAEGTH LRPPLIHGYA RLFRNRRFVL TTVALAASSG SLYMFLGAAP 
FLLIGKGGLS PSEAGIGLLI VAGAGIVGTR LMRLVQRRGD AVVFGTASAA TGAISALLLA 
ALGFHDPFAL LAPVTLLGLG AGLTGPAAIS EVAYAEAGLA ATATSLAGAL QMLASSLAMT 
ALGLFAPLDS LRVCLALALS SAVGLTSALL RRGNA