Gene Saro_3636 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3636
Symbol
ID	5077784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	262262
End bp	263560
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	69%
IMG OID	640481359
Product	major facilitator transporter
Protein accession	YP_001166021
Protein GI	146275861
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACAC CTGCATCCAC CGCCGCCTTC GCGACGATGA CCGCCGGCGG CAAGCCGCTC 
ACCAACCGCT GGCTGGCCTT GGCGCTGCTG GTTCTCGTGG CGGTACTCAA CTACGCCGAC 
CGCTTCCTGA TCTCGGGCCT GGCCGAACCC ATCAAGGCGC ACTTCGGCAT CGGCGACGCG 
ATGATGGGCC TGCTTATGGG CCCTGCCTTC GCACTGCTCT ATGCCGTATT CACCCTGCCG 
ATCGCGCGCC TTGCCGACCG CCGCTCGCGC ATCCTGATCA TTGCGGCCGG ATGCGGCGTG 
TGGAGCTTCT TCACGATGCT GTCAGGCATG GCCGCCAGCG CCAACATGCT GGCGCTGGCC 
CGGGTCGGCG TCGGCATCGG CGAGGCTGCA TACCAGGCGC CTGCCGCGGC ATTGATCGCC 
GCCTATTTCC CGCCGCACGA ACGGGGCCGC GCCTTCGCAC TGCTGGGCAC GGCCATCTAC 
GTCGGCCAGA TGACCGGCCT TGCCGGTGGC CCCGCAATCG CCGCGACCAG CGACTGGCAG 
ACGGCCTTCC ACGCGCTGGG CATCGCCGGG ATGGTCGTGG CGGCGGCAAG CTTCCTCGTC 
ATCCGCGAAC CCGCGCGCGA GGCGGCCGAC AAGGCGGCGC CCGTCCTGCC GATGGGAACG 
ACGCTGCGGC TGCTCATCTC GACACCCTCG GTACGCTTCC TTGCCACCAT CATGGCGCTC 
GGCTCGCTTT CGGGCGTGAC CTTCGGGATG TGGGGCCCTG CCCTGTTCGA GCGCTCGTAC 
GGCCTGACCA CGCAAGAGGC GGGGACGACG TTCGCGCTGA CTTTCGGCCT GCCGGGATTG 
CTCGGCGTGC TGGGCTTCGG CTTTCTGGCC GACCGTCTTG GCAAGAACGA TCCGACCATG 
CAGCTTCGGC TTACGGCGTT CGCGCTGGGC GGGGCTACGA CGGCGATCCT TGCCGTTACC 
TGGACCGACA GCCTCCTGCT CGCCCGCCTG TTCGCCGTGC CGGCAGGACT GCTGGGCGGG 
GGATGGTCGG TCGGCGTTCT GGCGGGCCTG CAATATCTGC TGCCCAATGC CCATCGCGCC 
ACGGGCACCG CGCTGGTCCT GCTGATCGCC AGCATGTTCG CAACCGTTCT CGGCCCGGTC 
CTTGCCGGAC AGTTGAGCGA CTGGATCGCG GGCGCCGGCC CCCACGGGTT GCGCATCGGC 
CTCAGCGTCG CGATCCCGAC CGGATACGTC GGCGTCTGGG CCGCGTTCCG CACCGTTCAC 
GCGCTGAACC GCGACCGCGA GGCCCTGGCG CAAGCCTGA

Protein sequence

MATPASTAAF ATMTAGGKPL TNRWLALALL VLVAVLNYAD RFLISGLAEP IKAHFGIGDA 
MMGLLMGPAF ALLYAVFTLP IARLADRRSR ILIIAAGCGV WSFFTMLSGM AASANMLALA 
RVGVGIGEAA YQAPAAALIA AYFPPHERGR AFALLGTAIY VGQMTGLAGG PAIAATSDWQ 
TAFHALGIAG MVVAAASFLV IREPAREAAD KAAPVLPMGT TLRLLISTPS VRFLATIMAL 
GSLSGVTFGM WGPALFERSY GLTTQEAGTT FALTFGLPGL LGVLGFGFLA DRLGKNDPTM 
QLRLTAFALG GATTAILAVT WTDSLLLARL FAVPAGLLGG GWSVGVLAGL QYLLPNAHRA 
TGTALVLLIA SMFATVLGPV LAGQLSDWIA GAGPHGLRIG LSVAIPTGYV GVWAAFRTVH 
ALNRDREALA QA