Gene Saro_0160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0160
Symbol
ID	3918691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	156827
End bp	158104
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	66%
IMG OID	640442885
Product	general substrate transporter
Protein accession	YP_495443
Protein GI	87198186
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAACCGA CATCATCCGA GCCGCGCCAC TTGCCCACGA AGCGGCAATT CGCGGCAGTC 
ATTTCCGGCA ATGCACTGGA ATTCTATGAT TTTCTGAGCT TCAGCTTCTT CGCGGTAAAT 
CTGTCGCGGG TCATGTTTCC GGCAGGGGCG CCGGGCAGTG CGCTGCTGCT GACGCTCATG 
ACCGCGGGCG CGGGCTTCGG CGCGCGGCCC TTGGGGGCGA TCCTGTTCGG AGTGCTGGGC 
GACCGGATCG GACGCCGCCC GACCATGCTG GCGACTTTCG CGCTGATGGG GGTGAGCGCG 
CTCGGGCTCG CCCTGACGCC GGATTACGCG GCGATCGGAC CGGCAGCGCC GATCCTCGTC 
GTTCTGTTCC GTCTTCTGCA GGGCCTTGCC GCCGGTGGCG ACGTGGGGCC GACGACAGCG 
TTCCTCGCCG AAAGCGCGCC GTCCGAAAGA CGCGGGATGC TGATCGCGCT GCAGCTTGTC 
GCGATGCGCA TGGGAGTTCT GGCGAGCGGA CTGGTGGGGC TGGTCCTGGC GAGTGTCCTG 
ACGCCAGCGC AGCTCGACAG TTTCGGCTGG CGCATCGCCT TTGCCATCGG TGCGGGTATC 
GTGCCGTTGG CTTTCATCCT GCGCCGCAGG CTCGACGAGA CGCTTCATAT GCCGGAAACC 
GGTCCTGACG TGGTGACCGA ATTGGCCCCG CGCGCCTACG CGGCGGCGCT CTTGGGGGTA 
TGCGGCTTCC TGTTGGCAGG TGCGGCGGGG GATTTCCTGT TCATCTACGC AGTGTCGTTC 
CTGAAGATCG CGGTGACCAA CGGTTACATC GTGCAGATGG CGGCGGCGGG AACGCAGATC 
GTCGGGCTGG TGCTTGGTGG ATGGCTCGGG GACCGCATCG GGCGACGGCG GGTGAATCTC 
GTCACAGCAA TACTGGCGGC GCTGACTTCG TTGCCGCTGT TCCGCTGGGG CATCGAGGGA 
AGCGCACCGG CTCGGTTCGG CGTGGCGGCG GCCCTTCTCC TGCTCATGGC GACGGTTTCG 
GCTGCGGTTG CCTATGCCGC GTTCGTCGAG ACGACGCCCA AGCGGCATCG TGCGGGGCTT 
GTCGGCATCG GTTATGGCGT GATGGTCGCG CTGACCTTTG GCCTGACACC AGTGGTATTG 
ACCCGGTACA TGACCGCGAC CGGCGACCTC GCGGCACCCG GCTATGCCTT CGTGGTCGCC 
GCGCTTTTGC TGGTGGCCTC TGCGCTGCTT CTGCCCGAGC GGAGACCCCG GCACATCGGG 
AAGGTTCGTT TCACCTGA

Protein sequence

MEPTSSEPRH LPTKRQFAAV ISGNALEFYD FLSFSFFAVN LSRVMFPAGA PGSALLLTLM 
TAGAGFGARP LGAILFGVLG DRIGRRPTML ATFALMGVSA LGLALTPDYA AIGPAAPILV 
VLFRLLQGLA AGGDVGPTTA FLAESAPSER RGMLIALQLV AMRMGVLASG LVGLVLASVL 
TPAQLDSFGW RIAFAIGAGI VPLAFILRRR LDETLHMPET GPDVVTELAP RAYAAALLGV 
CGFLLAGAAG DFLFIYAVSF LKIAVTNGYI VQMAAAGTQI VGLVLGGWLG DRIGRRRVNL 
VTAILAALTS LPLFRWGIEG SAPARFGVAA ALLLLMATVS AAVAYAAFVE TTPKRHRAGL 
VGIGYGVMVA LTFGLTPVVL TRYMTATGDL AAPGYAFVVA ALLLVASALL LPERRPRHIG 
KVRFT