Gene Saro_0374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0374
Symbol
ID	3918258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	406050
End bp	407546
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	63%
IMG OID	640443103
Product	sulphate transporter
Protein accession	YP_495656
Protein GI	87198399
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCTCA ATTTCAATAA TTATCGCCGC CAGTGGTTCA CTGACGGGAG CACCGCCCGC 
CGGGACATTC TGGCGGGCAT CGTCGTCGCG CTTGCCCTTA TTCCCGAAGC GATCGGGTTT 
TCGATCATCG CCGGCGTGGA TCCCCGGGTC GGGCTTTACG CCTCAGTTGC CATCGCCATC 
ACGATCGCCC TGATCGGCGG GCGTCCCGGC ATGATTTCGG CTGCCACGGC GGCTGTTGCG 
GTTCTCGTGG TGCCCCTCGT CCGGGACCAC GGCGTCGAAT ACCTGTTTGC CGCAACGATC 
CTGATGGGTG TGATCCAGAT CGTCGCGGGG CTGCTGCGGC TCAACCTGGT GATGCAGTTC 
GTGTCCCGGT CGGTCATCAC CGGCTTCGTC AATGCGCTCG CCATCCTGAT CTTCATGGCG 
CAGCTGCCCC AACTCACCAA TGTCGGGTGG GAGACCTATG CCATGGTCGC CGCGGGCCTG 
GCGATCATCT ACCTGCTGCC CCGCATCACC ACTGCGGTGC CTTCGCCGCT CGTCGCGATC 
CTGGTGCTGA CGGCAGTCGC CATTGGCATG GGCATCGATG TGAACACGGT GGGCGACATG 
GGCAAGCTTC CCGAAGGTCT GCCAAGTCTT GCGCTGCCGC AGGTTCCCCT GACCCTGGAA 
ACGCTGCGCA TCATCCTGCC CTATTCGCTC ACCATGGCGG CCGTCGGCTT GCTGGAATCG 
CTGCTAACCG CTCAGATCGT CGATGACATG ACCGACACGG ACAGCGACAA GCGCCAGGAA 
TGTGCCGGGC AAGGCGGGGC CAATATCGTT GCTGCCCTGT TTGGCGGCAT GGGCGGATGC 
GCGATGATCG GCCAATCGGT GATCAACGTG ACTTCGGGCG GGCGCACGCG GCTTTCGACC 
TTCGTCGCCG GCGCGTTTCT GCTGTTCCTG CTCGCCGTGC TCGGGCCCTA TGTTGGCCGT 
GTGCCGATGC CGGCGCTGGT TGCGGTGATG ATCATGGTCT CGATCGGCAC CTTCAGCTGG 
AACTCGATTC CCAATCTGCG TCGCCATCCG CCGACTTCGT CGATCGTCAT GCTGACAACC 
GTGATCGTAG TAGTTGCCAC GCACGACCTT TCGCTGGGCG TGCTGGCCGG CGTCTTGCTC 
TCGGGCATCT TCTTTGCGGG CAAGGTCCAG CGCATGTTCA CGGTCGAACG CGAAGGTTCG 
GCCGATGGCG TGCTGGCGAC CTACCGCGTG ACGGGCGAAA TCTTCTTCGC CTCGGTCGAG 
CGCTTCACCC GGGTCTTCCA GGCGGAAGAC CAGGCAGAGC GCGTGGTCAT CGATGTGACG 
AGGGCGCATT TCTGGGACAT TTCCGGCGTC GGCGCGCTCG ACAAGGTCGT CGCCCGGCTG 
CGCCGCGACG GACGGCAGGT TGAAGTCATC GGCTACAACC AGGCCAGCGC CGACATCATC 
GACCGCTTTG CCTTGCACGA CAAGACCGGC GTCGAACTGG GCGTGGTGCC GCATTAA

Protein sequence

MSLNFNNYRR QWFTDGSTAR RDILAGIVVA LALIPEAIGF SIIAGVDPRV GLYASVAIAI 
TIALIGGRPG MISAATAAVA VLVVPLVRDH GVEYLFAATI LMGVIQIVAG LLRLNLVMQF 
VSRSVITGFV NALAILIFMA QLPQLTNVGW ETYAMVAAGL AIIYLLPRIT TAVPSPLVAI 
LVLTAVAIGM GIDVNTVGDM GKLPEGLPSL ALPQVPLTLE TLRIILPYSL TMAAVGLLES 
LLTAQIVDDM TDTDSDKRQE CAGQGGANIV AALFGGMGGC AMIGQSVINV TSGGRTRLST 
FVAGAFLLFL LAVLGPYVGR VPMPALVAVM IMVSIGTFSW NSIPNLRRHP PTSSIVMLTT 
VIVVVATHDL SLGVLAGVLL SGIFFAGKVQ RMFTVEREGS ADGVLATYRV TGEIFFASVE 
RFTRVFQAED QAERVVIDVT RAHFWDISGV GALDKVVARL RRDGRQVEVI GYNQASADII 
DRFALHDKTG VELGVVPH