Gene Saro_3501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3501
Symbol
ID	5077650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	107072
End bp	108991
Gene Length	1920 bp
Protein Length	639 aa
Translation table	11
GC content	70%
IMG OID	640481225
Product	fusaric acid resistance protein region
Protein accession	YP_001165887
Protein GI	146275727
COG category	[S] Function unknown
COG ID	[COG1289] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCGG CGCGCCGGTT CGCGCTGGCC TATTCAGCCA AGACAGCGGC GGCGGCGCTG 
CTGGCGCTTT GGATCAGCCT GTGGGTCGGC CTGTCGATGC CGTTCTGGGC GATGACCACG 
GCCTATATCG TCAGCAGCCC CATGTCCGGC GCGACGCGCT CCAAGGCGGT CTACCGGGTG 
GGTGGTACGG TGCTGGGCGC GGCGGTGGCG GTGGCGCTCG TTCCTGCGCT GGTCGACTGG 
CCCGAATTGT TGAGCCTTGC AATCGCACTA TGGCTGGGCG GTTGCCTGGC CGTCGCGCTG 
CTTGACCGCT CGCCGCGTGC CTATGTGGTG ATGCTGGCAG GGTATACCGC AGCGCTTGTC 
GCTTTCCCGG CGGTCGACCG GCCGGATGCG GTGTTTTCCA TCGCCGTCGC GCGCGTGACC 
GAGATCGCGC TCGGCATCGG ATGCAGCACG GTCGTCCACA GCCTGTTCTG GCCCCGCTCG 
GTCGCAGAGG CGATGCAGCC ACGCCTGCGC GCGTGGCTTG CCGATGCGCG GCAATGGCAC 
GGCGATATCG TCGGCGGCAG CGACAATGCC AGGTTGCTTA CGGACAAACG CAGGCTTGCC 
GTCGACGCCA TGGACTGTGC GCTGCTGGCG ACGCATGTGC CGTTCGACAC CTCGCACTGG 
CGCGAGGCGA CGGCGACCTT GCAGGCCCTG TTGCGCCGGA TGCTGCTGCT GTTGCCGGTG 
CTGTCGGGCC TTGCGGATCG CAAGGCGGCG CTGGACGGTG AAGGCGACGA GGGCAGGGAT 
GGGGCGACCT GGGCCATGCT CCTCCGGGAA AGCCTTGCCC AGCGCGATGG CGAGGCGCGC 
ACGCTGCTCG GCGAATGCGA TGCACTGCTG GCGCATCTGG CGGACCCGGC ATCGCCGCGC 
CCCGACCTGC CGGATTGGCG CGAGGGCGCG GTCAGGTTTC ACGCCGAGCC CGCGGGCGCG 
ATCCTGTCCG GCGCATCTGC GCTGGTGGCA ACGCTTGCGG CCTGCGCCCT ATGGATCTTT 
ACCGGGTGGG CGGACGGCGG CGTCGCGGCG GTGCTGACCG GCATCTTCTG CTGCCTGTTC 
GCCGCGCAGG ATAACCCGGT GCCCGCCATC CTCTCGTTCG GCGGGGCCAT CGTGGCGGGC 
ATTCCGATTG CGGCGCTGTA CCTCTTCTTC GTTCTGCCGG GCGTGGACGG GTTCGCGGCG 
CTGGCGCTCC TGCTGGCAAT ACCGCTCGTC GCCATCGGCG CGTTGATGAC GCACCCCCGC 
CTTGGCCTGC CGGCGATGGC GTGCCTTGTC GGCTTCTGCA GCGCGATGGC GATACAGGAG 
GAATACGTCG CCGATTTCGC GCGCTTCCTC AATTCCAACC TCGCGCAGAT CGTGGCGGTG 
ATCCTTGCCG CCGGGACCAC GGCATGCTTC CGGATGGCTG GCGGCGACGT TGCCATCGCG 
CGGCTGAACC GGCGCATGCA GCGGGGGCTG GTGGACATTG CCCGCGCCCC TTCCGCACCC 
GATCCGCTGG CGACGCTGAG CCGCGTGACC GACCAGCTCG CGCTTATCGC CCAGAGGCTG 
GGCGGGGCGA CCGACGCCGC GTCGATGGGG CTTGGCGAAG TGCGCCTCGC GATGAATCTC 
GTCTCGATCC AGAGGCTGCG GGCGTCGTCT TCGGGGCCGC TGCGCGCCGC GCTCGACGAT 
GTGCTGGAAG AAGCGGCGCA CTGGTTCGCC GCGCCGCCCA CGGCCGAGGG ACCGTCGCGG 
CGGATGCTGG ACCGGCTTGA CGGTGCGTTG CGCCTGACGC TGGCCAATCC GCCACCGCGC 
CCGGGCGGGC TGGAACACCT GTTCCGCCCA GGCCCCGACC AGGGCCGCCC CGCGCTCGTC 
GCCCTGCGGC GCAGCCTCTT CTCCCGGGCC GAGCCGTTTT CAGCAGGAGC CTCCGCATGA

Protein sequence

MTAARRFALA YSAKTAAAAL LALWISLWVG LSMPFWAMTT AYIVSSPMSG ATRSKAVYRV 
GGTVLGAAVA VALVPALVDW PELLSLAIAL WLGGCLAVAL LDRSPRAYVV MLAGYTAALV 
AFPAVDRPDA VFSIAVARVT EIALGIGCST VVHSLFWPRS VAEAMQPRLR AWLADARQWH 
GDIVGGSDNA RLLTDKRRLA VDAMDCALLA THVPFDTSHW REATATLQAL LRRMLLLLPV 
LSGLADRKAA LDGEGDEGRD GATWAMLLRE SLAQRDGEAR TLLGECDALL AHLADPASPR 
PDLPDWREGA VRFHAEPAGA ILSGASALVA TLAACALWIF TGWADGGVAA VLTGIFCCLF 
AAQDNPVPAI LSFGGAIVAG IPIAALYLFF VLPGVDGFAA LALLLAIPLV AIGALMTHPR 
LGLPAMACLV GFCSAMAIQE EYVADFARFL NSNLAQIVAV ILAAGTTACF RMAGGDVAIA 
RLNRRMQRGL VDIARAPSAP DPLATLSRVT DQLALIAQRL GGATDAASMG LGEVRLAMNL 
VSIQRLRASS SGPLRAALDD VLEEAAHWFA APPTAEGPSR RMLDRLDGAL RLTLANPPPR 
PGGLEHLFRP GPDQGRPALV ALRRSLFSRA EPFSAGASA