Gene Saro_3489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3489
Symbol
ID	5077638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	91970
End bp	93592
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	66%
IMG OID	640481213
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001165875
Protein GI	146275715
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAGA ACACTTCGAA GCCCTGGGAC TGGCTGCCGA TTCCCGCCCC TCACCAGCAG 
GCCTTCGCGC AACGCGGGGC CTGGAACCTG CGGACGCTGG CAGACCTCGC GCGCGAACGG 
GCGGCGTCAG ATCCCGATTT CGTCTGCTTC GTCGATGGCG AAGGCCAATA TACCTTCGCG 
CAGGTCCTGG CAGAAGCGGA AGCGCTTTCC GCGTCGTTGC ACGCGCGTGG GTTTCGCGCC 
GGCGATGTCA TCGCATTCCA GGTGCCGAAC TGGCGCGAGG CCGCCGTCAT CAACCTGTCG 
GCGGCGATGT CTGGCTTCGT GGTCAATCCG ATCGTGCCGA TCTATCGCGA TGCCGAAGTC 
ACGATGATGC TTGGCGATTG CCGGGCCGCC GCGATCTTCG TGCCGCAGGT GTTCCGCAAG 
GTCGACTACG CCGAAATGGC GCGTCGCTGC CAGAAGGCGC TGCCCGATCT TGCGCACGTC 
TTCACCGTGC GGGGCGAGGG GCCGGACGAT TTCGCCACTC TCGTCGCACA GGGGCGCGCT 
CTTTCCTTCG AAGTGCCAAC GGTCGATCCG ATGGGCGTCA AGATGGTGCT CTATACCTCG 
GGCACGACCG GTCGGCCCAA GGGCGTCCTG CACAGCCATT GCACGTTGCA GCGCATCGTC 
GCGGAAAGCG GGCGGCACTG GGGCCTCGGG GCAGGGGAGG CGACGCTGAT GCCTTCGCCG 
GTCACGCACG TCTCGGGATA TGCCAATGGC CTCGAAGCGC CGTTCATCTG CGGCATCCGC 
TCGGTTCTCA TGGAAGCGTG GAACGCCCAG GATGCGCTGG CCCTGATCGA GAAGCACGAC 
CTTGTCGGCA CGGTTGCTGC AACGCCCTTC CTGGTCGAAC TTGCGGCAGC GGCGCGAGCG 
GCGGGCACCG GCCTGCCAAG CTTCCGCTTC TTCGCCTGCG GCGGTGCGGC GGTGCCGGCG 
GACCTTATCC CGGCCGCCAA CGCCGCCTTC GAGAACTGCC GGGCCTTTCG CGTCTTCGGC 
GCGTCCGAAG TTCCGCTCGT TACCTTCGGC TGGCCGCACG ACGAGCGCCT TGCCGCGACC 
ACCGATGGCG AGGTGGTGGA CTACGAAGTC CGCATCGTCG ACCACGAGGA CAATGATCTT 
CCGCGCGGTG TCGAAGGCGA AATCCTTGCG CGCGGTCCCG GCATGATGAT GGGCTATGCC 
GACGCCGCGC AGACCGCAGA GGCGATCACG CCCGACGGCT TCTTCCGCAC CGGCGACCTG 
GGCGTGCTGT CCGAAGAGGG TGCGGTAACG ATCACCGGGC GCAAGAAGGA CCTCATCATC 
CGCGGCGGAG AGAACATCTC GGCCAAGGAA ATCGAGGACG TGCTGCACAG CCATGACGCG 
GTGAAGGAAG CCTCGGTCGT CGCCATGCCG CACGAACGCC TTGGCGAGGG CATCTGCGCC 
TATGTGATCC TGTCCGCCGC AGTCGACGCG GCGGTGCTTG CCGCGCATGT TGCCGCTTCG 
GGCATGGCGA AGCAGAAGAT CCCCGAACGC TTCGAATTCG TAGAGGACTT TCCCCGCACC 
GCTAGCGGCA AGGTCCGCAA GGACCAGCTG CGGGCGATGA TCCGGGAGAA AGTGGGGGGC 
TGA

Protein sequence

MNENTSKPWD WLPIPAPHQQ AFAQRGAWNL RTLADLARER AASDPDFVCF VDGEGQYTFA 
QVLAEAEALS ASLHARGFRA GDVIAFQVPN WREAAVINLS AAMSGFVVNP IVPIYRDAEV 
TMMLGDCRAA AIFVPQVFRK VDYAEMARRC QKALPDLAHV FTVRGEGPDD FATLVAQGRA 
LSFEVPTVDP MGVKMVLYTS GTTGRPKGVL HSHCTLQRIV AESGRHWGLG AGEATLMPSP 
VTHVSGYANG LEAPFICGIR SVLMEAWNAQ DALALIEKHD LVGTVAATPF LVELAAAARA 
AGTGLPSFRF FACGGAAVPA DLIPAANAAF ENCRAFRVFG ASEVPLVTFG WPHDERLAAT 
TDGEVVDYEV RIVDHEDNDL PRGVEGEILA RGPGMMMGYA DAAQTAEAIT PDGFFRTGDL 
GVLSEEGAVT ITGRKKDLII RGGENISAKE IEDVLHSHDA VKEASVVAMP HERLGEGICA 
YVILSAAVDA AVLAAHVAAS GMAKQKIPER FEFVEDFPRT ASGKVRKDQL RAMIREKVGG