Gene Saro_2338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2338
Symbol
ID	3915683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2485636
End bp	2487165
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	68%
IMG OID	640445094
Product	AMP-dependent synthetase and ligase
Protein accession	YP_497609
Protein GI	87200352
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01733] amino acid adenylation domain [TIGR03098] acyl-CoA ligase (AMP-forming), exosortase system type 1 associated

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGCCG AGCCCGATCC CACCGTCCAT CCGCTCGATC ATCTTGCCCT TCGCGGAGAG 
CGGGGGGCGC CTGCGCTCGT GCTCAGGAAC CACACCCTAA CCCACGAAGC GTTAAATGCT 
CGTGTAGGAC TGCTCGCGAA CTGGCTGCAA TCGCGCGTGC CGGAGCGCGG CGCGCGGGTG 
GCGACGTGGC TGCCGAAGTC GGAGCTGTCC TGCCTCATGC CGCTGGCGGC GGTCCGTGCT 
AGTCTTGTGC ACGTGCCGGT CAATCCGCTG CTCAAGCGCG GGCAGGTCGC GCATATCCTG 
GCCGACAGCG GCGCGGCGCT GCTCGTGTCG AACAAGGCGC GGCTGGATTC GCTGGAACCC 
GGCGACGCGT CGTGCCCACT GATCGAGGAG CCCGCCGCAT GGGCCGAGGC CGAAGCGCTT 
GGCGGGCAAT TGCCGCCATC GGACGCCGCG CCGGACAGCC TTGCCGCGAT CCTCTACACC 
AGCGGGTCGA CCGGAAGGCC CAAGGGCGTG ATGCTGAGCC AGGCGAACCT CTGGCTGGGG 
GCGGTCAGCG TGGCGCACTA TCTGCGGCTG TCGCCCGCAG ACCGGGTCCT TGCCGTCCTG 
CCGCTGGCGT TCGACTATGG CCAGAACCAG TTGCTCTCGA CCTGGTATGC GGGTGGCAGC 
GTGGTCCCGC TCGATTATCT GACGCCGCGC GACGTCGTGA AAGCCGTCGA GCGGCATGGG 
ATCACGACGA TTGCGGCAGT TCCGCCGCTG TGGCTGCAAC TTGCCGAACT GGACTGGCCT 
GAAGCTGCCC GCTCGCTGCG GCGCCTCACC AACAGCGGCG GCGCGCTGAC GCCGTCGCTG 
GTTCGCGCGC TGCGCACGCG CTTCCCCGAG GCGGACCTCT ACCCGATGTA CGGCCTGACC 
GAGGCGTTCC GCTCAACGTA TCTGGACCCC GCGCTCGTTG ACAGCCACCC GACATCGATC 
GGCAGGGCCA TTCCCTTTGC AGAAGTTAGT GTCGTCAATG ACTTGGGGGA TGAAGCTGAG 
GTCGAGGAAG AGGGTGAGCT AGTTCACGCC GGCCCTTTGG TGGCGCAAGG TTACTGGCAG 
GATGCGGAGC GTACCGCCGA GCGGTTCAGG CCTGCGCCCC CGTTCTCGAA GCTTGGCGGG 
ATGGCGGTCT GGTCGGGGGA TCGGGTCCGG CGCGATGCGG AAGGCCTGCT GCATTTCGTC 
GGGCGGCGCG ACGCCATGAT CAAGACCAGC GGCAACCGCG TGAGCCCGCA AGAGGTCGAG 
GAAGCCGCGG TGGCGACGGG CCTCGTCGCG GAGGCCGTGG CGCTGGGCCT GCCGGATCCG 
CACCTGGGCC ATGCGATCCA TCTCGTCGCT CGCGCTTCTG GCGACGTGGA GGCGGCACGG 
GCCGGACTGC TTCCGGCACT GACGCGCGCG TTGCCCAACT TCATGGTGCC GCGCCAGGTG 
CATTGGCGCC AGGTCATGCC GGTCAGCCCC AATGGCAAGC TCGACCGCGT TGCGCTGGCC 
GCCGAACTGG CGCAGGACGT GCAGGCATGA

Protein sequence

MTAEPDPTVH PLDHLALRGE RGAPALVLRN HTLTHEALNA RVGLLANWLQ SRVPERGARV 
ATWLPKSELS CLMPLAAVRA SLVHVPVNPL LKRGQVAHIL ADSGAALLVS NKARLDSLEP 
GDASCPLIEE PAAWAEAEAL GGQLPPSDAA PDSLAAILYT SGSTGRPKGV MLSQANLWLG 
AVSVAHYLRL SPADRVLAVL PLAFDYGQNQ LLSTWYAGGS VVPLDYLTPR DVVKAVERHG 
ITTIAAVPPL WLQLAELDWP EAARSLRRLT NSGGALTPSL VRALRTRFPE ADLYPMYGLT 
EAFRSTYLDP ALVDSHPTSI GRAIPFAEVS VVNDLGDEAE VEEEGELVHA GPLVAQGYWQ 
DAERTAERFR PAPPFSKLGG MAVWSGDRVR RDAEGLLHFV GRRDAMIKTS GNRVSPQEVE 
EAAVATGLVA EAVALGLPDP HLGHAIHLVA RASGDVEAAR AGLLPALTRA LPNFMVPRQV 
HWRQVMPVSP NGKLDRVALA AELAQDVQA