Gene Sare_4358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4358
Symbol
ID	5706439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4924087
End bp	4925736
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	70%
IMG OID	641273780
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_001539130
Protein GI	159039877
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.124731
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAGCA CGATGATGGA CGCCCCCCTC CAGGTATCCC GGATCCTTGG CCACGGCTCC 
ACCGTGCACA GCACGGCCGA GGTGGTCACC TGGACCGGTG CCGAGCCCCG CCGGATGACC 
TACGCCGACG TGGGGCGCTT GTCCGCCCAG TTGGCGCATG CGCTGCGCGA CGAGTGCGGC 
GTTACCGGTG ACGAGCGGGT CGCCACCTTC CTGTGGAACA ACACCGAGCA TCTGGTGGCG 
TACTTCGCGG TGCCGAGCAT GGGCGCGGTG CTGCACACAC TCAACATCCG GCTCCTCCCG 
GACCAGGTGG CATACATCGC CAACCACGCC GAGGACCGGG TGATGCTGGT CGACACGACA 
CTGATCCCCC TGCTGGCGAA GGCCATCGGC GACATGACCA CCGTCCGGCA CGTGGTGGTC 
GTCGGCAACG GTGACCCCGC CCCGCTGGTC GCGGCGGCCG GTGACCGGAT CTCCGTGCAT 
CACTGGGACA CCCTGCTGGC CGGTAGACCG GACACCTACG ACTGGCCGGA CGTGGACGAA 
CGGTCCGCCG CCGCGCTCTG CTACACGTCC GGCACCACCG GTAACCCCAA GGGGGTGGCC 
TACTCGCACC GCTCGATCTA CCTGCACTCG CTTCAGGTCT GTATGCCGGA GTCGTTCAGT 
CTCGGGCCGC GGGACCGGGT GTTGGCGATC GTGCCGATGT TCCATGCCAT GTCCTGGGGC 
CTGCCCTACG CGGCATTCCT CTCCGGCGGA TCGCTGGTCC TGCCGGACCG GTTCCTCCAG 
GCCGCCCCGA TCGCCGAGAT GATCGCCGCC GAGCGACCCA CCGTCGCCGG TGCCGTCCCC 
ACCATCTGGA CCGATCTGCT CGCGCACCTG GACAGCCACG ACGTCGACAC CGCCTCCCTG 
GGGGAGGTGA TCGTCGGCGG GTCGGCCTGT CCGCCGGCAC TGATGCACGC GTTCGAGGAG 
CGGCACAACA TCCGGATCAT CCACGCGTGG GGCATGACCG AGACCTCTCC GCTCGGTTCG 
GTGGCCCGCC CGCCGGTCGG CGTCGACCGC GAGCAGGCGT GGCGGTACCG CTACACGCAG 
GGGCGCGTCC CCGCCGGGGT GGAGGCTCGG ATCGTCGGCC CGGAGGGCGT GCCGCTGGCC 
GCCGACGGGA CGTCCGTGGG TGAGCTGGAG GTCCGTGGGC CCTGGGTGAC CGGGCGGTAC 
GTCGGCGACG AGGCCCCGGA CGAGGACACG TTCCGGGACG GCTGGCTACG TACGGGTGAT 
GTCGGCACCC TCTCCCCGGA CGGCTACCTG ACGCTGACCG ACCGCGCCAA GGATGTGATC 
AAGTCCGGCG GGGAGTGGAT CTCGTCGGTG GAGTTGGAGA ATGCCCTGAT GGCACACCCG 
GACGTGGTCG AAGCCTGCGT GGTCGGCGTA CCGGACCAGC GTTGGGGCGA GCGGCCACTG 
GCCACTGTGG TGCTCCGGGA GGGCGCGACG GTGGGAGCCG AGCAACTGCG GGAATTCCTC 
GCCGGTTCGG TGGCCCGCTG GCAGCTGCCC GAGCGCTGGG CGGTCATCGA CGCCGTGCCG 
AGGACCAGCG TGGGCAAGTT CGACAAGAAG GCGGTCCGGT CCCGGTACGC GGAGGGGGAA 
CTTGCCGTTC GAGAGCTGAC CGCCCCTTAG

Protein sequence

MRSTMMDAPL QVSRILGHGS TVHSTAEVVT WTGAEPRRMT YADVGRLSAQ LAHALRDECG 
VTGDERVATF LWNNTEHLVA YFAVPSMGAV LHTLNIRLLP DQVAYIANHA EDRVMLVDTT 
LIPLLAKAIG DMTTVRHVVV VGNGDPAPLV AAAGDRISVH HWDTLLAGRP DTYDWPDVDE 
RSAAALCYTS GTTGNPKGVA YSHRSIYLHS LQVCMPESFS LGPRDRVLAI VPMFHAMSWG 
LPYAAFLSGG SLVLPDRFLQ AAPIAEMIAA ERPTVAGAVP TIWTDLLAHL DSHDVDTASL 
GEVIVGGSAC PPALMHAFEE RHNIRIIHAW GMTETSPLGS VARPPVGVDR EQAWRYRYTQ 
GRVPAGVEAR IVGPEGVPLA ADGTSVGELE VRGPWVTGRY VGDEAPDEDT FRDGWLRTGD 
VGTLSPDGYL TLTDRAKDVI KSGGEWISSV ELENALMAHP DVVEACVVGV PDQRWGERPL 
ATVVLREGAT VGAEQLREFL AGSVARWQLP ERWAVIDAVP RTSVGKFDKK AVRSRYAEGE 
LAVRELTAP