Gene Sare_3059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3059
Symbol
ID	5706940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3466553
End bp	3468028
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	68%
IMG OID	641272501
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001537869
Protein GI	159038616
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000983491
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCTTGC ACGAACTCAT CGACACCGCC GCGCGGCGGT GGCCGGAGCG GACCGCCGTG 
TCCACCCGGA CCGATGCGCT GACCCACGCT GAACTCGCCG CCGCCAGCCG CCGAGTCGCT 
GCCTGGCTGC ACAACCAGGG CCTACGACGC GGTCAGCGAG TGGTCGTCGT CGAATCGACT 
GACGTGGTCG TTGCAGTGGT CATCACCGCG GTCTCCCGCG TCGGCGCGGT CTTTTCCGTG 
CTGCACCAAG ACACCCGCGG CAGCGCCCTT ACCCATGTGC TCGATGACGC CGAGCCGTCT 
TTGCTGGTCG CCGCCGACGA CGACGCGCAG CGCTGCGCCG AGAAGCGCGG CCTGCCCGTG 
GTCTCTCCCG GTCAGCTGCG GGGCGTCGTG TCGACTCCCA CCGACGGCGC GAAACTAGGG 
CAGGTGCTGA CCGTGGACCC CATCTGCCTC ATCTACACCT CCGGGACCAC GGATCGGCCA 
AAGGCGGTGG TTACCACGCA CCAGCAGATG CTGTTTGCCG TCGATGCCAT CCAGTCCAGG 
CTGAACTACC AGCCCGACGA TGTCGTGTAC TGCCCGCTGC CGTTGTCTTT CGACTACGGC 
ATGTACCAGT TGTTCCTCGC AGCGGCGAGC GGCGCGCACG TCTACCTTGG CCAACCGGCC 
GAGGTCGGCC CGGGCCTGCT GGGCAACATC GTGCGCAGCG GTGCTACCGT CCTCGCTGCC 
GTACCCGCGG TTGCTGACAC CCTCGCCCGG CTGTTGCGTC GCGGGCCCGC GCACCTGCCG 
CAGTTGCGGC TGCTCACCAA CACCGGCGCC GCGATGTCGC CGGAGACCCT GCGCGCTCTG 
CGCGCCGCGT TGCCCGGCCT GCGTGTACAA CTCATGTTTG GTCTCACCGA GTGCAAGCGG 
GCTGCGATCA TGCCGCCAGA CGGAGACCTG GACCGACCTG GGGCGTCAGG CTTGGCCCTA 
CCGGGCACTG AAGTCTTTGC CGTCGACGCA GAGGGCACCC GGTTGGGTCC GCGCCAAATC 
GGTCAGCTGG TGGTGCGCGG GCCGAACGTC ATGGCGGGTT ACTGGCGCCG TCTCGAGCTG 
ACCGCCCAGC GGTTCCACCG CCGCGACGGA CTGTTCCCGG AGCTGTGCAC CGGTGACCAC 
GGCTGGCTCG ATGAAGACGG GTATGTCTAC TTCGTCGGAC GCCTCGACGA CATCTACAAG 
GAGCGCGGCT TCCGGGTCAG CGTCACGGAG GTCGAAGCAG CAGCGCGGCG GGTTCCCGAG 
GTGGAGCTTG CTGCCGTCGT GCCTCCGCTG GATGGTGAAC CCTCCGCGCT GGCGGTCGTC 
ACCGACCTCA CCCCCGACGA GGTGCTGTTG CGGATACGCG AGGAAATTGA GGAGTTCAAG 
GTGCCTCGGC GCTGCGTGGT CGTTGACCGC CTCCCATTGA ACGGCAATGG CAAGGTCGAC 
CGTAAGGCAC TCCAGTTGGC GGTGACCGGT GACTGA

Protein sequence

MLLHELIDTA ARRWPERTAV STRTDALTHA ELAAASRRVA AWLHNQGLRR GQRVVVVEST 
DVVVAVVITA VSRVGAVFSV LHQDTRGSAL THVLDDAEPS LLVAADDDAQ RCAEKRGLPV 
VSPGQLRGVV STPTDGAKLG QVLTVDPICL IYTSGTTDRP KAVVTTHQQM LFAVDAIQSR 
LNYQPDDVVY CPLPLSFDYG MYQLFLAAAS GAHVYLGQPA EVGPGLLGNI VRSGATVLAA 
VPAVADTLAR LLRRGPAHLP QLRLLTNTGA AMSPETLRAL RAALPGLRVQ LMFGLTECKR 
AAIMPPDGDL DRPGASGLAL PGTEVFAVDA EGTRLGPRQI GQLVVRGPNV MAGYWRRLEL 
TAQRFHRRDG LFPELCTGDH GWLDEDGYVY FVGRLDDIYK ERGFRVSVTE VEAAARRVPE 
VELAAVVPPL DGEPSALAVV TDLTPDEVLL RIREEIEEFK VPRRCVVVDR LPLNGNGKVD 
RKALQLAVTG D