Gene Sare_0357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0357
Symbol
ID	5703851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	403718
End bp	405190
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	69%
IMG OID	641269883
Product	amino acid adenylation domain-containing protein
Protein accession	YP_001535278
Protein GI	159036025
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1020] Non-ribosomal peptide synthetase modules and related proteins
TIGRFAM ID	[TIGR01733] amino acid adenylation domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.355127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.469317
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTCGT TTCTCGACGA ACTGGTGGCC CACGGTCGAC GCCGGCCCGG CGCCCCCGCG 
ATCGTGACAC CCGACACCGT CATCACCTAT GGCGACCTCG TGTCCCGCAT CGACCGACTG 
GCCAGGGTGC TGGTCGCCCG CGGCATCGGC CCGGAGCAGG TATGTGCGGT CGCGGTGGAA 
CGTGGACCAC AGGCCGTGGT CGCGATGGCG GCTGTGCTGC GGGCCGGTGC GGCCTTTCTC 
ACCCTTGACG TCGAGCTGCC CGGCCCCCGG CTGGAGACCA TGGTCCGCAG TGGGCAGGCT 
CGGTGCCTGG TCACCACATC GGCCCTGGCC GGGCAGCTCG GCTTTGCTTT CGACGGCCTC 
CGGGTGCACA CCGATGAACC AGCTCCGGCT GGTGCGGTCA GCTTGCCACC CATCGCCGCT 
CGATCGCTCG CCTACGTCAG CCACACCTCC GGTTCGACCG GTACGCCCAA TGCGGTGCTG 
GTCGAGCACC GTGGGCTGAA CAACTATCTG AGGTGCGTCG TACGCGACTA TGACCTCGGA 
GCGGACACCG TCGTCCTGCA ACTCGCCCCG CTCGGCTACG ACGCCTCGAT CCGCGACACG 
TTTGCTCCGC TCGTGGCCGG CGGTCGGCTG GTGCTGGTTC CCCGCTCGAC GCTCCTGCGC 
GCCGACGAGT TCATCGCGGC CGTACGCCGG TTCGACGTGG ACACCATCCT CAGCGCCACT 
CCTACCTTTC TCACCTTCGT GTCTGCCCAT GACCTACCGC CGCTACGGTT GACGGTCTCC 
AGCGGTGAAT CGCTACGGCC GTTCCTCACC GCCGGTGGTC GGGCGCGGTT GCCTGGCCGG 
TTGGTCAACC AGTATGGCCC GACCGAGGCC ACGATGACCT CGACTCGTTT CGTGGTGCCC 
CCCGATCCGG ACACGACGGT AGACCTCGTC GGCGCACCGA TCGAGGGAGT GACCATTCAC 
GTGCTCGACG ACGACCTGGC GCCGGTGCCG GATGGTGCCG TGGGTCAGGT GTGGATCGGC 
GGGATCGGTG TCACCCGGGG CTACGGCGGC CGCCCGGATC TCACCGCCGA GAGGTTCGTG 
CCCGATCCGC TCGGTGGTCC TGGCGAACGC ATGTACCGTA CCGGGGATCT GGCCCGCAGC 
CGTGACGGCA TCCTCGAGTA CCTGGGCCGG GCCGACCGTC AAATCAAGAT CCGCGGCTAC 
CGAGTGGATC CGGCCGAGAT TGAGGGTGCG CTGCTCAGCC ACCCGGCTGT GGCCGGCGCA 
GCGGTCAGTA CGGCTACCGA CGACCGTGGC CGGGTCTTCC TGATCGCGCA CGTCGCCGGC 
GAACTGGCCG AGGTGACCGA CGCGGCGCTG CGGCACCATC TGGCGGCGAC GCTGCCGCCT 
TACATGATGC CCCGCAGGTT CGCCCGGATC GCACGCGTAC CGACCACGAC CAGCGGTAAG 
GCCGACCGCC GTGCGCTGAC CGTGGGACTG TGA

Protein sequence

MTSFLDELVA HGRRRPGAPA IVTPDTVITY GDLVSRIDRL ARVLVARGIG PEQVCAVAVE 
RGPQAVVAMA AVLRAGAAFL TLDVELPGPR LETMVRSGQA RCLVTTSALA GQLGFAFDGL 
RVHTDEPAPA GAVSLPPIAA RSLAYVSHTS GSTGTPNAVL VEHRGLNNYL RCVVRDYDLG 
ADTVVLQLAP LGYDASIRDT FAPLVAGGRL VLVPRSTLLR ADEFIAAVRR FDVDTILSAT 
PTFLTFVSAH DLPPLRLTVS SGESLRPFLT AGGRARLPGR LVNQYGPTEA TMTSTRFVVP 
PDPDTTVDLV GAPIEGVTIH VLDDDLAPVP DGAVGQVWIG GIGVTRGYGG RPDLTAERFV 
PDPLGGPGER MYRTGDLARS RDGILEYLGR ADRQIKIRGY RVDPAEIEGA LLSHPAVAGA 
AVSTATDDRG RVFLIAHVAG ELAEVTDAAL RHHLAATLPP YMMPRRFARI ARVPTTTSGK 
ADRRALTVGL