Gene Sare_2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2079
Symbol
ID	5706799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2390083
End bp	2392095
Gene Length	2013 bp
Protein Length	670 aa
Translation table	11
GC content	70%
IMG OID	641271565
Product	condensation domain-containing protein
Protein accession	YP_001536936
Protein GI	159037683
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1020] Non-ribosomal peptide synthetase modules and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.262269
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCGACC CCGCCGATAC CACCAGTCCG ACCGCACTCG TCGATGCCGT GCGCGGTGTC 
TGGGCCGATG TCCTGGACGT CGACGTGACC GCCGTTCCGG GCGATGCCAG CTTCCTCAGC 
CTCGGTGGCG ATTCCGTCCT GACCGTCCGG ATGGCGGCGC TGGTCCGACA ACGGCTCGGG 
GTGGCCCTGG CCCTGGCCGA CGTTCGCGTC GAACACAGTC CGGCCCAGTT GGCCGCCCTC 
ATCCAGGAGC GCGGTACCGC CACGGGTGGC GTGCGCGCGC TACCGCTGGA CCTCAAGCGA 
CGGGACGACC CGGAAGCCCC GTTCCCGCTT CTTCCGCTGC AACAGGGCTA CTTCGTCGGC 
CAGCAGGATG GATGGGAGCT CTCCTACCGG TCGGCCCACC ACTACGTGGA CATCGGCCTG 
GAGGACATCG AAACAGACGA GATCGCTGAG GCGTTGCAGG ACGCGCTGGA GCGGCTCGCC 
GAGCACCAGG CGGTGCTGCG CGCGCGGATC CTGCCCGACG GACGGCAGCG GATCCTGCCC 
CTGGACGATC CGGAGGCGAT CCCGGTGCTG CGGGTGACCG ACCTCAGCAC GGCTAGCGCG 
GACGAGATCG CCGAAAGGCT GGCCGCCATC CGTCGCGAGA TGAGCACCGA CGGCCCCGAC 
CCGACCCGAG GATGCGGTCT GGACATGCGG CTGACCCTGC TTCCGGGGGC CAAGGCGCGG 
CTGCACTCCT CGACCAGCCT GATGATCGTC GACGGCTGGT CGTCGGGAGT CTTCTACCGC 
GACCTGTTTG CCCTGGTCAC CGATCAAAAC GCGATGCTCA CACCGCTGGA CGTCGACTTC 
GGTGACTACG CCGTGACCCT GGACGGGCTG TCCGAGACCG AGTCGTGGCG GGCCGACCGT 
GACTGGTGGT GGAATCGCCT CGACAGCCTT CCGCTTCCCC CGGCCCTGCC GCTGATCGCC 
GACCCGGCCG ACGTCCGACC GGCCCTGATG GGTGCGCGGC AGGCGGTCCT GGACGCGGAC 
CGTTGGGCAG CCCTACGGGA ACACTGCAGT CGACATGGCG TCACCCCGTC CGCGGCCATG 
TTCGCCGTCT TCTCCACCGC GCTGGCCCGT GCCTGCGGAC ACCGCAGATT CCTGCTCAAC 
ACCCTGCAGC TGAACCGCCT CCCGCTGCAC CCGGATGTGC CCCGGCTGGT CGGTGCCTTC 
TCCTCCACCA TGCTCGTACC GGTGGAGCTG CCCCAGACGG CGACCTTCTC CGACCTCGCG 
GTCCGCGCGC AGCGTGACAT CGGGGAGGCC ATGGCGCACA ACCTGGTGAC CGGGGTGGAG 
GTCTCCCGCG AACTCGGACG GCGCCGTGAC ACCCGACGGC CGGTGGCTCC GGTGGTCTTC 
CAGAGCACGT TGGGGGTCGA CGCCGCGCTC GGTAGCGAGG TGCCCCGAGC CGCCGGACCG 
TTGGGCTCGA TCGACCTGTC CAGCCACTAC CAGCAGCTAC GGACGCCGCA GGTGGCGCTC 
GAGGTTCGGC TGTTCGAGCT ACGCAACGAG CTGGTGGTCG TGTTCTCCCT GGTAGAGGAA 
ATCTTCGACG CCTCGTACGT GGACCGGATG TTCGGGGAAG TCATGGCCAT GATCGAGTCA 
CTGGTCGAGG CGGATCGCTG GTCCGCGCCG GTCGACCTGC CGGGCTTTCT GGACTCGCCC 
GAGCAGGGCC CCTCGCTTGC CCGCCTGTCC GTGCCGACCG GGTCGACCGG GACGGTCGAC 
GAGCCTGGGC CGCCGCGCGA CGATCTCGAA CGGGCGATCG CGGATCACTG GGCGGTGCTG 
CTCGGCTGCG GAGTGCCGGA CCGGGCCGCG AACTTCTTTG CGCTCGGCGG GGACTCGCTG 
CTCGCGGTAC GGATGCTCGG AGCCCTCGCC CGGGAGAAGG TCGGGTGGGT GACGCCGCGT 
CGGTTCCTTG ACCATCCCAC TGTGGCGGGA CTCGCCAGCG CTGTCCGTGA GCCGGCCGAA 
GCCGCCGGCC AGAACGTCGG CATCGGATCG TGA

Protein sequence

MTDPADTTSP TALVDAVRGV WADVLDVDVT AVPGDASFLS LGGDSVLTVR MAALVRQRLG 
VALALADVRV EHSPAQLAAL IQERGTATGG VRALPLDLKR RDDPEAPFPL LPLQQGYFVG 
QQDGWELSYR SAHHYVDIGL EDIETDEIAE ALQDALERLA EHQAVLRARI LPDGRQRILP 
LDDPEAIPVL RVTDLSTASA DEIAERLAAI RREMSTDGPD PTRGCGLDMR LTLLPGAKAR 
LHSSTSLMIV DGWSSGVFYR DLFALVTDQN AMLTPLDVDF GDYAVTLDGL SETESWRADR 
DWWWNRLDSL PLPPALPLIA DPADVRPALM GARQAVLDAD RWAALREHCS RHGVTPSAAM 
FAVFSTALAR ACGHRRFLLN TLQLNRLPLH PDVPRLVGAF SSTMLVPVEL PQTATFSDLA 
VRAQRDIGEA MAHNLVTGVE VSRELGRRRD TRRPVAPVVF QSTLGVDAAL GSEVPRAAGP 
LGSIDLSSHY QQLRTPQVAL EVRLFELRNE LVVVFSLVEE IFDASYVDRM FGEVMAMIES 
LVEADRWSAP VDLPGFLDSP EQGPSLARLS VPTGSTGTVD EPGPPRDDLE RAIADHWAVL 
LGCGVPDRAA NFFALGGDSL LAVRMLGALA REKVGWVTPR RFLDHPTVAG LASAVREPAE 
AAGQNVGIGS