Gene Strop_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1023
Symbol
ID	5057469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	1153075
End bp	1154973
Gene Length	1899 bp
Protein Length	632 aa
Translation table	11
GC content	67%
IMG OID	640473292
Product	amino acid adenylation domain-containing protein
Protein accession	YP_001157875
Protein GI	145593578
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1020] Non-ribosomal peptide synthetase modules and related proteins
TIGRFAM ID	[TIGR01733] amino acid adenylation domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCG CATCGACACT GCACGGCGGC TTTGTCGCCC ACGCAGCCGC GAATCCGGAC 
ACGCTGGCCG TAGCGTCCGA CGCCGGCGTG ATGACCTACG GTCGGCTTGA CGAGACCTCG 
GCGGCGCTGG CCGAGCGGCT GTCTGCCTTG GGTGCTGGCC CGGGTGTTCC GATCGGGGTC 
TGTATCGAAC GCACGCCGGA CCTGCTCGTC GCTATCCTCG GCGTGCTGCG CGCGGGCGCC 
TGCTATCTGC CGCTCGATCC TCAATATTCA GCGCGCCACC TCGGCTTCAT GGTGGCCGAC 
AGCGGGACCC GCCTGGTCGT TACCACACGA TCCTCTCGGG ACGCGTGCCC GGACGGCTGC 
ACCGCGCTCG TCCTGGAGGA ATCCGAGGCG ATAGCCGACC CGCCGCCAGT GGCCGCGGTT 
CCGGACGATT CTGCCTACGT CATATATACC TCCGGCTCGA CCGGCACGCC CAAGGGGGTG 
CCGATCCGGC ACAGCAGCTG CGCGGCGATG CTTGCCGAGG CGGACCGAAT TTTCGAGGGC 
TGTGACATGA GCGGTATCGC CGCCGTCACC TCGGTCTGCT TCGACCTGTC AGTGCTGGAG 
ATCTTCTCCG CCCTCAGCCG TGGCCGGACG CTCGTCCTGG TGAATAGTGC CAGCCACCTT 
CCGGAGAGCT CCCATGTCGA ACGGGTGACG CACGTCAGCA CGGTCCCGTC CGCAATGACC 
AGCCTGCTTG ACGCGCAAGC CGTTCCGGCC GGCCTGCGGA ACGTGGTGCT CGGCGGCGAA 
CCCGTACGTC GGAGCCTGGT CGACCGGATC TACCGCGAGA CCAACGTCGA CTTCGTCTTC 
AACGGATACG GCCCGACGGA AGGCACGGTC TTCTGTACCT TCAAGCCCGT ATCCCGCGAC 
GAGGCCGGCG AGCCGTCGAT CGGTACGCCA TCCCTGACCG CTCGCGTCTA TGTGCTCGAC 
GAGAAGCTGC GGCCGTCGGC CGTCGGCGAG TCGGGTGAGC TGTACCTCGG CGGTGCCGGA 
CTTACCTGGG GCTACCTCAA CCGGCCCGGG CTGACTGCGG AACGGTTCGT ACCTGATCCG 
CAGGTGGCGG GTGAACGCAT GTATCGCACC GGCGACATCG CTCGGCTCAA CGAAGCAGGT 
GAAATCGAGT TCGTGGGACG CTCCGACCTT CAGGTGAAGG TCCGCGGGTA CCGCATCGAG 
CTAGAAGAGG TCGAGGCACG ACTGACCGAA TGCCCCGAGG TGCGGACGGC TGCGGCCGTC 
GTCCGTGAGC AGACGCCGGG TACGAGAGCC CTGACCGCGT ACGCGGTTCC GGCGAGTGGA 
GCACCCGACG GCGACGGGCC CTGGCTCGAC GCCGACCTGC AGGCAACGAT CAAGCAACAG 
CTCGGTGCGC TGTTGCCCGG TTACATGGTT CCCGAAACGA TCGTCTTCCT GCCCGCGCTC 
CCGCTGTCGC CAGTTGGGAA GCTGGACCGC ACGGCGCTAC CGGCACCACC CGTTGTCGAT 
GTGCTGCCCT CGGGGGACTC CGCCACCACC GACACCGAAC AAGCGCTTGC CGAGATCTGG 
GGTGCACTGC TGGACCGGAC TCCGCAGTCC ATCGGCATCC GCGACACATT CTACGACCTC 
GGCGGCAACT CTTTGTTGTT GGTGCGGCTC GCGAAGCGAA TGGGTCAGCG CTTTCACCGC 
AAGGTCGGCG TGGCGGACCT GTTCCGGTTC CGCGACATCG GCTCGCTCGC CAAGTGGCTG 
GACGACGAGA GCGGAAAGAG TCCTGAGGAC ATCGAGCAGG CACGACGCCG TGCCAGCACC 
AGACGCTCGG TGGTGCGCGG CCACAGCAGA TCACCGAGCA CTCGAACCGA CCCGACCGTC 
AAGAACACGC CCGCATCAAA TGGAGGCCCA CATCCATGA

Protein sequence

MTAASTLHGG FVAHAAANPD TLAVASDAGV MTYGRLDETS AALAERLSAL GAGPGVPIGV 
CIERTPDLLV AILGVLRAGA CYLPLDPQYS ARHLGFMVAD SGTRLVVTTR SSRDACPDGC 
TALVLEESEA IADPPPVAAV PDDSAYVIYT SGSTGTPKGV PIRHSSCAAM LAEADRIFEG 
CDMSGIAAVT SVCFDLSVLE IFSALSRGRT LVLVNSASHL PESSHVERVT HVSTVPSAMT 
SLLDAQAVPA GLRNVVLGGE PVRRSLVDRI YRETNVDFVF NGYGPTEGTV FCTFKPVSRD 
EAGEPSIGTP SLTARVYVLD EKLRPSAVGE SGELYLGGAG LTWGYLNRPG LTAERFVPDP 
QVAGERMYRT GDIARLNEAG EIEFVGRSDL QVKVRGYRIE LEEVEARLTE CPEVRTAAAV 
VREQTPGTRA LTAYAVPASG APDGDGPWLD ADLQATIKQQ LGALLPGYMV PETIVFLPAL 
PLSPVGKLDR TALPAPPVVD VLPSGDSATT DTEQALAEIW GALLDRTPQS IGIRDTFYDL 
GGNSLLLVRL AKRMGQRFHR KVGVADLFRF RDIGSLAKWL DDESGKSPED IEQARRRAST 
RRSVVRGHSR SPSTRTDPTV KNTPASNGGP HP