Gene Strop_1830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1830
Symbol
ID	5058289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2095724
End bp	2096929
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	66%
IMG OID	640474100
Product	aminodeoxychorismate lyase
Protein accession	YP_001158670
Protein GI	145594373
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.194696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.869905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGACG ATCTGGACCC TGATTTCGAT ACCGATCGGG GAGAGAAGGG CCGGCATCGG 
CGTGGCTACG TGCGAAAGCG TCAGCGCGAG CGGACGCGCA GCTCGGGTGG AGGGCGCGGC 
AAGACCGTGC TGGCCCTGCT GCTGACCCTG ACTCTGCTCG GCGGCCTCGG CGGTGGTGCC 
TTCTACGGCT TCGAACGGAT CCAGAGCCTT CTCGGTACCC CAGACTACGA CGGCTCCGGG 
ACCGAGGCGG TGACGGTCGA GATCCCGGAG GGCGCCCCGA TCGCCGCCAT CGCGGTCACG 
CTCTACGAGG CCGGGGTTGT CAAGAGCACC AAGGCATTTG TTGAGGCGGC GGAGGAGAAC 
GACCAGAGCA AGAGCATCCA GCCCGGCCAG TACGAGTTGC GGAGGCAGAT GAGTGGCGAG 
TATGCCGTGG CCGCGATGCT GGACCCGAAG AACCGGATCG TGAACGGGAT CACTGTTCCC 
GAGGGGCGGA CCGCGAAGAG CATCTACAAG CTGCTCGCCG AAGAGACCGA GATCCCGGTG 
GAGGAGTTCG AGGCGGCGGC GAAGGATCCG CTCGCGCTCG GTGTCCCGGA GTGGTGGTTC 
ACGCGCACGG ACGACCGGAC GGCCGAGCCG TCGATCGAGG GCTTCCTCTT CCCCGACACC 
TACGAGCTTC CCGCGGAACC CACGGCTGAG TCGATTCTCG CGCTGATGGT GGAGCGATTC 
CTCACCGTCG CCGAGGAGTT GGAGTTCGTC GACCGGGTGC AGAACGAACG CCAGATCGCG 
CCCTACGAGG CGCTGATCGT CGCGTCGCTC GCCCAGGCCG AGGCGGGCAC TCCGGAGGAC 
CTCGGCAAGG TCGCCCGGGT CGCCTACAAC CGGGTCTACG GCGACTTCCA GTGCAACTGC 
CTGGAGATGG ACGTCACGGT CAACTACTAC CTCGAGTTGA CCGGCCAGGA GACCAAGACC 
TCGGCCGAGA TGACCCAGGA CGAGTTGCTT GACACGGAGA GCCCGTACCG CCGCAAGCTC 
GAGGGCCTGA TCCCCACGCC GATCAACAAC CCGGGTCAGT TGGCGATGGA AGGCGCCATG 
GACCCGCCGC CGGGAAAGTG GCTCTTCTTC GTCGCGATCA ACAAAGAGGG GGAGTCCGCC 
TTCGCGGAAA CCTACGACGA GCATCTGCGC AACGAGGCCA AGGCGAGGGA GGCGGGTGTC 
ATCTGA

Protein sequence

MIDDLDPDFD TDRGEKGRHR RGYVRKRQRE RTRSSGGGRG KTVLALLLTL TLLGGLGGGA 
FYGFERIQSL LGTPDYDGSG TEAVTVEIPE GAPIAAIAVT LYEAGVVKST KAFVEAAEEN 
DQSKSIQPGQ YELRRQMSGE YAVAAMLDPK NRIVNGITVP EGRTAKSIYK LLAEETEIPV 
EEFEAAAKDP LALGVPEWWF TRTDDRTAEP SIEGFLFPDT YELPAEPTAE SILALMVERF 
LTVAEELEFV DRVQNERQIA PYEALIVASL AQAEAGTPED LGKVARVAYN RVYGDFQCNC 
LEMDVTVNYY LELTGQETKT SAEMTQDELL DTESPYRRKL EGLIPTPINN PGQLAMEGAM 
DPPPGKWLFF VAINKEGESA FAETYDEHLR NEAKAREAGV I