Gene Strop_2620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2620
Symbol
ID	5059083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	2941801
End bp	2942763
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	68%
IMG OID	640474876
Product	proline iminopeptidase
Protein accession	YP_001159442
Protein GI	145595145
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.000526602
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.51631
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGTC TGTATCCCGA GATCGAACCC TTCGCAGACG GCTTGCTCGA TGTCGGGGAC 
GGCCACCTCG TCCATTGGGA GAGCTGCGGT AACCCACTCG GCAAGCCGGC ACTGGTATTG 
CATGGCGGCC CCGGTTCCGG TGCCAGTGCC TCCTGGCGGC GATTCTTCGA TCCGGCCGTG 
TACCGGGTGG TCCTGTTCGA CCAGCGGGGG TGCGGGCGCA GCACACCGGA CGCGGGCGAC 
GTGCGAACCG ACCTGTCGAC CAACACCATG CCGCATCTGC TGGCTGACAT CGAAAAGCTG 
CGCACACACC TGAACATCGA CCGGTGGTTG CTGCTCGGCG GATCGTGGGG CAGCGCGCTC 
GGCCTTGGCT ATGCCCAGCG GCACCCCGAC CGGGTCACCG AGATCGTGTT GTTCAGTGTC 
GTCACCAGCA CCCCGGCCGA GCATCGGTGG ATCACCCGCG ACCTTGGACG GATCTTCCCT 
GAACAGTGGG ACAGGTTCCG GGATGCGGTG CCGGCCGCCG AACGCGACGG CAACCTGCCC 
GCCGCCTACG CCCAGCTGCT GGCCGATCCG GACGAGACAG TGCGGGACCG AGCCGCACGC 
GCCTGGTGCG CCTGGGAGGA CACACTCGTG TCGAACCTGC CCGGCAGTGG ACCCGACCCC 
AGGTTCGAGG ACCCGGTGTT CCGGATGACT TTCGCCCGCC TTGTCACCCA CTACTGGGCG 
CATGACGGTT GGTTCGCCGA CGGTGAGTTG ATGGCAGGTG CACACCGGCT TGCGGACGTT 
CCCGGTGTGC TTGTCCACGG CAGGCTCGAC CTGGGCAGCC CGGCGGACGT CCCGTGGCAA 
CTGTCCAAGG CCTGGCCCGC GGCGCGGGTG GAGCTGATTG ACGAGGCCGG TCATGGCGCC 
GGACACGGCA TCGGGGACGC GGTCATCAAC GCCCTGGATC GTTTCGGCGC TTCCTGGCGG 
TGA

Protein sequence

MVRLYPEIEP FADGLLDVGD GHLVHWESCG NPLGKPALVL HGGPGSGASA SWRRFFDPAV 
YRVVLFDQRG CGRSTPDAGD VRTDLSTNTM PHLLADIEKL RTHLNIDRWL LLGGSWGSAL 
GLGYAQRHPD RVTEIVLFSV VTSTPAEHRW ITRDLGRIFP EQWDRFRDAV PAAERDGNLP 
AAYAQLLADP DETVRDRAAR AWCAWEDTLV SNLPGSGPDP RFEDPVFRMT FARLVTHYWA 
HDGWFADGEL MAGAHRLADV PGVLVHGRLD LGSPADVPWQ LSKAWPAARV ELIDEAGHGA 
GHGIGDAVIN ALDRFGASWR