Gene Strop_2777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2777
Symbol
ID	5059240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	3148774
End bp	3149694
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	70%
IMG OID	640475031
Product	proline-specific peptidase
Protein accession	YP_001159597
Protein GI	145595300
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01250] proline-specific peptidases, Bacillus coagulans-type subfamily

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.159674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000853285
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGACGACAA CTGGAGTGGA CGCCATGACA CTGGCACCGA CCGACAAGGG CATCGTGGAG 
TTCGGCGACC ATCGAACGTG GTACCGCGTG ACGGGCCGGC TGCACGAGGG TCAGCCGCCG 
CTCGTCGTGC TGCACGGCGG CCCGGGCAGC ACCCACGACT ACCTGCTCAG CCTGGCCGAG 
CTGAGCCACT CCGGTCGCCC GGTGGTGCAC TACGACCAGC TCGGTAACGG CGGCTCCACC 
CATCTGCGGG ACCGTGGCGC CGACTTTTGG ACGGTGGAGC TGTTCCTGGC CGAGCTGGAC 
AACCTCCTGC GCCGGCTCGG CGTCACCGAC GAGTACGTCC TGCTCGGGCA GTCCTGGGGT 
GGGGTCCTGG CGGCGGCCCA CGCGGTGGAC CGACCCGCCG GGCTGCGCGG CCTGGTGATC 
GCCAACGCGC CCGCGTCGTA CCCGCTGTGG CTGTCCGAGC TGGACGTGCT GCGGGCCGCG 
TTGCCCCCCG GCGTGGACGC GACACTGCGT CGACACGAGG CCGCCGGCAC CACCGACAGC 
CCCGCCTACG TGGCCGCGAT GATGGTCTTC TACCAGCGGC ACGTGTGCCG GCGTAAGCCG 
TTGCCGCCGG AGCTGATGGC CACCTTCATG GAGATCAACG GTGATCCGAC CGTCTACCAC 
TCCATGAACG GGCCGAGCGA GTTCTGCGTG ACCGGGACCC TGCGCGACTA CTCGCTGGTC 
GACCGTCTGC CGCAGATCGA CGCGCCCACC CTGGTCATCA GCGGCGAGCA CGACGAGGTC 
ACCCCGGCCG CCGTGCGCCC CTTCCACGAT CTCGTCCCCG GTGCTCGCTG GGAGATCGTC 
GATGGGGCCA GTCACCTGCC TCACCTGGAG ACCCCGGAGC GGTTCACCGA AATCCTCACC 
GAGTTTCTCG ACCGGCTCTG A

Protein sequence

MTTTGVDAMT LAPTDKGIVE FGDHRTWYRV TGRLHEGQPP LVVLHGGPGS THDYLLSLAE 
LSHSGRPVVH YDQLGNGGST HLRDRGADFW TVELFLAELD NLLRRLGVTD EYVLLGQSWG 
GVLAAAHAVD RPAGLRGLVI ANAPASYPLW LSELDVLRAA LPPGVDATLR RHEAAGTTDS 
PAYVAAMMVF YQRHVCRRKP LPPELMATFM EINGDPTVYH SMNGPSEFCV TGTLRDYSLV 
DRLPQIDAPT LVISGEHDEV TPAAVRPFHD LVPGARWEIV DGASHLPHLE TPERFTEILT 
EFLDRL