Gene Sare_1303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1303
Symbol
ID	5703683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1511597
End bp	1512847
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	69%
IMG OID	641270814
Product	peptidase M50
Protein accession	YP_001536195
Protein GI	159036942
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.138776
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTACC TGCTCGGGGT GACGCTCTTC GCCCTCGCCA TCCTGATCTC GGTGAGTCTG 
CACGAAGCGG GGCACCTGCT GACGGCGAAG GCCTTCGGCA TGAAGGTGAC CCGTTACTTC 
GTCGGTTTCG GCCCGACCCT CTGGTCGTTC CGGCGGGGCG AGACGGAGTA CGGAATCAAG 
GGCATCCCAC TCGGCGGCTT CTGCAAGATC GTCGGGATGA CCCCGCAGGA CGACGACGTC 
GAGCCGGCCG ACCAACCACG GGCGATGTGG CGGTTCCCGG TCTGGAAGCG GACGGTCGTG 
ATGGCCGCCG GCTCGATCGC GCACTTCGCG CTGGCCCTGA TCGCGCTCTG GATCATCGCG 
ATCACCGCCG GGCTGCCCAA CCCGAACTTC CCGAGCACCC TGGCGCAGAT CCGGCAGGAG 
CCGGCGATCA TCCAGCTCGC CACCTGCGTG GTCCCGGAAA ACGAGGTCCG GGCCTGCACG 
GACGCCGACC CGGCCAGCCC CGCCGCGCAG GGCGAGCTGC GCGACGGCGA CCGGATCACC 
GCGGTCAACG GCACCGCCGT CACCAACTAC GGTGACCTGC TCGTCGCCCT GCGCGCCCAG 
CAGCCGGGGC AGCAGGCGCA GGTCGCCTAC CTGCGGGACG ACCAGCCGGG CACCGCGACC 
GTGACGCTCG GGCAGACCCA GCGTCCCCCG CTGGACGACC CGGAGGGCAC CGTCGGGCCG 
GTCGCCGCGC TCGGCGTCGG GCTCATCCCC AGCACCCCCA CCCGGATCGA GTACGGTCCG 
ATCGGCGCCA TCGGCGGCAC CGCCGACTTC ACCGGCACCA TGGCGGTCAA CACGTACGAG 
GCGATGAAGC GGATACCGCA GAAGGTCCCG GCGCTCTGGA CGGCGATCAC CGGTGGCGAG 
CGGGACGTGG ACACCCCGAT CAGCGTGGTC GGGGCGAGCC GGATCGGCGG CGAGGCGGTG 
GAGAACAACG CCTGGCTGCT CTTCTTCATG CTCTTCGTCT CGCTGAACTT CTTCATCGGC 
GTGTTCAACC TGCTGCCGCT GCTGCCCCTG GACGGCGGTC ACATCGCCAT CGCCTGGTTC 
GAGCGGGCCC GCTCCTGGGT GTACGCGCGG CTACGTCGCC CCGACCCGGG CCGGGTCGAC 
TATCTCAAGC TGATGCCCTT CACGTACGCG GTGATCCTGA TCGGCGGCGC GTTCACGCTG 
CTGACCATCA CCGCCGACGT CGTCAACCCG ATCACGCTCT TCACAAGGTG A

Protein sequence

MAYLLGVTLF ALAILISVSL HEAGHLLTAK AFGMKVTRYF VGFGPTLWSF RRGETEYGIK 
GIPLGGFCKI VGMTPQDDDV EPADQPRAMW RFPVWKRTVV MAAGSIAHFA LALIALWIIA 
ITAGLPNPNF PSTLAQIRQE PAIIQLATCV VPENEVRACT DADPASPAAQ GELRDGDRIT 
AVNGTAVTNY GDLLVALRAQ QPGQQAQVAY LRDDQPGTAT VTLGQTQRPP LDDPEGTVGP 
VAALGVGLIP STPTRIEYGP IGAIGGTADF TGTMAVNTYE AMKRIPQKVP ALWTAITGGE 
RDVDTPISVV GASRIGGEAV ENNAWLLFFM LFVSLNFFIG VFNLLPLLPL DGGHIAIAWF 
ERARSWVYAR LRRPDPGRVD YLKLMPFTYA VILIGGAFTL LTITADVVNP ITLFTR