Gene Sare_3948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3948
Symbol
ID	5708219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4490888
End bp	4492177
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	70%
IMG OID	641273373
Product	peptidase M16 domain-containing protein
Protein accession	YP_001538729
Protein GI	159039476
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.425388
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.429143
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGACA GCGGTTTTCC CTGGCCCATC GAGACGACCC GACTGGACAA CGGCCTGCGC 
GTGGTGGTGA GCGAGGACCG CACCGCCCCG GCCGTGGCGG TGAACCTCTG GTACGACGTC 
GGCTCCCGGC ACGAACCGGA GGGTCAGACC GGCTTCGCCC ACCTCTTCGA GCACCTGATG 
TTCGAAGGCT CGGTCAACGT GGCGAAGACC GAGCACATGA AGCTGGTGCA GGGATGCGGT 
GGGTCACTCA ACGCCACCAC CAACCCAGAC CGCACCAACT ACTTCGAGAC AGTCCCCGCC 
GAGCACCTCG AACTGGCGCT CTGGCTCGAG GCCGACCGCA TGGGCGGGCT GGTGCCGGCG 
TTGACTCAGG AGACGCTGGA CAACCAGCGG GACGTGGTCA AGAACGAGCG GCGGCAGCGC 
TACGAGAACG TCCCGTACGG CGACGCGTGG CTGCGACTGC TGCCACTGCT CTACCCGCCC 
CGCCACCCGT ACCACCACGC GACGATCGGC TCGATGGCCG ACCTGAACGC CGCTGACCTC 
GCCACCTTCC AGGCCTTCCA CACCGCGTAC TACGCGCCGA ACAACGCGGT CCTGACGGTG 
GTCGGCGACA CCTCCGCCGT CGAGGTGTTC GCCCTGGCAG AAAAGTACTT CGGCGCGATC 
CCGCCCCGAT CGGACATCCC AGCCGCGCCG GACGGCCGGC ACGTCTCGAA CACCGATGCG 
GCGACGACGG AGACGGTCGT CACCGACGTG CCCGCGCCCC GGGTGTACGT CGCGCACCGC 
ACCCACCCGT TCGGCACCCC CGGCTACGAC GTGACCACCG TGCTCGCCAC CGTCCTCGGC 
AGCGGGCGGG GCAGCCGGCT CTACCAACGG CTCGCCGACG GTGAGCGGAT CGCACAGCCG 
GACCTGGTCG GCGCGTACGG AGTGGACCTG ACGTACGCCC CGGCGCCGTT GATCGCCACC 
GCCACCGCCC GCCCCGGAGT GCCCGCCGAA CAGTTGGCCG CCGGGTTGGG CGAGGTCATG 
GACGAACTGG CCACGGTGCC GGTCACCGCC GCCGAGTTGG ACCGGGCCAA GGCACTGCTC 
AGCACCGCCT GGTGGCGGCA GATGTCCACG GTGGAGGGCC GTGCCGACAC CCTCGGCCGG 
TATGCGACAC AGTTCGGCGA CCCGCGGCGG GCGGCCGAAC GGCTGCCGGC GCGGCTGGCG 
GTGACCGCCG AGCAGATCGC GGCGGTGGCC GCCGAGGTGC TCGTCACCAC CGACCGGGTG 
ATCCTGACCT ACCTGCCCGA GGAGAAATGA

Protein sequence

MPDSGFPWPI ETTRLDNGLR VVVSEDRTAP AVAVNLWYDV GSRHEPEGQT GFAHLFEHLM 
FEGSVNVAKT EHMKLVQGCG GSLNATTNPD RTNYFETVPA EHLELALWLE ADRMGGLVPA 
LTQETLDNQR DVVKNERRQR YENVPYGDAW LRLLPLLYPP RHPYHHATIG SMADLNAADL 
ATFQAFHTAY YAPNNAVLTV VGDTSAVEVF ALAEKYFGAI PPRSDIPAAP DGRHVSNTDA 
ATTETVVTDV PAPRVYVAHR THPFGTPGYD VTTVLATVLG SGRGSRLYQR LADGERIAQP 
DLVGAYGVDL TYAPAPLIAT ATARPGVPAE QLAAGLGEVM DELATVPVTA AELDRAKALL 
STAWWRQMST VEGRADTLGR YATQFGDPRR AAERLPARLA VTAEQIAAVA AEVLVTTDRV 
ILTYLPEEK