Gene Sare_3947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3947
Symbol
ID	5708218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4489542
End bp	4490888
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	73%
IMG OID	641273372
Product	peptidase M16 domain-containing protein
Protein accession	YP_001538728
Protein GI	159039475
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.530134
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.18472
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTGA TCAGCACCCA GCCCGGTCCG GGTACCGCCC GCCCGTACCG GTTTCCGCAG 
GTGGTCCGGC GTTCCGTCAA GGGTGGGCAG GTGGTGGCCG CGCACCTGCC GGGGCAGTCG 
TTGGCCGTGG CGCTCCTGCT GCTCGACGCC GGTGCCGGCC GGGAACCGCG TGGGCGTGAA 
GGGCTGTGCG CGGTGCTCGC CAAGGCCCTG GAGGAGGGCA CGGCGCAGCG GGACGCGACG 
GCGTACGCGC TGGCCATCGA GGCGCTCGGC ACGGAGCTGG TGACCGGCCT GGACTGGGAC 
TCGTTCCAGG TGAGCGTGCA GGTCCCGGTG GATCGGTTGC CCGCCGCGGT GGAGCTGTTG 
GCCGAAGCGG TGCGTACCCC CCGGCTGGCG CCGGACGACG TGCGGCGGGT CCGCGACGAC 
GAGGCGACCG CCCAACGGAT GGACTGGGCG AATCCGGGTC CGCGGGCGGA TGCGGCGCTG 
CGGGCCGACC TGTACGGCGC CGAGAACCGC TGGGGCCGAC CGTTGTACGG CGATCCGGAC 
ACGGTGGCCG GGCTGGACAT CGAGGATGTT CGAGTTTTCC ACTCGGAGTG GTTCCTTCGG 
CCGGGCACCC TGATCGTCGC CGGGGACCTG GACCGGCTCG ACCTCGACGC GCTCGGCGCG 
GCGGCGTTCG CCGGCACCGG TGGCGGCCCG GTGGACCGGG GCGACCCGAT TCCGGTCACG 
CCACGCCAGG GGCGCCGAAT CGTCCTGGTG GACCGGCCGG GTTCGGTGCA GTCGACGCTG 
CGGCTCGGGC ATCCGTCACC GCACCGCGCG CACCCCGATC ACGTCCCGAT GACGCTTGCT 
GGTGCCGTTC TCGGCGGTGC CTTCACGTCC CGGCTCAACC ATCTGATCCG CGAGGTGCGC 
GGCTACACGT ACGGGATCCG GGGCGACTTC GTGTCCTCCC GCCGGTTCGG GCGGTTCGCG 
GTCAGCTCCG GCGTACAGAC CGCGGTCACC GCGCCCGCGC TGGTCGAGGC GGTTGGCGAG 
ATCACACGTA CCCAGCAGAC CGGGGTGACC GGGGAGGAGC TGGCGGTGGC GCGCTCATGG 
CAAGCCGGCC AGCTCTCGGT CGAGTTGCAG ACGCCACGGG CGATCGCCGC GGCGCTGACC 
ACGCTGGTAG TCCACGACCT ACCGGACGAC TACTACGCCC GGCTGCGGGA GTCACTGCTC 
GCCGCCGAGG TCGGCGAGGT CTCGGCTGCC GCCGCCGCGC ACCTGCACCC CGAGTCGCTG 
ACCCTGGTGA TCGAGGGTGA CGCTGCCCTG ATCCGGGCCG AGCTGGCGGC GACCGGCCTG 
GGTGAGGTCC TCACCAGCAC CCGCTGA

Protein sequence

MTLISTQPGP GTARPYRFPQ VVRRSVKGGQ VVAAHLPGQS LAVALLLLDA GAGREPRGRE 
GLCAVLAKAL EEGTAQRDAT AYALAIEALG TELVTGLDWD SFQVSVQVPV DRLPAAVELL 
AEAVRTPRLA PDDVRRVRDD EATAQRMDWA NPGPRADAAL RADLYGAENR WGRPLYGDPD 
TVAGLDIEDV RVFHSEWFLR PGTLIVAGDL DRLDLDALGA AAFAGTGGGP VDRGDPIPVT 
PRQGRRIVLV DRPGSVQSTL RLGHPSPHRA HPDHVPMTLA GAVLGGAFTS RLNHLIREVR 
GYTYGIRGDF VSSRRFGRFA VSSGVQTAVT APALVEAVGE ITRTQQTGVT GEELAVARSW 
QAGQLSVELQ TPRAIAAALT TLVVHDLPDD YYARLRESLL AAEVGEVSAA AAAHLHPESL 
TLVIEGDAAL IRAELAATGL GEVLTSTR