Gene Sare_4738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4738
Symbol
ID	5704563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5361836
End bp	5363002
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	69%
IMG OID	641274136
Product	peptidase M23B
Protein accession	YP_001539482
Protein GI	159040229
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000208513
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGGAG AAGCTGAGCC GAAGCGCCGT CGACTGCGTG CGGGTGCGAT CGCTGGCGTG 
CTCACCGCGG CGTTGGCCCT GCTCTGCTGC GCCGGCGGTG CGGGAGCCTT CTTCCTCACC 
GAACTCGGAG GCGGCGACGA CCGGCTACGC CTTGCCAACC AGAACTGCAC CGGCGACTTC 
CGCGTCGAGA TCACCGGGGA GATGCCCCGG ATGTCGGAGT ACGGTGAGGT CCAGCTCCGC 
AACGCCGCGC GGATCATCAA GGTCGGGCAG GAGCTGCAGA TACCACCCCG CGGCTGGGTA 
ATCGCCGTGG CGACCGCCAT GCAGGAGTCC CGTCTACGCA ACCTCGCCAA CCCCACCGTG 
GCCGGGTCGG AGCAGCTTCC GAACGAAGGC GTCGGCTCGG ACCACGACTC GGTGGGACTG 
TTCCAGCAGC GGGCGAGCTG GGGCACGGTC GAGCAGCGGA TGACTCCGGA GTACGCGGCC 
CGCAGGTTCT ACGAGAAGTT GCGTGGGGTG CTCAACTGGG AGCAGCTACC GCTGACCCGA 
GCCGCGCAGG CCGTACAGAT CAGCGCCTTT CCGGATGCGT ACGCCAAGCA CGAGGCGCTG 
GCGTCAACGA TCGTCAACGC GCTGGCCGGC GGCGCCGCCC GCACCGTGCC CCTCACCGAC 
GGGCACGTCT GCGACGCGGC GGAGGATGGC CTGATCGCCG CCTCCGGCTG GACCGCCCCG 
ATCCCCGGTG ACGTCGGCTC CGGATTCCGC ACCGAGAAGC GGCCGGCACA CCACGGGGTG 
GACATCGCCG CACGGAAGGG TATCGATATT CGCGCCGCGT CCAGCGGTCG AGTCCTGGTC 
GCCCGTTGCG ACCCCGATCG GGCCGGGCAG CTGAGCTGCG ATGTGGACGG TTGGCCGGGC 
AAGGGTGGCT GCGGATGGTT CGTCGACATT CTCCACGCTG GGAAGATCAT CACCCGCTAT 
TGCCACATGG CGCACAAACC TCAGGTCAGC GTGGGCCAGA CGGTGCGGGC CGGTGAGATC 
ATCGGTGTGA TCGGCAGCAG CGGCAATTCG TCCGGACCGC ACCTGCACTT CGAGGTGCAC 
ACCGACGGTG ACCGGAGCAG CGACGGCGCG ATCGACCCGG TACGGTTCAT GCGGGAGCAG 
GGTGCACCGC TGCGAAGCGT GGAGTGA

Protein sequence

MSGEAEPKRR RLRAGAIAGV LTAALALLCC AGGAGAFFLT ELGGGDDRLR LANQNCTGDF 
RVEITGEMPR MSEYGEVQLR NAARIIKVGQ ELQIPPRGWV IAVATAMQES RLRNLANPTV 
AGSEQLPNEG VGSDHDSVGL FQQRASWGTV EQRMTPEYAA RRFYEKLRGV LNWEQLPLTR 
AAQAVQISAF PDAYAKHEAL ASTIVNALAG GAARTVPLTD GHVCDAAEDG LIAASGWTAP 
IPGDVGSGFR TEKRPAHHGV DIAARKGIDI RAASSGRVLV ARCDPDRAGQ LSCDVDGWPG 
KGGCGWFVDI LHAGKIITRY CHMAHKPQVS VGQTVRAGEI IGVIGSSGNS SGPHLHFEVH 
TDGDRSSDGA IDPVRFMREQ GAPLRSVE