Gene Sare_2586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2586
Symbol
ID	5707171
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2945090
End bp	2946286
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	71%
IMG OID	641272048
Product	peptidase M50
Protein accession	YP_001537418
Protein GI	159038165
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0867548
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.103168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACATC CGGGCCTGCT GGCCAAACGC CCCCGGCTGC GCGAGGACCT GATCTTCTCG 
CGGCCGTTGC AGCGCGGCCC CGACACCGTC TACCTGCTCA AGGACCGCCG CAACGGCCGG 
TCGTTCGAGA TCCCGCCGAA AGAACAGTTC CTGCTACGCC GCCTCGACGG CGTCCGGTCC 
CTACGCGAGG TCGGCGCCGA ATACGCCGAC ACCTATGGAC GCCGCCTCGG CGACGCGCAC 
TGGACCCGCC TGCTGTGGCT CCTGCACGAA CGTGACCTGC TGTCCGTGCA TCGCGCCGAT 
CCGGGCACCG CGCCGGGCAA CGGCGAGCCG ACGGCGACCG ATCCGGGACA CTCCGGCGCG 
CTGGGATGGT GGGCACACCG ACTGCGGTGG CTGCTGCGCC CGGCGGTCTT CGCGCTGCTC 
GCCGTACTCG TCGCCGCCCT GCTCGTGACG ATCGGGCTCC AACTCGGCCC GCTCTGGCAG 
ACCGCCCGCC CCGCCTTCAC CGACCCGATC AGCCTGGTCG CACTGGCGTT GCTCGTCTGG 
TCGAGCGCGG CGCTGCACGA GTTCGCACAC GGACTGGTGG CCGTCCACTT CGGTGCCACC 
GTCAACCGGA TCAACCTGGT CACCCTCACC TGCAAGGTCG AGGACTACCT CTACCTACCG 
CGTCGATCCC AGCAGGTGAT GATCGCAGCC GCCGGCGCCG TCGCCAACGG GCTGGTCCTG 
CTGCTCACCG GCGCCGCCCT CATCGTGCTG CCCGGCGCCT TCACCGAGCG ACTACTCAGC 
GCATACCTCC TGGTCGGTGT GGCCCAGACA CTGGTCAACG TCATTGCCCT GCCACCGCTG 
GACGGCTACA AGATCCTCAG CCACCTGCTG GACCAGCTGG ACCTGGCCCC GGAGAGTCGC 
CGCTACCTGG CGACCCTTCC CCGGCGGCTG CTGCGCCGGC CCGCCCGCCG CTACCCCCGA 
CCGGCCGCGG TCTGTCTCGG GCTCTTCGCC GCCTGGTGGC TGCTGGCGAT CGCTGCCGCC 
GCCACCGTCG TGATCGTCCT CGTGGGCGCC CTCCTCCGAC CCTCCCTCGG CGCGCTCGCC 
TACATCCCGC CGGCCGCCAT CGTCGGCCTG ACGCTCGCCG GCTGGCTGGC CCGGCCACGC 
CGGCCACGTT CGGTCGACCG GATCCCCGCA CCACCAACCA ACGAGAACAA CCAGTGA

Protein sequence

MTHPGLLAKR PRLREDLIFS RPLQRGPDTV YLLKDRRNGR SFEIPPKEQF LLRRLDGVRS 
LREVGAEYAD TYGRRLGDAH WTRLLWLLHE RDLLSVHRAD PGTAPGNGEP TATDPGHSGA 
LGWWAHRLRW LLRPAVFALL AVLVAALLVT IGLQLGPLWQ TARPAFTDPI SLVALALLVW 
SSAALHEFAH GLVAVHFGAT VNRINLVTLT CKVEDYLYLP RRSQQVMIAA AGAVANGLVL 
LLTGAALIVL PGAFTERLLS AYLLVGVAQT LVNVIALPPL DGYKILSHLL DQLDLAPESR 
RYLATLPRRL LRRPARRYPR PAAVCLGLFA AWWLLAIAAA ATVVIVLVGA LLRPSLGALA 
YIPPAAIVGL TLAGWLARPR RPRSVDRIPA PPTNENNQ