Gene Sare_2189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2189
Symbol
ID	5706245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2519440
End bp	2520819
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	72%
IMG OID	641271671
Product	hypothetical protein
Protein accession	YP_001537042
Protein GI	159037789
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0666639
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGGGGC CGAGACCGAC GGATGCCGTG GAGACCGCCC TGTCCGCCAG CCGTTCCGAT 
GCCTGCGTCG TGATCGTGGA GCACGGCGCG GAGCGACACC TACGGTGGGC AGACAGCGAA 
CTGATCGGTA CCGGCGACGT CGACACGTGT CAGGTCTCGG TGGTGTCGGT TGTGGGCGAC 
CGGGTAGGGG CGGTCACCGT GAGCGGGCGG GCTGACCGAG CGGAGATCGT CGCGGTGGTC 
CGTGCGGCGG AGGCGGCGGC CCGACAGGCG CCGCCGGCCG AGGACGCACG GCCCCTGCCC 
GCCTCCGGTG CTGAATCGCC GCATTGGGAC GCTGCGCTTC CGGCCCCGTC GTCGGCGGTG 
CTTGCCGGGC TCGTGGACCA GCTCACCGAG GGGTTCGCCC GGGCCCGGCG CAACGGCCAG 
GCGTTGTACG GGTATGCCGA GCACCGCCGC CGGACCACCT TCCTCGGCAC CTCCACCGGG 
GTCCGGCTGC GGCACGACGA TCGGGCCGGG TACCTGGAGC TGACCGCGGG GGACCGGGAT 
GGCACTCCGG CCTGGACGAA CGCCGTGACC ACCGAATTCG ACGACGTGTC GGTGCGCGAG 
CTCCAGGATG AGCTGGACCG GCGACTGCGC TGGGGTCGCC GGAGCATCGA GTTGCCGCCG 
GGGCGCTACG AGTGCCTGTT GCCGCCGTCG GCCGTCGCTG ATCTGATGAA CTACGCGTAC 
ACCACGGCCG GTGCCCGTGC GGCGGCGCAG GGCCGATCGG TGTACAGCCG GCCCGGCGGC 
CGGACCCGGG TCGGGGAAGT GCTCTCCGAT GTGCCACTGA CCTTGCGCAG CGACCCGGCG 
GCCGATCGGC TGCGCTGCCC CCCGTTCCTG GTGACGTCGT CGTCGACCGG AACCCGGTCG 
GTGTTCGACA ATGGCCTCCC GCTTGGTCCC ACCTCCTGGT GGGAGCGAGG GCGGCTACGG 
TCGCTGGTGC ACACCCGCGC GAGTGCCGAG GAACTGGGTG CGCCACTGAC CCCGATGGTG 
GACAACCTCG TCCTCGACGG ACCGCCCGGC GGTGGCGACA CCGCGGAGTT GATCGCTCGC 
ACCCGGCGTG GTCTGCTCCT CACCAGTCTG TGGTACATCC GCGAGGTTGA TCTCGCCACG 
ATGGCCCTGA CCGGGCTGAC CCGGGATGGT GTGTTCCTGG TGGAGGAGGG GGAGGTCGTC 
GGGGCGGTGC ACAACTTCCG GTTCAACGAC AGCCCACTGG CCATGGTCGG CCGGGTCGTC 
GAGGTGGGGC GCACCCTGCC CACCCGGGCT CGGGACTGGG GGGACGCGGT GGGCCCCACC 
GCCATGCCGA TGCTGCGGGT GCGGGACGTC CGGCTGACCG CCGTGACGCG TGCCCGCTGA

Protein sequence

MRGPRPTDAV ETALSASRSD ACVVIVEHGA ERHLRWADSE LIGTGDVDTC QVSVVSVVGD 
RVGAVTVSGR ADRAEIVAVV RAAEAAARQA PPAEDARPLP ASGAESPHWD AALPAPSSAV 
LAGLVDQLTE GFARARRNGQ ALYGYAEHRR RTTFLGTSTG VRLRHDDRAG YLELTAGDRD 
GTPAWTNAVT TEFDDVSVRE LQDELDRRLR WGRRSIELPP GRYECLLPPS AVADLMNYAY 
TTAGARAAAQ GRSVYSRPGG RTRVGEVLSD VPLTLRSDPA ADRLRCPPFL VTSSSTGTRS 
VFDNGLPLGP TSWWERGRLR SLVHTRASAE ELGAPLTPMV DNLVLDGPPG GGDTAELIAR 
TRRGLLLTSL WYIREVDLAT MALTGLTRDG VFLVEEGEVV GAVHNFRFND SPLAMVGRVV 
EVGRTLPTRA RDWGDAVGPT AMPMLRVRDV RLTAVTRAR