Gene Sare_3958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3958
Symbol
ID	5704909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4498132
End bp	4499103
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	71%
IMG OID	641273383
Product	NLP/P60 protein
Protein accession	YP_001538739
Protein GI	159039486
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0791] Cell wall-associated hydrolases (invasion-associated proteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.068937
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.125379
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCGTCCA ACCGGAAACG GCTGCCCGCC CTCGCGGTCG CAATGATGTC GGTCGTACTG 
GTCGCCCCGG GCGTGCCCGC CCGAGCCGAC CCGTCTCCCG CCGAGTTGAC CCGGCGGATC 
GAGAAGGCGT CCGCGGAGTT GGCACGCATC GTGGAGGCGT ACAACACCCT CGCCGAGGAC 
CTCGAGGCGA ACCAGTCCGC CCTGGCCCGA CTGGCGGCCC GGCTCGGTCC GCTGGAGCGG 
CAGGTCGAGC GAAGCCGGGC CGAGGTCAAC CAACTGGCCG TCACCGCGTA CAAGACCGGT 
GACCTCGGTC CCGCGGCAGC GTTGCTACAT CCGGACGATG CCACGGTTCT GCTCGACCGA 
CTCACCACCG TCGACCGACT GGCCCAGGAA CGGCGGAAGC GCATCACCGC CTTCGCCAAC 
GACCAGCGGG AGCTCCTCGA GGAGCGGACC CGCCTGGATG CCGCCGTGGG GCAGGCGACG 
GCGCGGGCCC GAGGGCTGAC CAGCACCCGC CAGCGCATCG AGCGTGACCT GGCCGAACTG 
TACGAGTTGC GGCGGCGGGC GTACGGCCGG GCGACCGAAC GCCCTGCGGC CAGCCCGGAC 
AGTACCCAGA AGGCACCGTC TGTGCCCGGC GCGGCCGGGG TGGCGGTGCG GTACGCGTAC 
GGGGCGCTGG GCATGCCCTA CCGGTGGGGC GACGACGGCC GTACCGGATA TGACTGTTCG 
GGCCTGACCT CGGCTGCCTG GCGAGCGGCC GGGAAGTCGC TGCCGCACAG CACCCGACGG 
CAGTGGGGTG TGGTGGCTCG CATCGACCGC CACGACCTGA GCCCCGGCGA CCTGGTTTTC 
TACCGAGGGC TCGGGCATGT GGCCCTCTAC GTCGGCGGCG GGCAGATCAT TGACGCTCCC 
AACGCGGGGC GCAACGTCGT CAAACGCGAC ATGGACATTA TGTCGATCGT GGGATATGGC 
CGGGTCCGCT GA

Protein sequence

MSSNRKRLPA LAVAMMSVVL VAPGVPARAD PSPAELTRRI EKASAELARI VEAYNTLAED 
LEANQSALAR LAARLGPLER QVERSRAEVN QLAVTAYKTG DLGPAAALLH PDDATVLLDR 
LTTVDRLAQE RRKRITAFAN DQRELLEERT RLDAAVGQAT ARARGLTSTR QRIERDLAEL 
YELRRRAYGR ATERPAASPD STQKAPSVPG AAGVAVRYAY GALGMPYRWG DDGRTGYDCS 
GLTSAAWRAA GKSLPHSTRR QWGVVARIDR HDLSPGDLVF YRGLGHVALY VGGGQIIDAP 
NAGRNVVKRD MDIMSIVGYG RVR