Gene Sare_4963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4963
Symbol
ID	5706485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5637008
End bp	5638150
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	75%
IMG OID	641274358
Product	peptidoglycan-binding LysM
Protein accession	YP_001539700
Protein GI	159040447
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.867782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.121696
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACAC CGGCTCGTGT CCTCGGACGG GTCCTCACCG GGTTCGGCGC GCTTGCCCTG 
CTCTGCGCGT TGCTGATCAG CGCCCCGATG GCGCTGCTCG CGTTCGCCGG TAACCCCCTG 
CCGGCGCAGG TGCCCACCCT CGACGAGGTC GGTGCCATGC TGACCACCCG AGACGACGGT 
CAGCTCTTCC TCCGAGCACT GGCCTTGGTC GGCTGGGCGG GCTGGGCCAC GTTCGCCCTG 
TCGGTACTGG TCGAGCTGGG TGCTCTCGCC TGCCGGCGCC CCGCACCCCG GTTGCCGGGG 
ATGAACCGGC AGCAACGGGC CGCCGCCGCG TTGGTCGGCT CCGTCACGTT GATCTTGGCA 
GCCAGTCCCG TGGCGGCGAG CGCGGCGGCG GTGGCGGGGC CGCCGGCACC CGCTGCCACC 
TCGGTCAGCG TGGCGCTACC ACCGTCCCCG GTGGAACGCC CAGTGCTGGT CGCGCTGCCC 
GAGCCGGTGC GGCAGCAGGC GGTCAGCGCG GCGCCGAGCA CCGCGCGGAC CGCAGAACCG 
GAGCGGGAAC CGGTCTACCG GGTGGCCCGG GGCGACCGCC TCGGATCGAT CGCCGCGCGG 
TACCTGGACG GTTTCGACGA CTACCCGACC CTGGCCCGGC TGAACCGGTT GGCCGACCCG 
GACCGCATCC ATCCAGGTCA GCTCCTGCGG CTACCCACCA GGGCCCAGGA CCGTGGTGCC 
GGCCCCCACG CCACCGGGCG GCTGGTCGCG CGCCCGACCC CGCCCCGGCC GTCCGCACCG 
GCAGCGGCGC CGGCCGGGCC GTCGACGCGA CCATCGGTTT CGGACACGGC GGTTTCGGAC 
GCCTCAGTCT CGGATACATC GACGACGGGC GCGTCGGCGT CGAACCGGAC AGGCCCGGAC 
CCGGTGCAGG ACGTGCCGAT CGTGGCCGTG GGCGCGGCTG GGCCGGGCGA CCCGAGCCGG 
GTGAATCGGC CGCTCGCGGT GTCGGCGGTC CTCGCCGCGT CGGGCATCGT CGGCGCGCAG 
ATCGGTGCGG TGCTCGGCCT GCGGCGGCGT CCGGCGACCG CTCGTGCCGG AACCGACCGT 
AAGGCGGCGC CGACCGGCCG AGGGCAGTGG GAACTGCCCG CTGGCCGGCA CCGGCGGGAG 
TGA

Protein sequence

MLTPARVLGR VLTGFGALAL LCALLISAPM ALLAFAGNPL PAQVPTLDEV GAMLTTRDDG 
QLFLRALALV GWAGWATFAL SVLVELGALA CRRPAPRLPG MNRQQRAAAA LVGSVTLILA 
ASPVAASAAA VAGPPAPAAT SVSVALPPSP VERPVLVALP EPVRQQAVSA APSTARTAEP 
EREPVYRVAR GDRLGSIAAR YLDGFDDYPT LARLNRLADP DRIHPGQLLR LPTRAQDRGA 
GPHATGRLVA RPTPPRPSAP AAAPAGPSTR PSVSDTAVSD ASVSDTSTTG ASASNRTGPD 
PVQDVPIVAV GAAGPGDPSR VNRPLAVSAV LAASGIVGAQ IGAVLGLRRR PATARAGTDR 
KAAPTGRGQW ELPAGRHRRE