Gene Sare_0940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0940
Symbol
ID	5708051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1064028
End bp	1065446
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	72%
IMG OID	641270458
Product	hypothetical protein
Protein accession	YP_001535846
Protein GI	159036593
COG category
COG ID
TIGRFAM ID	[TIGR02958] secretion protein snm4

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.462432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGGTA TCGACGGCGG TATGGTTGCC GTTGCGCCGC CAGCCGCGAC AGCGGGGGAC 
GTGTGCCGGA TCACCATCGA CACCGCGGCG GGACGCGTTG ACCTCGCGGT GCCGGTCGAC 
ACACCGATGG CCGAGGTACT CCCGCTGGTG GTCCGCCACG TTGACCCTGC ACTGACCGGT 
AGCGGCGCCA CCGCCACGTA CGTGTTGCAA CGCCTCGGCG AGAGGGCCCT CGACGAGGAC 
CGTACCCCAG CCGCGTTGGG GCTACGGGAC GGCGACGTGC TGTACCTGCG GCCCAGCGAG 
GATCCGCTGC CGCCCATTGA TGTGGACGAC GTCGTGGATG GTGTCGGGGC GGTGATTCGA 
GACCGGCCGG ACGCCTGGCA TCCGGGGTAC ACCCGCCGAC TCCTGCTGGG CCTGACCGTG 
ATGGTGCTGG CGGGGATGCT CATCGGCCTG CTGCTTCCTG CTCCGGCGGG GTGGCGCGCC 
GGCGCCGCGG CAGGCGTCGC CCTGTTCCTC GTCGCCGCGA GTGGCACCAG TTCCCGCGCA 
CTCGGCGATG GGGGCATCGG CGTCCTGCTC GGGATTGCGG CGGTGCCGTT CGCCGGACTG 
GCCGGAGCAT CGGTGCCTTT CGCGGCCGGC GCCGACGCCT GGAACGGCAC CCAGCTGATG 
GCCGCCGGGG CGGCGGCCAC CGCGACCGCG ACAGTGGTGG CGCTCGCGGT GGCGGTTGCG 
CGGCCACTGT TCGTCGGGAT GGCGGTTGCC GCTGGATACG CCGTGCTCGC AGGTGTCCTC 
ATCGTCGCGA TGAGGACGAG TGGGGTCGGT GCGGCGGTGA TCGTGGCCAG CCTCGCCTAC 
TTCACCGGCG TGGCCAGCCC TACCGTGGCT GTCCGAGTTG CCCGCCTGCG CCCGCCGCGG 
CTTCCGACCA CAGCCGAGGA ACTCCAACAG GACATCGACC CAATCCCCGA GGACCTGGTG 
CGGTCCCGTA CGGTCGTCGC CGACCGGTAC CTGTCGGCGT TGTTCGCCGC CGCTGGTGCC 
GCCGTGGTGG CGGCCCTGGT GGCGCTTTCC ACCGACGCGG GGTGGGCCCC GACATCGTTC 
GTCGTCGTGC TCAGCCTGGC GCTGCTGCTG CGCGCGCGGA CACTGGTGAA CGCCTGGCAA 
CGGCTCGCCA CCGCCGTGCC CGGCGCGGTC GGTCTGCTCC TGCTCGCGCT GGCGCTGGCA 
GCCCGTGCGG ACGCCTCAGC CCGCAGCGCA CTGCTGACGG TGGGAGCGGT CTGTGTCGGC 
GCCATCGTCG CCGTGGTGCA CCACCTGCCG CCACACCGCT CGTCGCCGTG GTGGGGCCGG 
TCGGCCGACG TTCTGGAGAC ACTGGCTGCG ATCGCCATAG CTCCGTTGGC ACTTGCCGTG 
CTGGGCGTCT ACGCCCGGGT ACGCGGACTG GGTGGCTGA

Protein sequence

MTGIDGGMVA VAPPAATAGD VCRITIDTAA GRVDLAVPVD TPMAEVLPLV VRHVDPALTG 
SGATATYVLQ RLGERALDED RTPAALGLRD GDVLYLRPSE DPLPPIDVDD VVDGVGAVIR 
DRPDAWHPGY TRRLLLGLTV MVLAGMLIGL LLPAPAGWRA GAAAGVALFL VAASGTSSRA 
LGDGGIGVLL GIAAVPFAGL AGASVPFAAG ADAWNGTQLM AAGAAATATA TVVALAVAVA 
RPLFVGMAVA AGYAVLAGVL IVAMRTSGVG AAVIVASLAY FTGVASPTVA VRVARLRPPR 
LPTTAEELQQ DIDPIPEDLV RSRTVVADRY LSALFAAAGA AVVAALVALS TDAGWAPTSF 
VVVLSLALLL RARTLVNAWQ RLATAVPGAV GLLLLALALA ARADASARSA LLTVGAVCVG 
AIVAVVHHLP PHRSSPWWGR SADVLETLAA IAIAPLALAV LGVYARVRGL GG