Gene Sare_4752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4752
Symbol
ID	5705343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5377536
End bp	5378939
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	75%
IMG OID	641274150
Product	hypothetical protein
Protein accession	YP_001539496
Protein GI	159040243
COG category
COG ID
TIGRFAM ID	[TIGR02958] secretion protein snm4

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000148425
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTGTCG GCCTGGCCCG GGTCACCATC AACGCTCCGC ACCGGCGGCT TGACGTGGCC 
CTGCCAGCGC AGGTCCCCCT CGCCGACCTG CTTCCCGAGG TGCTGCGACA CGCAGGCGAA 
GGGCTCGCCG ACGACGGCGA GCGGCACGGC GGCTGGGTGC TGCGGCGCAG CGACGGTGGG 
GAACTGGCCA CCGCCCAGCC GTTGCAGCCC CAGGGCGTTC GCGACGGCGA GGTGCTGCAC 
CTGGTGCCGG CCCGCGCGCG GTGGCCGGAA CTGGAGTACG ACGATGTGGT CGAGGCGATC 
GCCGACGGGG CGCGGCGGCG CGGCGGCGCC TGGTCGCCGG TGAGCACCCG GGTCGCGACC 
CTCGCCGGCG CGGCAGTCCC GTTAGCCGTC GGGCTACTCG CCGTGACTGC CGCTGGACCC 
GGTCACTTCG CGGGTTGGCC GGTCGCCGCT GTGGTCGCCG TGCTGCTGAC CCTTGCCGGT 
ACGGCGGCCG CCCGGGCATA CGGGGACGGA ACGGCGGGCG CCACCCTGGC CGGATACGCG 
CTGCCGTACG CCGCTGTGGC CGGTGCGCTC GCGGTCAGCA GCGGAGACCA CGTGGGCCTG 
CTGCCCGGGC TGCGTTGGCT CGGCGTACCC GAACTGCTCG CCGGTGCGAC GTCGCTCTTG 
CTGGTCTCGG TGCTCGCCCT GGTCGGCGTC GCGGCCCGGG CGCGGGTGTT CGTCGCTGGT 
GTGGTCGTCG GGCTCGGTGG CGTGCTGGGC GCGGCGGGCG GGCTGGTGGT TGACGCCGCC 
GGTGCCGCCG CAGTGCTGCT CGCCGGGCTC GTCTTCGCGG TCGGGGCGAT TCCTCTCCTG 
GCCATTCGGC TCGGCAAGGT GCCACTGCCA CCGATCACCC TGCCTGTCGA GGACCTGGAT 
GGCGGCTCCT TTCCGGCGCG GGACCTGCCG GACCGGGAGC GGGTGCACGC CGCGGTCGCC 
CGGACCGAGG AGGTGCTGAC CGGGATGTTC CTCGGGCACG CTGCGCTGGC GGCCGTTGCC 
GCGGTGTTGC TCGGGTTCAC CGGCGGAACC GCTGGCTGCG CGTTGGTCGC CGTTACCGCG 
ACGCTCCTGC TGCTGCGTGC CCGGCTCTTC GTGGCGGTAC GACACCGGGC GCCGGCCGTG 
GTCGCCGGGC TCGCCGGCTA CGCCGTGCTC GGCGTCGCGC TGGCCAACCG GTTCGGTACC 
GACCTGCTGC CCATGCTGAC CCTCGGCGGA CTGGCACTGG CTCTGGCCGC TGTCGCGGCC 
GGCCACACCT ACGCGCGACG GCCGGTGTCG CCGTATGCCG GCCGAATCGC CGACCTGGCC 
GACACCGCCT TGGTGGTTTC CGTGGTCCCG GTCGCCTGCG CCGTGCTGGA CCTGTACGAA 
CGGGCCCAGG GGCTGCTCGG TTGA

Protein sequence

MTVGLARVTI NAPHRRLDVA LPAQVPLADL LPEVLRHAGE GLADDGERHG GWVLRRSDGG 
ELATAQPLQP QGVRDGEVLH LVPARARWPE LEYDDVVEAI ADGARRRGGA WSPVSTRVAT 
LAGAAVPLAV GLLAVTAAGP GHFAGWPVAA VVAVLLTLAG TAAARAYGDG TAGATLAGYA 
LPYAAVAGAL AVSSGDHVGL LPGLRWLGVP ELLAGATSLL LVSVLALVGV AARARVFVAG 
VVVGLGGVLG AAGGLVVDAA GAAAVLLAGL VFAVGAIPLL AIRLGKVPLP PITLPVEDLD 
GGSFPARDLP DRERVHAAVA RTEEVLTGMF LGHAALAAVA AVLLGFTGGT AGCALVAVTA 
TLLLLRARLF VAVRHRAPAV VAGLAGYAVL GVALANRFGT DLLPMLTLGG LALALAAVAA 
GHTYARRPVS PYAGRIADLA DTALVVSVVP VACAVLDLYE RAQGLLG