Gene Sare_3113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3113
Symbol
ID	5706553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3539843
End bp	3541018
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	76%
IMG OID	641272545
Product	hypothetical protein
Protein accession	YP_001537912
Protein GI	159038659
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.7351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0332938
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGGTCA CTGCCCGGGG GGTCGGGTTG TTCGTCGCCG CCGGTGTGCT GCTGGCGGCC 
GGGTTCCGGT TCGCGTACCC GGAGCTGGCG CTGCTGGGCG CGGCGGGGGC GACCGCCGGC 
GGCTACGCGG TGGCGGTTGC CGCGTGGCGG CCCCGGTTGG CGGTGGTTCG CCGGGCTGAA 
CCGGACCGGG TTTCCCGCGG TGAGCCGGCG ACGATGACGG TGACCGTCCA CAACAGGGGA 
CGGCTGCGGT CGGCGAACCT GGTCGCCGAG GACCGCTGTG GTGCGGTGCC GGTGGCGGTA 
CCGGTGCTGC GGCTGCGGCC GGGGCGGGAC ACCACGGTCC GGTACGGCGT GCCGACGACA 
CGGCGGGGCG TGGTGCCGGT GGGGCCGCTG CGGGTGATCC GGCGCGACCC GCTGGGCCTG 
GTCTCACTGT CCCGTCCGTA CGGTGAGACG GTGCCGGTGT GGGTGCATCC GCGGGTCCAT 
CCGCTGAGCG TGGTGCCGAC GGGCGCCGGG CGCAGCCTCG ACGGCCAGGT GGACGCTGTC 
CCACACGGTT CGATCACCTT CGACTCACTA CGGGAGTACG TGGTCGGTGA CGAGCTGCGC 
CGGGTGCACT GGCGGACCAG CGCGCGGGTG GGTGAGTTGA TGGTCCGGGA GAACGTGGAC 
ACCAGCCTGC CTCGCCTGGT GGTGTTGCTG GACAACCGGG CGGTGGCCCA TCCGCAGCGG 
TCCGCCGGTC TCGCGGAGTC GTTCGAGGCG GCGTGCGAGG CGGCGGCGTC GGTGCTGACC 
GCTGCGCACC GGTCCGACCT GCCGGTGGTG CTGGTGCTGG TGGCCCCGGA GGACGAGGGC 
AGCCGCGCGG GTGTGGCGGA GTCCGAGGCG GCGCGGTCCG GGCTGTCTCC GCTGGACCGG 
CTCGCGGCGG CGGGGCTCGG CGGCGACACC CTCGACGCCA CGCTGACCCG GCTGCGGGGG 
GAGCGCCGCG GCGACACGCT GGTCGCGCTC ACCGGCCCGG GTGGACGGGA CTCGCTCGGC 
CAGTTCGGTG CGCTGCGCGG CGCGTACCCG TCGGTGGTCG TCGGGGTCTT GGCGGCGGCG 
GAGCCGGCGC AGGCGCAGAC GGCCGGTCTG GTGGTGATCG ACGCTGCGGA CGGGGCGGCG 
TTCGCGGCCG AGTGGGATCG GGTACGGCGG TGGTGA

Protein sequence

MGVTARGVGL FVAAGVLLAA GFRFAYPELA LLGAAGATAG GYAVAVAAWR PRLAVVRRAE 
PDRVSRGEPA TMTVTVHNRG RLRSANLVAE DRCGAVPVAV PVLRLRPGRD TTVRYGVPTT 
RRGVVPVGPL RVIRRDPLGL VSLSRPYGET VPVWVHPRVH PLSVVPTGAG RSLDGQVDAV 
PHGSITFDSL REYVVGDELR RVHWRTSARV GELMVRENVD TSLPRLVVLL DNRAVAHPQR 
SAGLAESFEA ACEAAASVLT AAHRSDLPVV LVLVAPEDEG SRAGVAESEA ARSGLSPLDR 
LAAAGLGGDT LDATLTRLRG ERRGDTLVAL TGPGGRDSLG QFGALRGAYP SVVVGVLAAA 
EPAQAQTAGL VVIDAADGAA FAAEWDRVRR W