Gene Sare_0846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0846
Symbol
ID	5705948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	946740
End bp	948143
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	73%
IMG OID	641270364
Product	hypothetical protein
Protein accession	YP_001535755
Protein GI	159036502
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.421105
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCGT CCACCGCGCC GCCGTCCCAG GCAGAGCAGC CGGAGCAGAC CGGCGGCTGG 
GTGCCGACTC GGGCCCTGGG CCGGGCCGTG CTCCTGACCG GACTGCTCCT GATCGCCGGC 
GTGCTGCTCG GGCGCGTCGA CCTGGTCGTG CTGGCTGCCC CGTTCGCGAT CGGCACCGCG 
TACGCCCTGC GACGTCGGCC CGCCGCGGTG CCACAGGTCC GGATCGCCAC CGCGGAGGGG 
AACCTGGTGG AGGGCGGTGA ACTGGCTGGA CGGATCACCG TCGGAAACCC GGATTCGGTC 
GACTACGACC TCGCCGTGGT CCGCAGCCGA ACGTCGCCGT GGCTGCGGGT CGACCGCGTG 
ACGATCGCCG GTGTGGCGGT GGCCGCTGCC GCGCCAGAGG CCGGCCGGTC GATCGCCGAC 
CGTCCGTTGG TGACCGCCGT ACCGGCCGGC GAGGTGGTCG ACGTGGACCT GTCCGGCACT 
GCGCGACGGT GGGGCCGGCA TTCGCTGGGT CCGGCCGGAA CCCAGGCTTC CGCCGCGCTC 
GGGCTCCTGG TTTCACCCCC GGTGGTCACC GAAGCGATCC AGGTGAGTAC CTATCCGGTG 
ACCGACCCGT TCGACGCGGT GGAGGCGATG CCCCGCGCGG CGGGCCTGGT CGGCGCACAC 
CATTCGCGAC GCCCGGGCGA AGGCGGCGAG CTGGCCGGTG TGCGGGTCTT CGCCCCCGGC 
GACCGGCTGC GCCGGATCGA CTGGCGGGTC TCACTGCGGG CGCGGCAACT GCACGTCGCG 
GCAACCCTCT CCGACCGGGA CGCCGAGGTG GTGGTGCTGC TCGACGTGCT CGCGGAGGCA 
GGTCGCTCCG GTGGGGTCGG CGGTACCGCG TCGGTGCTGG ATACGACGGT TCGGGCTGCC 
GCGGCGATCG CGGAGCACTA CCTGCACCGC GGCGACCGGG TGTCGATGGT GGAGTACGGT 
CCGGCCGGTC GCCGGTTGCG TCCCGCCACC GGCCGCCGCC AGTTCCTGAC GGTTCTGGAG 
TGGTTGCTCG ACGTGCATCC GCAATCCTCC CCACACGAAC TCTACGACTC GGTGCTCGGA 
TCACAGATGC TGTCGTCGGA CGCATTGGTG GTGGTGCTCA CGCCCCTGCT GGACGAGCGG 
TCCGCGCAGA TGCTGGCCCG GTTGGCCTGG TCCGGGCGCT TCGTCGTCGC GGTCGACACC 
CTGCCCATCG ACCTGACCCC GCCCCGGGAC CGGGGCTGGG CGGAGGCGGC GCACCGGCTG 
TGGCGGCTGG ACCGGGACAC GATGGTGCGT CAGCTGCGGG AACACGGCGT ACCGGTGGTG 
CGGTGGGCCG GCGCCGGCAG CCTGGACGAG GTGCTGCGTG ATGTGGCCCG GCTCGCCACA 
GCTCCGAGAG CGGGGGCCCG GTGA

Protein sequence

MTPSTAPPSQ AEQPEQTGGW VPTRALGRAV LLTGLLLIAG VLLGRVDLVV LAAPFAIGTA 
YALRRRPAAV PQVRIATAEG NLVEGGELAG RITVGNPDSV DYDLAVVRSR TSPWLRVDRV 
TIAGVAVAAA APEAGRSIAD RPLVTAVPAG EVVDVDLSGT ARRWGRHSLG PAGTQASAAL 
GLLVSPPVVT EAIQVSTYPV TDPFDAVEAM PRAAGLVGAH HSRRPGEGGE LAGVRVFAPG 
DRLRRIDWRV SLRARQLHVA ATLSDRDAEV VVLLDVLAEA GRSGGVGGTA SVLDTTVRAA 
AAIAEHYLHR GDRVSMVEYG PAGRRLRPAT GRRQFLTVLE WLLDVHPQSS PHELYDSVLG 
SQMLSSDALV VVLTPLLDER SAQMLARLAW SGRFVVAVDT LPIDLTPPRD RGWAEAAHRL 
WRLDRDTMVR QLREHGVPVV RWAGAGSLDE VLRDVARLAT APRAGAR