Gene Sare_1115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1115
Symbol
ID	5706058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1258694
End bp	1260274
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	72%
IMG OID	641270630
Product	metallophosphoesterase
Protein accession	YP_001536014
Protein GI	159036761
COG category	[R] General function prediction only
COG ID	[COG1408] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.190762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00561367
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGGTC AGGAGAACGA GCAGCAGGAC AGCCAGGGTG GCCAACCGTC GGAGACCGGC 
CGGACCCGAC GGGTTCCGCT TCGCCGCCGG GCACCCGACG GCCGCCCCGC CCGCTGGCGG 
GCGCTGCGAG CCGTCGGGAT GACGCTGGCC GTGCTCGCCG TGACCCTGGC TGGGGTCCTG 
ATCGGCACGC TTGCCGGTGG CCGGGTCAGC ACCGACATCG GGCCGTTTCA GGCGAACCTG 
TCCCTGGCTC CGGCGCTGCA CGGCGGCACC ACCATCGACG TACCCCCCCT CGGCGCGCTG 
CTGCTCGACA GCCACGACGG GCCCACCCAG CTGACGGTGC AGTTCGGCGC CCTCGACCAG 
GGTCGCACCG AGGCCCTCCT ACACGACCCG GCCAGCCTCA GCCGGGCGAG CCAGACCGCC 
GTCGACGACG TCCGTGCGGG CGTCCTGCAG CTCGGTGTCC GCACGATCGC CGCCACGGTT 
CTGGTCACCC TGGTGCTGGC CCTGCTGGTG TTCCGCGACA CCCGCCGCGC GGCCTGGGCG 
GGGGTGCTCG CACTGGTGAT CGCCGCGGGC AGCCTGGGCA CCGCGGCGGC CACTCTGCGG 
CCCCAGGCGA TCGAGGAACC GCGCTACGAG GGGCTCCTGG TCAACGCGCC GGCACTCGTC 
GGAGACGCGC GCCGGATCGC CAACGACTAC ACCCGCTACG CCGAGCAGCT CCAACGCATC 
GTCGGCAACG TCAGCCAGCT CTACACCACC GTCTCGGCGC TGCCGGTGTT CGAGCCGGAG 
CCCGGCACCA CGCGCGTACT ACACATCTCC GACATGCACC TCAACCCGGC TGCCTGGCAG 
GTCATCCGGA CCGTGGTGGA GCAGTTCGGG ATCGACGTCG TGGTCGACAC CGGCGACATC 
ACCGACTGGG GCAGCGAACC GGAGGCGAAC TACGTCGCCT CAATCGGGCT CCTCCAGAAG 
CCCTACGTCT TCATCCGCGG CAACCACGAC TCGGGGAGCA CCGCCGCGGC CGTGGCCCAG 
CAGCGCAACG CCATCGTGCT GGACAACACG ACCACCACCG TCGCCGGGCT GACCATCGCC 
GGAATCGGTG ATCCGCGCTT CACGCCGGAC AAGAGCACCT CGCCGGCGGG CAGCGGCCTG 
ACCCAGGAGA CCGCCGACCA ACTCATCGAC GTCGGAGACC AGTTGGCGGC CACGGCCCGC 
ACCTCACCCC GGCCGGTGGA CCTGGCGCTG GTGCACGACC CCGCGTCGGC GGGGCCGCTC 
GCCGGCGTCA CCCCGCTGGT GCTCGCTGGG CACACGCACA ACCGGGAGGT GCACCGGTTG 
CCCCAGGAGC CCGACCAGTC CCCGACGCTG CTGATGGTGC AGGGCTCGAC CGGCGGCGCC 
GGCCTGCGGG GCCTGGAGGG CGAGCAACCC ACCCCACTGT CGATGACCGT CCTCTACTTC 
GACGAGGAGA AGCTGCTCCA GGCGTACGAC GACATCACCG TGGGTGGCAC CGGCCAGGCT 
CAGGTGAACC TCGAACGACA CATCGTGGAG GACCCGAAGG CCGGCGAGCC CGCCCCGGTC 
ACCCCCACAC CGACCCGCTG A

Protein sequence

MDGQENEQQD SQGGQPSETG RTRRVPLRRR APDGRPARWR ALRAVGMTLA VLAVTLAGVL 
IGTLAGGRVS TDIGPFQANL SLAPALHGGT TIDVPPLGAL LLDSHDGPTQ LTVQFGALDQ 
GRTEALLHDP ASLSRASQTA VDDVRAGVLQ LGVRTIAATV LVTLVLALLV FRDTRRAAWA 
GVLALVIAAG SLGTAAATLR PQAIEEPRYE GLLVNAPALV GDARRIANDY TRYAEQLQRI 
VGNVSQLYTT VSALPVFEPE PGTTRVLHIS DMHLNPAAWQ VIRTVVEQFG IDVVVDTGDI 
TDWGSEPEAN YVASIGLLQK PYVFIRGNHD SGSTAAAVAQ QRNAIVLDNT TTTVAGLTIA 
GIGDPRFTPD KSTSPAGSGL TQETADQLID VGDQLAATAR TSPRPVDLAL VHDPASAGPL 
AGVTPLVLAG HTHNREVHRL PQEPDQSPTL LMVQGSTGGA GLRGLEGEQP TPLSMTVLYF 
DEEKLLQAYD DITVGGTGQA QVNLERHIVE DPKAGEPAPV TPTPTR