Gene Sare_3463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3463
Symbol
ID	5708065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3994409
End bp	3995647
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	74%
IMG OID	641272890
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_001538256
Protein GI	159039003
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0116181
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCC CGCGTGAGCC CACCGGGCCG CCCGACGCCG CGTCGGCGCG GGCAGGCACC 
GGTTCGAGCC CCGCCGCTGA CCTCGGGACG AGTGATCCGT TCGGAACTCT CGCCCCCCGG 
TACGGCGAGG CAAGCCTCGC CGACATCCTG CCCGCCGCGC TCGCGGCGTT GGGAGTGCCC 
GGTGCGACCG ACGTGCTCGG CCTGACCGCC GCGCTCGATG GTGTGCGCCG GATCGCCGTG 
CTGCTCGTAG ACGGGCTTGG CTGGCATCAG ATCCCCACCG CCGCGCCGTA CGCGCCGACT 
CTGGTCGGGC TGGCCACGAC CGCCGGTCGC CCGCTCACCT CCGGCTTTCC GTCTACCACT 
CCGACCAGCC TGGTGACCCT GGGCACTGGC ACCGTCCCCG GCGCGCACGG TGTGCTCGGG 
TTCACCCTGC GGGTCCCCAA CACCGGCCGG GTGCTCAACC ACATCGACTG GGCCGGCGAT 
CCGGAGCCGC TGCACTGGCA GCCCGTCCCC ACCCAGCTGG AACGGGCCCG TGCCGCCGGT 
GTGCAGGTGA CGGTGGTGAG CCGGCCCGAG TTCGGCGGCA GCGGGCTCAC CCTGGCTGCC 
AACCGGGGCG GCGACTACCG CGGCGCGGCG GGCGTTGACG AGCTGGGTCG GGAGATGTTG 
GCCGCGCTGA CCGCCGGAAC CGGGCCCACC CTGGTCTCCG GCTACCACCC CGACCTCGAC 
CGGCATGGCC ACCTCAGCGG GGTCGATTCG GCGCCCTGGC GGGCCGCCGC GGCCGACGTC 
GACCGGCTGC TGACCCGTCT CGTGGAGGGG CTGCCACCGG ACGCCGCGTT GCTGGTCACC 
GCCGACCACG GTCAGCTCGA CATACCAGCC GAGCACCGGT TCGACCTGGA CACCGATCCG 
CGCCTGCGTG CTGGCGTGAC CGTGGTGGCC GGCGAGCCCC GGGTCCGCTA CCTGCACGTA 
CGGCCCGGTG CCCGAGACGA CGTGGTGGCC ACCTGGTCGG CAGTACTCGG CGCCGCGGCC 
CGGGTCACGA CCCGGGCGGA GCTGGTGGCA GCCGGCTGGT TCGGTCCGGT GCCCGAGGAA 
CACCTGGGCC GGATCGGGGA CGTGGTGGTG GTCTGCAACG GCAGCTACGC CGTGCTGGCC 
ACTCGTTCGG AGCCGCCGAT AGCGAGTCGA CTGGTGGCGT ACCACGGCTC GGACACCGCG 
GCGGAGATGA CGATTCCATT GCTGGTGGTC CGAGGCTGA

Protein sequence

MTGPREPTGP PDAASARAGT GSSPAADLGT SDPFGTLAPR YGEASLADIL PAALAALGVP 
GATDVLGLTA ALDGVRRIAV LLVDGLGWHQ IPTAAPYAPT LVGLATTAGR PLTSGFPSTT 
PTSLVTLGTG TVPGAHGVLG FTLRVPNTGR VLNHIDWAGD PEPLHWQPVP TQLERARAAG 
VQVTVVSRPE FGGSGLTLAA NRGGDYRGAA GVDELGREML AALTAGTGPT LVSGYHPDLD 
RHGHLSGVDS APWRAAAADV DRLLTRLVEG LPPDAALLVT ADHGQLDIPA EHRFDLDTDP 
RLRAGVTVVA GEPRVRYLHV RPGARDDVVA TWSAVLGAAA RVTTRAELVA AGWFGPVPEE 
HLGRIGDVVV VCNGSYAVLA TRSEPPIASR LVAYHGSDTA AEMTIPLLVV RG