Gene Sare_3867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3867
Symbol
ID	5705898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4402306
End bp	4403865
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	71%
IMG OID	641273288
Product	alkaline phosphatase
Protein accession	YP_001538650
Protein GI	159039397
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3540] Phosphodiesterase/alkaline phosphatase D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.261965
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00291671
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGAGT TCGATCGACG TATGCTGCTG CGTGCCGGCC TGGCGGTGGG TGCGGGAGCC 
GCCGGTGGTG TGCTCCTTGG TGGTGCCGGT GTCAGCGCTG GGCCAGCCGC TCCGGGGTGG 
CGCCCGGCCG GCCGTCCTGT TTTGACGCAC GGGGTGCAGA GCGGCGATGT GTCCGCCGAG 
TCGGCGGTGG TGTGGACCCG GGCCGACCGG CCTGGCCGGA TGCTCGTGGA GGTGAGCCGC 
CGGCCCGACC TGCGGGACGC CCGGCGCCTG CGGGGGCCGG TGCTGGACCC GGCCGGGGAC 
CTCACTGGCA AGATGCGCCT GCGGGGCCTG CCGGCCGGCG AGCGCTGGTA CTACCGGGTT 
CGCGTGGAGA GCCTGGACCG GCCGGGGCTG TGTAGTGAGC CGCTGACCGG GTCGCTGCGT 
ACCGCCCCCA GGGGGCGCAT GCGGCGCGAC ATCCGGTTCG TCTGGACCGG GGACATCGCT 
GGACAGGGCT GGGGTATTGC CCCCGATTTC GGCGGTATGT CCATCTTCGC CGCCATGCGC 
GCCGCCCGCC CCGACTTCTT CATCTGTAGC GGCGACACGG TGTATGCCGA CAACCCGTTG 
ACCGAGACGG TGCCGCTGCC CGATGGGCGG ATCTGGCGGA ACCTCGTCAC CCCGGAGAAG 
AGCAAGGTGG CCGAGACCCT GGCGGAGTTC CGGGGGCAGT ACGCGTACAA CCTGCTCGAC 
GAGCACCTGC GTGCGTTCGT TGCCGAGGTG CCGCAGGTCA ACCAGTGGGA CGACCACGAG 
GTGACGAACA ACTGGTACCC GGGTGAGGTG CTGGCCGACG ACCGGTACAC CGAGAAGCGG 
GTCGACGTGC TCGCCGCCCG TGCTCGGCGG GCGTTCGACG AGTGGTTGCC CACCCCGGTC 
CGTGGACCCC GCTACCGACG GCTGTCGTAC GGGCCGTTGT TGGACGTCTT CGTGCTGGAC 
ATGCGCACAC ACAAGGACCC GAACGACGGG AACACCTACC CTGACCCGAA CCGGGGGTTG 
CTCGGCCGGG AGCAGCGGGA GTGGCTGATC CGTGGGCTGA CCCGCTCCCG GGCGACGTGG 
AAGGTGATCG CCGCCGACCT GCCACTCGGT TTGGTGGTGC CGGACGGTGC GGCCCAGGAG 
GGGGTGGCGC AGGGCGACCC GGGGGCGCCG GCGGGCCGGG AGCTGGAGTT CGCCGAGGTG 
CTCACGGCGG CCCATCGGGC CGGGGTGAGC GGCATCGTCT TCCTCACCGC CGACGTTCAC 
TACACCGCCG CCCACCACTA CGACCCGGCC CGGGCGGCAA TCGACGACTT CACGCCGTTC 
TGGGAGTTCG TCTCCGGTCC GGCGCACGCT GGTGCGTTCG GCCCGAGCCA GCTGGATGGC 
ACGTTCGGCC CGAAGGCGGT CTTCGTCAAC GCACCACCTG CCGCGAACAC CAGCCCCGCA 
GCCGGTTTCC AGCACTTCGG CGAGGTGCAC ATCGATGCCG GCAGCGGTGC CTGCACCGTC 
CATCTGCGCG ACCGCGCCGG CAGATCCCTC TGGACCACCA CCCTTCCCGC TCCGCGCTGA

Protein sequence

MTEFDRRMLL RAGLAVGAGA AGGVLLGGAG VSAGPAAPGW RPAGRPVLTH GVQSGDVSAE 
SAVVWTRADR PGRMLVEVSR RPDLRDARRL RGPVLDPAGD LTGKMRLRGL PAGERWYYRV 
RVESLDRPGL CSEPLTGSLR TAPRGRMRRD IRFVWTGDIA GQGWGIAPDF GGMSIFAAMR 
AARPDFFICS GDTVYADNPL TETVPLPDGR IWRNLVTPEK SKVAETLAEF RGQYAYNLLD 
EHLRAFVAEV PQVNQWDDHE VTNNWYPGEV LADDRYTEKR VDVLAARARR AFDEWLPTPV 
RGPRYRRLSY GPLLDVFVLD MRTHKDPNDG NTYPDPNRGL LGREQREWLI RGLTRSRATW 
KVIAADLPLG LVVPDGAAQE GVAQGDPGAP AGRELEFAEV LTAAHRAGVS GIVFLTADVH 
YTAAHHYDPA RAAIDDFTPF WEFVSGPAHA GAFGPSQLDG TFGPKAVFVN APPAANTSPA 
AGFQHFGEVH IDAGSGACTV HLRDRAGRSL WTTTLPAPR