Gene Sare_1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1168
Symbol
ID	5704260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1315684
End bp	1317309
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	75%
IMG OID	641270686
Product	Dak phosphatase
Protein accession	YP_001536067
Protein GI	159036814
COG category	[R] General function prediction only
COG ID	[COG1461] Predicted kinase related to dihydroxyacetone kinase
TIGRFAM ID	[TIGR03599] DAK2 domain fusion protein YloV

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0701112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000069838
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCTGGACA CCCTCGATGC CGCCGCGGTC CGCCGTTGGT GCGCCGGTGG TCTGGTCGCA 
CTGAAGCGCC ACCAGGGCGA AATCGACCAC CTCAACGTCT ACCCGGTGCC CGACGGTGAC 
ACCGGCACGA ACCTGGTACT CACCCTCACC TCGGCGCAGC AGGCGCTGGC AATGGACCTG 
GACACGCTGC CCGACGACGG GCCCACCCCG CACGGGCAGG CGCTTCGGTT GATGGCCCAG 
GGCGCGCTGC TCGGTGCCCG CGGCAACTCC GGGGTGATCC TGGCGCAGAT CCTGCGCGGC 
TTCGCCGACG CGCTGGCCAC CGTTCCCGTG GTGCGGGGAC GGGCGGTGGC CGTCGCCCTG 
CGTACCGCCG CCACCGCCGC GTACGCCGCC GTCGTCGCTC CCGTCGAGGG GACGCTGCTC 
AGTGTGGTGG CCGCCGCGGC GGGCGCCGCC GAGCGGGCCG ACCGTGACGA GCTGGGCCCG 
GTGGTCCGGG CGGCGGCGGA CGAGGCCGTG CGGGCGCTCG ACCGTACCCC CCAACAGCTG 
CCAGCGCTGG CCCGCGCCCG AGTGGTCGAC GCCGGTGGGC GGGGCCTCTG CCTGCTGCTC 
GACGCCCTGG TCGAGGTGGT CACCGAGGAG CGGCCAGCGC GCCCGGCAGT CGCACCCGGG 
CCGATCCAGC CACCAGCCGT CGCGGTTCGG GGAAGCGGCT CCCCGACGTA CGCCTACGAG 
GTGCAGTACC TGCTCGACGC CGAGCCGGCC GCGGTGGACC GGCTACGGGC ACAACTGGTC 
GCCCTCGGCG ACTCGCTGAC CGTCGTCGGC GACGGCGCGA CGACCGGCGG CACCTGGAAC 
GTGCACGTGC ACGTCAACGA TGTCGGCGCG GCGATCGAGG CGGGAGTGGC CGCCGGCCGC 
CCGCACCGGA TCACGGTGAC CCGTTTCGCC GATCCGCCCA CGTCGCCGGC GGCGGCCCGG 
CCCGACCCGG CACCGGAGGG GCGGGCCGCT GTCGTGGTCG CCACCGGCGC CGGGATCGTC 
GAGCTGTTCA CGGCGGCGGA GGCGACGGTG GTGCCGGGCA GCCCGGCCCC CAACGAGCTG 
CTGAACGCCG TGCGCGCCAC CGGCGCCGCC AGCGTGGTGG TGCTGCCCAA CGACACGCTC 
ACCCAGGCCA TGGCGAGTGA CGCGGTCGAG GAGGCGCACC GGTTCGGCGT CAAGGTCAGC 
GTGGTCCCGA CCCAGTCGCC GGTGCAGGCG CTCGCCGCGC TCGCCGTCCG GGATCCGGGC 
CGGCGCTTCG AGGACGACGT GATCGCGATG GCCGAGGCCG CCGGCGCCTG CAGGTACGCG 
GAGATCTGCC ACGCCAGCCG GGAGGCACTG ACCATCGCCG GACCTTGCCG GAAGGGGGAC 
GTACTCGCCC TGGTCGACGG CGAGGTGCAC CTCATCGGGT CGGATCTGCT CGACACCTGC 
ACTGCCGTGG TGGACCGGAT GCTCGGCGGC GGCGGTGAAC TGGTCACCCT GCTGGCCGGG 
GCGGACGCCC CCGAAGGCCT GACCGAGGCG GTCCGCGAAC ACGTTTTGCG GTCCTGGCCG 
TTCGTCGAGG TGCACGTCTA CCCGGGTGGG CAGCCGCGCT ACCCGCTGCT GGTGGGGGTC 
GAATGA

Protein sequence

MLDTLDAAAV RRWCAGGLVA LKRHQGEIDH LNVYPVPDGD TGTNLVLTLT SAQQALAMDL 
DTLPDDGPTP HGQALRLMAQ GALLGARGNS GVILAQILRG FADALATVPV VRGRAVAVAL 
RTAATAAYAA VVAPVEGTLL SVVAAAAGAA ERADRDELGP VVRAAADEAV RALDRTPQQL 
PALARARVVD AGGRGLCLLL DALVEVVTEE RPARPAVAPG PIQPPAVAVR GSGSPTYAYE 
VQYLLDAEPA AVDRLRAQLV ALGDSLTVVG DGATTGGTWN VHVHVNDVGA AIEAGVAAGR 
PHRITVTRFA DPPTSPAAAR PDPAPEGRAA VVVATGAGIV ELFTAAEATV VPGSPAPNEL 
LNAVRATGAA SVVVLPNDTL TQAMASDAVE EAHRFGVKVS VVPTQSPVQA LAALAVRDPG 
RRFEDDVIAM AEAAGACRYA EICHASREAL TIAGPCRKGD VLALVDGEVH LIGSDLLDTC 
TAVVDRMLGG GGELVTLLAG ADAPEGLTEA VREHVLRSWP FVEVHVYPGG QPRYPLLVGV 
E