Gene Apar_0861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0861
Symbol
ID	8413727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	956160
End bp	957824
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	47%
IMG OID	645022444
Product	Dak phosphatase
Protein accession	YP_003179881
Protein GI	257784664
COG category	[R] General function prediction only
COG ID	[COG1461] Predicted kinase related to dihydroxyacetone kinase
TIGRFAM ID	[TIGR03599] DAK2 domain fusion protein YloV

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00152626
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.95295
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTTCAA ATGTCATTCG TACATGCTTC CCTGTAGCAG CACTTGCTGT TGCAGACAAA 
GCAGAAGAGA TCAACAAGCT CAATGTTTTT CCTGTACCAG ATGGAGACAC CGGCACTAAC 
ATGTCCCTTA CCCTGGGTAC CGTTGTTCGT GAGGTTCAAG ATCTTCCTCA AGATGCAAGT 
ATGCAGGATA TTGCAAAGGC AATTACTCAC GGCTCTCTGA TGGGTGCTCG CGGTAACTCC 
GGCGTTATTA CTTCTCAGAT TCTTCGCGGT ATCGCTGAGG GTCTTTGTGA CGTTAAGAAT 
CCTGAGGCAG TAACTCCTAA GGATATTGCA CACGCATTCC GCCGCGGTAA AGAAGTTGCT 
TTTAAGGCCG TTAGAAAGCC AGTTGAGGGT ACTATTCTTA CCGTTTTAAA GGACGTTTCT 
GCTAAGGCAG ACTCTCTTGA GAAGTCTCAG CTTACCCCAG CAGAGGTCTT AGATGCCCTT 
GTTGTTGAGG CATATGAATC CGTTGCCCGC ACTCCTGAGC TTCTTCCTGT TCTTAAAGAG 
AACGGTGTTG TTGACTCTGG TGCATTTGGT TTTGCAACTT TCCTTGAGGG CTTTGTAAAC 
GCTGTTACTG GTAAGACTGA AACTACTGAC TTTCAGACAA CTGTTTCAGT TTCTGACGCT 
AAGGCTGCCA CCAGTGCAAA GGTTGAGATT GAGCTCAACG ATGACTGGGA GGGTTCTGAG 
TACCGTTATT GCAATGAGTT CCTTTTCAAG GCAGATAGTC CTGACTTTGA CGAGGAAGCA 
GCTTTGAATT TCCTTGCAAC TATGGGTGAT TGCGAGCTTC TTGTTGGCGC AAACCCAGAC 
TACAAGATTC ACGTTCACTC AAATACTCCT AATAAGGTTC TTGAGTACAT GCTTCAGTAT 
GGTCAGATTT TTGAGGTCTT TATTCATAAT ATGGACCTTG AGGCTAAGGA GCGTACCGAG 
AAAATCGCTG AAGATAAGAA GGCTGCAGCA GTACCTAAAA AAGAGCTTGG CTTTGTTGCG 
GTAACCGCTG GTTCTGGCGC CGCATCAATC TTGAAGTCTC TTGGCGTGGA CGTTGTTGTT 
TCTGGTGGTC AGACCATGAA TCCTTCAACT GCAGATATTC TTGCTGCAAT TGAAGGGGCC 
AATGCAGAAC AAGTTATTGT TATGCCAAAT AACTCTAACA TTCGTATGGC GGCAGAGGCG 
GCTGCAAGTG CATGCGAGAA TATTAAGGTT GCAGTTATTC CAACCAAGTC TGTTCTTCAG 
GCATTTGCTG CAATGTTTGT CGTTGCAGAT GGCGTTCCAT TTGAAGAGCT TGTCGAAGAG 
ATGACTGATG CTATTTCTGG CGTTCGTTAT GGCGAGGTAA CTACCGCAGT TCGCGATTCT 
TCCGCAGCTG ACGGTACTCC TATCCATGAT GGTGACGTCA TGGGTATCCA GGGAGGCTCC 
ATTGATGTTG TCGGCTCCGA TGTCATGAAG GTCACGCTTG ATCTTATTGC AAAGATGCAA 
GAGGAGGAAG AGGGTGACAA CCTCACCATT CTTGCAGGTG AGGATTTCTC TGATGAGCAG 
CTCGATTTTC TCGCTAGCAG AGTCGAGGAA GCTTATCCAG ATCTTGAGGT TGACGCTCAG 
CGCGGCGAGC AGCCACTCTA TCCAGTTATC TTCTCTATTG AGTAG

Protein sequence

MISNVIRTCF PVAALAVADK AEEINKLNVF PVPDGDTGTN MSLTLGTVVR EVQDLPQDAS 
MQDIAKAITH GSLMGARGNS GVITSQILRG IAEGLCDVKN PEAVTPKDIA HAFRRGKEVA 
FKAVRKPVEG TILTVLKDVS AKADSLEKSQ LTPAEVLDAL VVEAYESVAR TPELLPVLKE 
NGVVDSGAFG FATFLEGFVN AVTGKTETTD FQTTVSVSDA KAATSAKVEI ELNDDWEGSE 
YRYCNEFLFK ADSPDFDEEA ALNFLATMGD CELLVGANPD YKIHVHSNTP NKVLEYMLQY 
GQIFEVFIHN MDLEAKERTE KIAEDKKAAA VPKKELGFVA VTAGSGAASI LKSLGVDVVV 
SGGQTMNPST ADILAAIEGA NAEQVIVMPN NSNIRMAAEA AASACENIKV AVIPTKSVLQ 
AFAAMFVVAD GVPFEELVEE MTDAISGVRY GEVTTAVRDS SAADGTPIHD GDVMGIQGGS 
IDVVGSDVMK VTLDLIAKMQ EEEEGDNLTI LAGEDFSDEQ LDFLASRVEE AYPDLEVDAQ 
RGEQPLYPVI FSIE