Gene Apar_0451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0451
Symbol
ID	8413300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	519657
End bp	520898
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	45%
IMG OID	645022019
Product	metal-dependent phosphohydrolase
Protein accession	YP_003179473
Protein GI	257784256
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCA CTAATCCTTT TGCACCTCAT ATGACCGGGC AACTTTCAGA AGAAACGCAG 
GCTCTTGTGG CTGAGCAAAT AGCCAAGGGC ACCTTAAGTC CTTACGCGTG CAAAAATGAA 
GACATCATCC GCCGAGATTC CACCCATGAT CAGGCTTCAC TTTTGCGTCC CGCTTTTATG 
CGAGATGTCG AGAAAATCAT GCATACCCCT GCGTATAACA GGCTAAACGG TAAAACACAG 
GTTTTCTCAT TCCGTGCGCA TGATGACATT ACGCGCCGTG GCCTTCATGA ACAACTTGTT 
TGTAGAGTTG CTAAAGATAT TGGACGTGCA CTGTGTCTTA ACCTTGATTT GATTGAGGCA 
ATTGCTCTTG GTCATGACGT GGGTCATACC CCCTTTGGTC ATGCAGGGGA GTATTTCCTC 
AATGATATTT ACCATGAGCA AACAGGACGT TGGTTTTTCC ACAACGTACA AAGCGTGCGT 
GTTCTTGACG GTCTCTATGC AAGAAATCTT TCTTTACAGA CGCTTGATGG AGTAATTTGC 
CACAACGGTG AGTTTGAACA GCAGGTACTT CAAATGAGTA ATCTTTCAAC TTTTGATGAG 
TTTGACAAGG TGGTGGAAGA TTGCTGGGAT AGGGGTCCTC AGGCTATTGC ACACTTGCGT 
CCTATGACGC TTGAAGGTTG TGTTATGCGC ATCTCGGACA TTATTGCGTA TGTCGGAAAA 
GATAGACAGG ATGCTCTTCG TGCAGGTGCC GCAACAGAAG AAACGTTTGA TGATGGTCTT 
GGCGGTGCCT ATAACGCATG GGCTACCTCT GCTTTTGTTG CAGATATTGT TCAGAACAGC 
TTTGGTAAGC CTCAGATTTC TCTCTCAGAA GAGGCATTTA AAGAGATGAA ACGAGCAAAG 
CGCGAGAATT ACCAGAAGAT CTATGGCGCA TCAGAGGCCA ATGGTGATTT CTCTGAAGAC 
ATTAAGCATC TGTTTGAGAA GTTGTACGAA TACGAGCTGT CTGCGCTTAA ATCTGGTGAT 
CAGAACCTTG CAATCTTTAA GCATCATATT GAGCCCGTGA GTAGACATCT TTCTAGGTAC 
GGTCATACGT ATGACTGGAA GAGTGACCTA CATCGTACTG TTGTTGATTT TATTTCTGCA 
ATGACTGATG ACTACTTTGT GGCTACCTGC GAAGCGCTCT TCCCAGAAGC TCAGGAGCTC 
TTTCCAAAGA GAAGTTACTT TGCAGAAGGA GTACGCGTGT AA

Protein sequence

MNITNPFAPH MTGQLSEETQ ALVAEQIAKG TLSPYACKNE DIIRRDSTHD QASLLRPAFM 
RDVEKIMHTP AYNRLNGKTQ VFSFRAHDDI TRRGLHEQLV CRVAKDIGRA LCLNLDLIEA 
IALGHDVGHT PFGHAGEYFL NDIYHEQTGR WFFHNVQSVR VLDGLYARNL SLQTLDGVIC 
HNGEFEQQVL QMSNLSTFDE FDKVVEDCWD RGPQAIAHLR PMTLEGCVMR ISDIIAYVGK 
DRQDALRAGA ATEETFDDGL GGAYNAWATS AFVADIVQNS FGKPQISLSE EAFKEMKRAK 
RENYQKIYGA SEANGDFSED IKHLFEKLYE YELSALKSGD QNLAIFKHHI EPVSRHLSRY 
GHTYDWKSDL HRTVVDFISA MTDDYFVATC EALFPEAQEL FPKRSYFAEG VRV