Gene Apar_0697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0697
Symbol
ID	8413558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	776129
End bp	777187
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	43%
IMG OID	645022275
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_003179717
Protein GI	257784500
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000013673
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000510491
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTATCCA TTCAACGAGA AGATCTGGAA GCTCGTGAGC ATCAAATCTT ATCTCCTGAA 
GCGGCTTTTT CTGATCAAAG TAAAGGCCGT GCGGTGGCAG AGGAGCCTGA CCAGTATCGT 
ACGTGTTATC AGTGCGATAG AGATCGTATC CTTCATAGTA AGAGCTTCAG AAGACTTGCT 
CACAAGACAC AGGTTTTTCT CGCCCCAGAG GGGGATCACT ATAGAACTCG TCTTATCCAT 
ACGCTTGAGG TTTCACAGAT TGCACGCTCA ATTGCACGAC CTCTTGGCTT AAACGAAGAT 
CTAACTGAGG CAATTGCGCT TGGACATGAT TTGGGCCATA CGCCGTTTGG ACATATAGGT 
GAAAAGGCGC TTTCGTTTGC TATTAGTCTG TACAGAGGAA TGGATCCTGA TGCTCCAGAA 
AATGAGTATA TTTTTGCTCA TAACCAGCAA AGTGCTCGCA TTGTTGAGTA TTTAGAGAAA 
GACGGACAGG GTCTTAATCT TTCGTATGAG GTTGTTGATG GTATTAGATG TCACTCAGGT 
AACCTACGTG CAGAAACGGC AGAAGGAAGA ATTGTTGCTA TCTCAGATCG TATTGCCTAT 
GTAACACACG ATATTGATGA CGCAAAACGC GCCGGCCTGC TTTCGGAGGA GTATCTTCCA 
ACTGAGGCTC GCGAGGTGTT GGGCAATAGT TCGCCTGAGC GTATTGAACA TATGGTTCAT 
GATATTGTCT CTGAGAGTTC TCGAGTAGGG GACATTAAGA TGACTGACTC TATGTGGAGT 
GCCATGATGA CCATGAGAGC TTTTCTGTTT GCTAATCTTT ACGCATCAGG TGACGCAAAA 
TATGAAGAAC CTAAAGCGTA TGATCTCATC ATTGAGTTAT TTGATTACTT TGTAAATCAT 
ATGGATGAGG TTCCTGCAGA GTATAAGTGT CATGATTGTG ATCACCCAGA GATTCAAGTT 
GCAGATTATG TTTCAGGTAT GACTGATAGA TATGCAACGA GAGTGTTTGA AGATCTTCGT 
CTACCTCGTT CCTGGGGTAA AAGAAGATAT GTAAAGTAA

Protein sequence

MLSIQREDLE AREHQILSPE AAFSDQSKGR AVAEEPDQYR TCYQCDRDRI LHSKSFRRLA 
HKTQVFLAPE GDHYRTRLIH TLEVSQIARS IARPLGLNED LTEAIALGHD LGHTPFGHIG 
EKALSFAISL YRGMDPDAPE NEYIFAHNQQ SARIVEYLEK DGQGLNLSYE VVDGIRCHSG 
NLRAETAEGR IVAISDRIAY VTHDIDDAKR AGLLSEEYLP TEAREVLGNS SPERIEHMVH 
DIVSESSRVG DIKMTDSMWS AMMTMRAFLF ANLYASGDAK YEEPKAYDLI IELFDYFVNH 
MDEVPAEYKC HDCDHPEIQV ADYVSGMTDR YATRVFEDLR LPRSWGKRRY VK