Gene YpAngola_A0988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A0988
Symbol	dgt
ID	5799451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	1011460
End bp	1012980
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	43%
IMG OID	641338977
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_001605549
Protein GI	162418606
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00819808
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGGA TCGACTTTAA GCAGAAAATA AGTTTCCAGC GGCCTTTTAG TAAGCCCAGT 
TCAGCAGAAG ATGAATATGA AATAACAAGG GTATTTGAAA GTGATCGTGG GCGGATTGTT 
AACTCTGCTG CTATCCGGCG TCTGCAACAA AAAACGCAAG TATTCCCGCT GGAACGCAAT 
GCCGCCGTTC GTAGCCGATT AACCCATTCG TTGGAAGTGC AACAAGTCGG GCGTTATATC 
GCGAAAGAGA TCCTGAACCG CTTTAAACAG GATAAAAAAA TCACGGCCTA CGGTTTGGAT 
AAACTACTCG ACCCTTTTGA AAGTATTGTT GAAATGGCCT GTCTGATGCA TGACATTGGT 
AACCCGCCAT TTGGTCATTT CGGTGAGTCA GCGATCAATG ATTGGTTTAC AAAACGGATG 
GACCCTAACG GCGGCAGCGG TTCTGAACCA CAAAGCACAG ATCAATGTCA GGTAGATGTG 
CTGAAGCTAT GTGAGGGAGA AACCGAACTT AATATTCTGC GCAGTAAAAT TCGTCATGAC 
CTTAGCCAGT TTGAGGGCAA CGCTCAGGCT ATTCGTTTGG TTCACAGTTT ATTAAAACTG 
AATCTGACCT ATGCTCAGGT GGGTTGTATT CTTAAATATA CTAAGCCCGC TTATTGGTCA 
GCCCCTATTC CAGCGTCCCA TAACTATTTG ATGAAAAAAC CCGGCTTCTA TCTGGCAGAG 
GAAAATTACG TCAAAGAACT GCGTCGCGAA CTCAATATGG AAGAGTTTGA CCGTTTTCCA 
CTGACTTATA TTATGGAGGC CGCCGATGAT ATTTCTTACT GTATAGCCGA TTTAGAAGAT 
GCAGTAGAAA AAAATATTTT CAGTGTCGAA CAACTCTATG ATCATATGAG CCAAGAGTGG 
GGGGCCGTTA CACCGGGGGA TCTGTTTGAT AAAGTCGTGG GTGCCGCTTT TCGTCAATTA 
GGCCGTGAGC AAGGCCGGCG TAGCTCAGAA GATCAATTCT TTATGTATCT ACGGGTAAAT 
ACTGTGGGGA AATTAGTCCC TCATGCGGCA CAACGCTTTA TTGAAAATCT ACCGGCTGTT 
TTTTCAGGCT CTTTTAACCA GGCATTGTTA GAAGATTCCA GTGCCGCTTG TAAGTTATTG 
CAAATTTTCA AACGTGTCGC AGTAAAACAT GTATTTAACC ACCCAGAAGT TGAACAGCTT 
GAATTACAAG GGTATAGAGT CATCAGTGGG CTGCTTGATA TTTATAGCCC GTTATTAGCA 
ATGCCAGAGA CCGCCTTTAC ACAATTAGTT GCAGATGACC GCCACCGTAA GTATCCAATT 
GAAACACGGT TATTTCATAA ATTATCGATT AAACATCGGT TAGCTTATGC TGAATCTGCA 
GAAAGAATCC GTAATTTACC GTCCGAACAA TATGAGATAT ATGAATATTA TTATCGTGCG 
CGGTTAATTC AGGATTATAT CAGTGGGATG ACCGATCTTT ATGCTTATGA TGAATACCGG 
CGTTTAATGG CTGCGGAATA G

Protein sequence

MSGIDFKQKI SFQRPFSKPS SAEDEYEITR VFESDRGRIV NSAAIRRLQQ KTQVFPLERN 
AAVRSRLTHS LEVQQVGRYI AKEILNRFKQ DKKITAYGLD KLLDPFESIV EMACLMHDIG 
NPPFGHFGES AINDWFTKRM DPNGGSGSEP QSTDQCQVDV LKLCEGETEL NILRSKIRHD 
LSQFEGNAQA IRLVHSLLKL NLTYAQVGCI LKYTKPAYWS APIPASHNYL MKKPGFYLAE 
ENYVKELRRE LNMEEFDRFP LTYIMEAADD ISYCIADLED AVEKNIFSVE QLYDHMSQEW 
GAVTPGDLFD KVVGAAFRQL GREQGRRSSE DQFFMYLRVN TVGKLVPHAA QRFIENLPAV 
FSGSFNQALL EDSSAACKLL QIFKRVAVKH VFNHPEVEQL ELQGYRVISG LLDIYSPLLA 
MPETAFTQLV ADDRHRKYPI ETRLFHKLSI KHRLAYAESA ERIRNLPSEQ YEIYEYYYRA 
RLIQDYISGM TDLYAYDEYR RLMAAE