Gene YpsIP31758_3324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3324
Symbol	dgt
ID	5387009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	3736370
End bp	3737890
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	43%
IMG OID	640866339
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_001402281
Protein GI	153950205
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.065001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGGGA TCGACTTTAA GCAGAAAATA AGTTTCCAGC GGCCTTTTAG TAAGCCCAGT 
TCAGCAGAAG ATGAATATGA AATAACAAGG GTATTTGAAA GTGATCGTGG GCGGATTGTT 
AACTCTGCTG CTATCCGGCG TCTGCAACAA AAAACGCAAG TATTCCCGCT GGAACGCAAT 
GCCGCCGTTC GTAGCCGATT AACCCATTCG TTGGAAGTGC AACAAGTCGG GCGTTATATC 
GCGAAAGAGA TCCTGAACCG CTTTAAACAG GATAAAAAAA TCACGGCCTA CGGTTTGGAT 
AAACTACTCG ACCCTTTTGA AAGTATTGTT GAAATGGCCT GCCTGATGCA TGACATTGGT 
AACCCGCCAT TTGGTCATTT CGGTGAGTCA GCGATCAATG ATTGGTTTAC AAAACGGATG 
GACCCTAACG GCGGCAGCGG TTCTGAACCA CAAAGCACAG ATCAATGTCA GGTAGAGGTG 
CTGAAGCTAT GTGAGGGAGA AACCGAACTT AATATTCTGC GCAGTAAAAT TCGTCATGAC 
CTTAGCCAGT TTGAGGGCAA CGCTCAGGCT ATTCGTTTGG TTCACAGTTT ATTAAAACTG 
AATCTGACCT ATGCTCAGGT GGGTTGTATT CTTAAATATA CTAAGCCCGC TTATTGGTCA 
GCCCCTATTC CAGCGTCCCA TAACTATTTG ATGAAAAAAC CCGGCTTCTA TCTGGCAGAG 
GAAAATTACG TCAAAGAACT GCGTCGCGAA CTCAATATGG AAGAGTTTGA CCGTTTTCCA 
CTGACTTATA TTATGGAGGC CGCCGATGAT ATTTCTTACT GTATAGCCGA TTTAGAAGAT 
GCAGTAGAAA AAAATATTTT CAGTGTCGAA CAACTCTATG ATCATATGAG CCAAGAGTGG 
GGGGCCGTTA CACCAGGGGA TCTGTTTGAT AAAGTCGTGG GTGCCGCTTT TCGTCAATTA 
GGCCGTGAGC AAGGCCGACG TAGCTCAGAA GATCAATTCT TTATGTATCT ACGGGTAAAT 
ACTGTGGGGA AATTAGTCCC TCATGCGGCA CAACGCTTTA TTGAAAATCT ACCGGCTGTT 
TTTTCAGGCT CTTTTAACCA GGCATTGTTA GAAGATTCCA GTGCCGCTTG TAAGTTATTG 
CAAATTTTCA AACGTGTCGC AGTAAAACAT GTATTTAACC ACCCAGAAGT TGAACAGCTT 
GAATTACAAG GGTATAGAGT CATCAGTGGG CTGCTTGATA TTTATAGCCC GTTATTAGCA 
ATGCCAGAGA CCGCCTTTAC ACAATTAGTT GCAGATGACC GCCACCGTAA GTATCCAATT 
GAAACACGGT TATTTCATAA ATTATCGATT AAACATCGGT TAGCTTATGC TGAATCTGCA 
GAAAGAATCC GTAATTTACC GTCCGAACAA TATGAGATAT ATGAATATTA TTATCGTGCG 
CGGTTAATTC AGGATTATAT CAGTGGGATG ACCGATCTTT ATGCTTATGA TGAATACCGG 
CGTTTAATGG CTGCGGAATA G

Protein sequence

MSGIDFKQKI SFQRPFSKPS SAEDEYEITR VFESDRGRIV NSAAIRRLQQ KTQVFPLERN 
AAVRSRLTHS LEVQQVGRYI AKEILNRFKQ DKKITAYGLD KLLDPFESIV EMACLMHDIG 
NPPFGHFGES AINDWFTKRM DPNGGSGSEP QSTDQCQVEV LKLCEGETEL NILRSKIRHD 
LSQFEGNAQA IRLVHSLLKL NLTYAQVGCI LKYTKPAYWS APIPASHNYL MKKPGFYLAE 
ENYVKELRRE LNMEEFDRFP LTYIMEAADD ISYCIADLED AVEKNIFSVE QLYDHMSQEW 
GAVTPGDLFD KVVGAAFRQL GREQGRRSSE DQFFMYLRVN TVGKLVPHAA QRFIENLPAV 
FSGSFNQALL EDSSAACKLL QIFKRVAVKH VFNHPEVEQL ELQGYRVISG LLDIYSPLLA 
MPETAFTQLV ADDRHRKYPI ETRLFHKLSI KHRLAYAESA ERIRNLPSEQ YEIYEYYYRA 
RLIQDYISGM TDLYAYDEYR RLMAAE