Gene Gdia_0444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0444
Symbol
ID	6973838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	488616
End bp	489818
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	70%
IMG OID	643389976
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_002274855
Protein GI	209542626
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.662695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCG CACCCTACGC TGTCCAGCCT GCCACCGCCC GGGGCCGGCT GCATGCCGAA 
CCCGAATCGC CCAGCCGCAC GCCGTGGCAG CGTGACCGCG ACCGTGTCCT GCATTCGGCG 
GGCTTCCGCA CCCTGCAATA CAAGACCCAG GTCTTCGTCA ATCATCAGGG CGACTTCTTC 
CGTACCCGCC TGACCCATTC GCTGGAGGTC GCGCAGATCG CGCGGTCCAT CGCCCGGAAC 
CTGGGGGTGG ACGAAGACCT GACGGAAACG CTGGCCCTGG CCCACGATCT GGGCCACACG 
CCCTTCGGCC ATGCGGGCGA GGACGCGCTG GCGGCGGCGA TGCGCGCCTG GGGCGGGTTC 
GACCACAACA CCCAGACCCT GCGCCAGGTG ACGCAACTGG AGCGCCGCTA TTTCGGCTTC 
GACGGGCTGA ACCTGACATG GGAAACGCTG GAAGGCCTGA TCAAGCATAA CGGGCCGGTG 
GACCACCCGA CGGGCTATGT CGCGCGCTAT GCCGAACGGC TGGGTCTGGA CCTGACCACC 
TTCGCGCCGG TCGAGGCCCA GGTCGCGGCG ATGGCCGACG ACATCGCCTA TCACGCCCAC 
GACCTGGATG ACGGGCTGCG CGCGGGGCTG CTGTGCCTGT CGGACCTGGC GGGCCTGCCG 
GTGGTGGGGG CGGCGCTGGC GCAGGTCCGG CAACTGGCCG GGGGGGCGGA CCTGCCGGCC 
TCGGCGCCGC AGGCACCCGG CCTGCATGCC GCCGACCTGC ATGTGGACGA CCGGATGCGC 
CACGAAACCA TCCGCCGGGT CATCAATGCG CTGGCGGTGG ACCTGACGGA GCAGACGCGG 
CGCAACCTGG AACGGCTGGC CCCCCGTTCG GCCGACGACG TGCGCCGGGC GGAGGCACCG 
GTCGTGGCCT ACAGCCCCGC CATGGCGCGC GATAACGGGG CCATCCGCAC CTTCCTCTAC 
GCACGGCTGT ACCGGCACTG GCGGGTCAAC CGCATGACGC GCAAGGCGCG CATGGCGGTC 
GAATCCATCT TCTCGATCCT GGCCGATGAC CTGTCGCTGC TGCCGGACGG CTGGCGGCAG 
CAGGCGCGCG GGGCGGACCA GACCGGTGCG CGCCGGGTCG TGGCCGATTA TATAGCCGGA 
ATGACGGACC GATTCGCGAT GGAAGAACAT CGACGGTTGA CGGATCTGTC CGTGCCGGGC 
TGA

Protein sequence

MSIAPYAVQP ATARGRLHAE PESPSRTPWQ RDRDRVLHSA GFRTLQYKTQ VFVNHQGDFF 
RTRLTHSLEV AQIARSIARN LGVDEDLTET LALAHDLGHT PFGHAGEDAL AAAMRAWGGF 
DHNTQTLRQV TQLERRYFGF DGLNLTWETL EGLIKHNGPV DHPTGYVARY AERLGLDLTT 
FAPVEAQVAA MADDIAYHAH DLDDGLRAGL LCLSDLAGLP VVGAALAQVR QLAGGADLPA 
SAPQAPGLHA ADLHVDDRMR HETIRRVINA LAVDLTEQTR RNLERLAPRS ADDVRRAEAP 
VVAYSPAMAR DNGAIRTFLY ARLYRHWRVN RMTRKARMAV ESIFSILADD LSLLPDGWRQ 
QARGADQTGA RRVVADYIAG MTDRFAMEEH RRLTDLSVPG