Gene Plav_3021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_3021
Symbol
ID	5456080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	3222268
End bp	3223458
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	63%
IMG OID	640878609
Product	putative deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_001414285
Protein GI	154253461
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0844637
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGATAG CCAATCCCGC CGCGACCGCG CCCTATGCCA CGCGAGCCGA GGAGACGCGA 
GGACGGCTCT TTCAGGAGCC GGAAAGCGCC ACCCGCACGG CCTTTCAGCG GGACCGCGAC 
AGGATCATTC ATTCCGGCGC CTTCCGGCGC CTCAAATACA AGACGCAGGT TTTCGTCTAT 
CACGAAGGCG ACAATTACCG GACCCGCCTG TCTCACTCTC TCGAAGTGTC GCAAATCGCG 
CGGTCCGTCG CACGTGTGTT TGGTCTCGAT GAAGACCTCT CGGAGACGCT GGCGCTGGCG 
CACGATCTGG GCCACACGCC CTTCGGCCAT GCCGGCGAAA CCGCGCTGGA CAGTTGCATG 
CGCGACTTCG GCGGCTTCGA TCACAACGCC CAGACGCTTC GCATCGTCAC CAAGCTCGAA 
CATCGCTATG CGCGTTTCGA TGGTCTCAAT CTCACCTGGG AAACGCTGGA AGGGCTCGTG 
AAGCACAATG GGCCGGTGGT GACGCCGGGC CGCAGCATCG CGGATTTGCC ACGCGCCATT 
GCCGAATATG CGGAGACGCA GGATCTCGAA CTGGCCACCT ATGCCGGCCC GGAAGCACAG 
GTCGCTGCGC TGGCCGACGA CATTGCCTAC AACAACCACG ACATCGATGA CGGGCTTCGT 
GCCGGCCTTT TCGACATCGA GGACCTGATG GCTCTGCCGC TCGTTGGCGA TGTGTTTCAG 
CGCGTGATGG ATCGCTATCC AGGCCTCGAA ACCACGCGTG TGATCCATGA GGCAGTGCGC 
GAGCTTATAG GCACGATGAT CGAGGACCTT CTCAGCGAGA CCAGAAGCCG CCTTGCCGAG 
GCCCGGCCCC GATCGGCGGC GGATGTCCGC GCGATGAGCC GGCCGCTGGT CGGCTTCACG 
GCGGAAATGA CGGAGCACAA TGCGGCCCTC AAGGCGTTCC TGTTCGAGCG CATGTACCGG 
CACTACCGGG TCAACCGTTC CATGAGCAAG GCGCAGCGGA TCGTCCGCGA CCTGTTCTCC 
TTGCTCCATG GAGAGCCGGA TCAGTTGGCG CCGGAATGGC AGGCAGGCTG CGACGGGCCC 
GGCGGCATCA AGACGGCCCG GCGGGTCTGC GATTTCATCG CCGGAATGAC CGACAAATTC 
GCCATTGAGG AGCATGCACG GCTCTTCGAC CTCCACGACC CCCGCGCTTG A

Protein sequence

MPIANPAATA PYATRAEETR GRLFQEPESA TRTAFQRDRD RIIHSGAFRR LKYKTQVFVY 
HEGDNYRTRL SHSLEVSQIA RSVARVFGLD EDLSETLALA HDLGHTPFGH AGETALDSCM 
RDFGGFDHNA QTLRIVTKLE HRYARFDGLN LTWETLEGLV KHNGPVVTPG RSIADLPRAI 
AEYAETQDLE LATYAGPEAQ VAALADDIAY NNHDIDDGLR AGLFDIEDLM ALPLVGDVFQ 
RVMDRYPGLE TTRVIHEAVR ELIGTMIEDL LSETRSRLAE ARPRSAADVR AMSRPLVGFT 
AEMTEHNAAL KAFLFERMYR HYRVNRSMSK AQRIVRDLFS LLHGEPDQLA PEWQAGCDGP 
GGIKTARRVC DFIAGMTDKF AIEEHARLFD LHDPRA