Gene BURPS1106A_3756 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3756
Symbol
ID	4899530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3667946
End bp	3669178
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	67%
IMG OID	640136982
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_001067986
Protein GI	126452532
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGAAA TACCCGGCGG CGGCATCCCG CGCGAAACCC GCGACGCGCG CGTCTCGAAT 
GCGGGCGACG GGCAGGCGAT TCCCGTCGCC GCGCCGACCA CCGCAGCGCT CGAAGCGCAT 
CTCGCGCCGT ACGCGGCGCA CGCGTCGCGC TCGCGCGGGC GGCGCCATCC GGAGCCGCCG 
CCCGCGGCGC GCACCGAATT CCAGCGCGAT CGCGACCGCA TCGTGCACTC CACCGCATTC 
AGGCGCCTCG AATACAAGAC GCAGGTCTTC GTGAATCATG AAGGCGACCT GTTCCGCACG 
CGTCTCACGC ACAGCCTCGA GGTCGCGCAG ATCGCCCGGT CCGTCGCGCG CAACCTGCGC 
CTGAACGAAG ACCTCGTCGA GGCGATCTCG CTCGCGCACG ACCTCGGCCA TACGCCGTTC 
GGCCACGCCG GGCAGGACGC GCTCAACGCG TGCATGCGCG ACTACGGCGG CTTCGAGCAC 
AATCTGCAGA GCCTCGCCGT CGTCGACGAG CTCGAAGAGC ATTACGGCGC GTTCAATGGG 
CTGAACCTGT GCTTCGAGAC GCGCGAAGGC ATCCTCAAGC ACTGCTCGCG CGAGAACGCG 
CGCAAGCTCG GCGAGCTCGG CGAGCGATTC CTGCAGAGCC GCCAGCCGTC ACTCGAAGCG 
CAGCTCGCGA ACATCGCGGA CGAAATCGCG TACAACAATC ACGACGTCGA CGACGGCCTG 
CGCTCGGGCC TCATCACGAT CGAGCAACTC GCCGAGGTCG AGCTGTGGCA GTGCCATTAC 
GAAGCGGCGC TCGCCGAATA TCCGCATCTC GAGGGCCGCC GTCTCGTGCA CGAGACGGTG 
CGCCGGATCA TCAACACGCT GATCGTCGAT CTGATCGACG CGACGACGCG CAATCTCGCG 
CGCCACGGGC CGACCTCGCT CGACGACGTG CGCGCGGCGC CGCACCTCGT CGCGCACGGC 
GAGCCGATCG CCACGCAGGC GGCGGCGCTC AAGCGTTTCC TGTACAAGAA CCTGTATCGC 
CACTACCGCG TGATGCGCAT GGCGAGCAAG GCGCAGCGGG TCGTCACCGG CCTCTTCAAC 
GCGTTCACGG GCGACCCGCG CCTCTTGCCG CCCGACTATC AGGCGGCCGA CGCCGCGCAT 
CAGCCGCGGC TCGTCGCGCA TTACATCGCC GGCATGACCG ATCGTTTCGC ACTGAAAGAG 
TATCAACGCT TGTTTGTCAT GGACGAAAAC TAA

Protein sequence

MSEIPGGGIP RETRDARVSN AGDGQAIPVA APTTAALEAH LAPYAAHASR SRGRRHPEPP 
PAARTEFQRD RDRIVHSTAF RRLEYKTQVF VNHEGDLFRT RLTHSLEVAQ IARSVARNLR 
LNEDLVEAIS LAHDLGHTPF GHAGQDALNA CMRDYGGFEH NLQSLAVVDE LEEHYGAFNG 
LNLCFETREG ILKHCSRENA RKLGELGERF LQSRQPSLEA QLANIADEIA YNNHDVDDGL 
RSGLITIEQL AEVELWQCHY EAALAEYPHL EGRRLVHETV RRIINTLIVD LIDATTRNLA 
RHGPTSLDDV RAAPHLVAHG EPIATQAAAL KRFLYKNLYR HYRVMRMASK AQRVVTGLFN 
AFTGDPRLLP PDYQAADAAH QPRLVAHYIA GMTDRFALKE YQRLFVMDEN