Gene BURPS1710b_A1118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1118
Symbol
ID	3694362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	1399516
End bp	1400556
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	68%
IMG OID	637731372
Product	PrnD
Protein accession	YP_336276
Protein GI	76817889
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCGCGA GCTGGTACGT CGCGATGCGC TCGGACGACC TCAAGGACAA GCCGACGGAG 
CTGACGCTCT TCGGCCGTCC GTGCGTGGCG TGGCGCGGCG CGACGGGGCG GGCCGTGGTG 
ATGGACCGCC ACTGCGCGCA CCTCGGCGCG AACCTGGCCG ACGGGCGGCT CAAGGACGGG 
TGCATCCAGT GCCCGTTTCA CCACTGGCGG TACGACGAGC AGGGCCAGTG CGTTGACATC 
CCCGGCCACA GCCTCGCGGT GCGCCGGCTG GAGCCCGTTC CGCGCGGGGC GCGCCAGCCG 
ACGTGGGTCA CCGCCGAGCG ATACGGCTAC GTGTGGGTCT GGTACGGTTC CCCGCAGCCG 
CTGCACCCGC TGCCCGAAAT CGCGGCGGCC GACGTCGACA ACGGCGATTT TATGCACCTG 
CACTTCGCGT TCGAGACGAC GACGGCGGTC TTGCGGATCG TCGAGAACTT CTATGACGCG 
CAGCACGCGA ACCCCGTGCA CGCGCTCCCG ATCTCGGCTT TCGAGCTCAA GCTCTTCGAC 
GATTGGCGCG AGTGGCCGGA GGTCGAATCG CTGGCCCGGG CGGGCGCGTG GTTCGGTGCC 
GGGATCGACT TCACCGTGGA CCGGTACTTC GGGCCCCTCG GCATGCTGTC GCGCGCGCTC 
GGCCTGAGCA TGTCGCAGAT GAACCTGCAC TTCGACGGCT ACCCCGGCGG GTGCGTCATG 
ACCGTCGCCC TGGACGGAAA CGTCAAGTAC AAGCTGCTCC AGTGCGTGAC GCCGGTGAGC 
GACGGCAAAA ACGTCATGCA CATGCTCATC TCGATCAAGA AGGTGGGCGG CGTCTTGCGC 
CGCGCGACCG ACTTCGTGCT GTTCGGGCTG CAGACCAGAC AGGCCGCGGG GTACGACGTC 
AAAATCTGGA ACGGGATGAA ACCGGACGGC GGCGGCGCGT ACAGCAAGTA CGACAAGCTC 
GTGCTCAAGT ACCGCGCGTT CTACCGGGGC TGGGTTGACC GCGTCGCCGA GTCGACCGCT 
CGACCGCGCC GCCGCGAGTG A

Protein sequence

MAASWYVAMR SDDLKDKPTE LTLFGRPCVA WRGATGRAVV MDRHCAHLGA NLADGRLKDG 
CIQCPFHHWR YDEQGQCVDI PGHSLAVRRL EPVPRGARQP TWVTAERYGY VWVWYGSPQP 
LHPLPEIAAA DVDNGDFMHL HFAFETTTAV LRIVENFYDA QHANPVHALP ISAFELKLFD 
DWREWPEVES LARAGAWFGA GIDFTVDRYF GPLGMLSRAL GLSMSQMNLH FDGYPGGCVM 
TVALDGNVKY KLLQCVTPVS DGKNVMHMLI SIKKVGGVLR RATDFVLFGL QTRQAAGYDV 
KIWNGMKPDG GGAYSKYDKL VLKYRAFYRG WVDRVAESTA RPRRRE