Gene BURPS1710b_1978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1978
Symbol	pyrD
ID	3689820
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	2154610
End bp	2155647
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	70%
IMG OID	637728434
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_333375
Protein GI	76810873
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTCAGCT CCCTCTACCC GCTTGCCCGC GCGTCCCTCT TCAAGATGGA TGCGGAGGAC 
GCCCATCATC TGACCCTGCG CATGCTCGGC GCCGCGGGCC GCACGGGCCT CGCGTGCGCG 
CTGTCGCCCC GCGTGCCCGA CGCGCCGCGC ACCGTGATGG GGCTCTCGTT CCGCAATCCG 
GTCGGGCTCG CGGCCGGCCT CGACAAGGAC GGCGCGGCGA TCGACGGCTT CGCCGCGCTC 
GGCTTCGGCT TCATCGAGGT GGGCACCGTC ACGCCGCGCG CGCAGCCCGG CAACCCGCGC 
CCGCGGATGT TCCGGCTACC CGAGGCGGAC GCGATCATCA ACCGGATGGG CTTCAACAAC 
AGCGGCGTCG ACCAGTTCGT GAAGAACGTG CAGGCGGCGC GCTATCGCGG CGTGCTCGGC 
CTGAACATCG GCAAGAACGC CGACACGCCG ATCGAGCGCG CGGCCGACGA TTACCTGTAC 
TGCCTCGAGC GCGTCTACCC GTTCGCGAGC TACGTGACGA TCAACATCTC GTCGCCGAAC 
ACGAAGAACC TGCGCCAGCT CCAGGGCGCG GGCGAGCTCG ACGCGCTGCT CGCCGCGCTG 
AAGGACAAGC AGCGGCGCCT CGCCGACCTG CACGGCAAGC TCGTGCCGCT CGCGCTGAAG 
ATCGCGCCCG ATCTCGACGA CGAACAGGTG AAGGAAATCG CCGCAACGCT GCTGCGCCAC 
GACATCGAAG GCGTGATCGC GACCAACACC ACGCTGTCGC GCGAAGCGGT GAAAGGCCTG 
CCGCACGCCG ACGAGGCGGG CGGACTGTCC GGGCGGCCGG TGTTCGACGC GTCGAACGCG 
GTGATCCGCA AGCTGCGCGC GGAGCTTGGC GACGCGGTGC CGATCATCGG CGTGGGCGGC 
ATCTTCTCCG GCGAGGACGC GCGTGCGAAA CTCGCGGCGG GCGCGGCGCT CGTCCAGCTG 
TACACCGGCT TCATCTATCG GGGCCCGGCG CTCGTCGCCG AATGCGTGAA GGCGATCGCC 
CGCGGCGAAG CGCGATGA

Protein sequence

MFSSLYPLAR ASLFKMDAED AHHLTLRMLG AAGRTGLACA LSPRVPDAPR TVMGLSFRNP 
VGLAAGLDKD GAAIDGFAAL GFGFIEVGTV TPRAQPGNPR PRMFRLPEAD AIINRMGFNN 
SGVDQFVKNV QAARYRGVLG LNIGKNADTP IERAADDYLY CLERVYPFAS YVTINISSPN 
TKNLRQLQGA GELDALLAAL KDKQRRLADL HGKLVPLALK IAPDLDDEQV KEIAATLLRH 
DIEGVIATNT TLSREAVKGL PHADEAGGLS GRPVFDASNA VIRKLRAELG DAVPIIGVGG 
IFSGEDARAK LAAGAALVQL YTGFIYRGPA LVAECVKAIA RGEAR