Gene BURPS1106A_3144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3144
Symbol	pyrC
ID	4903267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3066219
End bp	3067496
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	72%
IMG OID	640136370
Product	dihydroorotase
Protein accession	YP_001067382
Protein GI	126452005
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATTC ATATCAAAGG CGGCACGCTC ATCGATCCGG CGGCCGGCAC GCAGCGGCAG 
GCCGACGTGT TCGTCGCGGC CGGCAAGGTG GCCGCGATCG GCGCGGCGCC GGCCGATTTC 
AACGCGGCGA AGACGATCGA CGCGACGGGG CTGATCGTCG CGCCGGGCTT CGTCGATTTG 
TCGGCGCGGC TGCGCGAGCC CGGCTACGAG CATAAGGCGA CGCTCGAATC CGAGATGGCG 
GCGGCGGTCG CGGGCGGCGT GACGAGCCTC GTGTGCCCGC CCGACACCGA TCCGGTGCTC 
GACGAGCCGG GCCTCGTCGA AATGCTGAAG TTTCGCGCCC GCAACCGGAA TCAGGCGCAC 
GTGTATCCGC TCGGCGCGCT GACGGTCGGC CTGAAAGGGC AGGTCATCAC CGAGATGGTC 
GAGCTGACCG AGGCGGGCTG CATCGGCTTC ACGCAGGCGA ACGTGCCCGT CACCGATACG 
CAGGTGCTGC TGCGCGCGCT GCAGTACGCG AGCACCTACG GCTACACGGT GTGGCTGCGC 
CCGCTCGACG CGTTTCTCGC GAAGGGCGGC GTCGCGGCGA GCGGGCCCGT CGCGTCGCGG 
CTCGGCCTGT CGGGCGTGCC GGTCGCGGCC GAGACGATCG CGCTGCATAC GCTGTTCGAG 
CTGATGCGGG TGACGGGCGC GCGCGTGCAC GTCGCGCGGC TGTCGTCGGC GGCCGGCGTC 
GCGCTCGTGC GCGCCGCGAA GGCCGAGGGC CTGCCCGTGA CCTGCGATGT CGGCGCGAAC 
CACCTGCATC TGATCGATGT CGACATCGGC TACTTCGACG CGCAGTTCCG GCTCGATCCG 
CCGCTGCGCG CCGAGCGCGA CCGCGAGGCG ATTCGCGCGG CGCTCGCCGA CGGCACGATC 
GATGCGATCT GCTCGGATCA CACGCCCGTC GATGACGACG AGAAGCTGCT GCCGTTCGCC 
GAGGCGACGC CCGGCGCGAC GGGCCTCGAG CTGCTGCTGT CGCTGACCGT GAAGTGGGCG 
CGCGAAGCGG GCGTGCCGCT CGCGCGGGCG CTCGCGGCGA TCACCTCGGC GCCCGCCGAT 
GTGCTGAAGC TGCCCGCCGG CCGTATCGGC GAAGGCGCGC CGGCCGACCT GTGCGTGTTC 
GATCCGAATG CGCACTGGCG CGTCGAGCCC CGCGCGCTGA AGAGCCAGGG CCACAACACG 
CCGTTCCTCG GCTATGAGCT GCCGGCGCGA GTGTGCGCGA CGCTCGTCGC GGGGCAGGTG 
GCGTTCGAGC GTCGCTGA

Protein sequence

MKIHIKGGTL IDPAAGTQRQ ADVFVAAGKV AAIGAAPADF NAAKTIDATG LIVAPGFVDL 
SARLREPGYE HKATLESEMA AAVAGGVTSL VCPPDTDPVL DEPGLVEMLK FRARNRNQAH 
VYPLGALTVG LKGQVITEMV ELTEAGCIGF TQANVPVTDT QVLLRALQYA STYGYTVWLR 
PLDAFLAKGG VAASGPVASR LGLSGVPVAA ETIALHTLFE LMRVTGARVH VARLSSAAGV 
ALVRAAKAEG LPVTCDVGAN HLHLIDVDIG YFDAQFRLDP PLRAERDREA IRAALADGTI 
DAICSDHTPV DDDEKLLPFA EATPGATGLE LLLSLTVKWA REAGVPLARA LAAITSAPAD 
VLKLPAGRIG EGAPADLCVF DPNAHWRVEP RALKSQGHNT PFLGYELPAR VCATLVAGQV 
AFERR