Gene BURPS1106A_1078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1078
Symbol
ID	4899985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1059647
End bp	1061626
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	71%
IMG OID	640134308
Product	bifunctional uroporphyrinogen-III synthetase/uroporphyrin-III C-methyltransferase
Protein accession	YP_001065358
Protein GI	126453804
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1587] Uroporphyrinogen-III synthase [COG2959] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGGCG CGCCGCGCAC GTTCACCGCG GTGCTCACGC GCCCCGACGG ACAGTCGGCG 
GCGCTCGCGG CGCAGCTCGC GGCGGCGGGC ATCGACGTGC TCGACTTTCC GCTCATCGAC 
ATCGCGCCGC TCGCCGACGA CGCGCCGCTC GCCGAAGCGT TCGCGCGGCT CGACGCGTAT 
GCGCTCGTCG TGTTCGTGTC GCCGAACGCG GTCGATCACG CGCTCGCGCG GCTCGGCGCG 
ATCTGGCCGC ATCCGCTGCC GATCGGCGTC GTCGGGCCGG GCAGCGTCGC CGCGCTCGCG 
CGGCACGGCA TCGCCGCGCC CGCGCATCGC GTGATCGCGC CGAGCGCGCC CGACGACGGC 
GGCGAGCCGC ACTACGATTC CGAGAGCCTG TTCGCCGAGA TCGCGCGTGC GTTCAACGGC 
GAGGCGAAGC TCGCCGGCAA GCGCGTGCTG ATCGTGCGCG GCGACGGCGG CCGCGAATGG 
CTTGCCGAGC GCCTGCGCGA GGCGGGCGCC GAAGTCGAGC TCGTCGCCGC GTATCGGCGC 
GTGAGCCCGG AGCCTTCGAT CGGCGCGTGG GAGCGCGTGC ACGCGCTGCT GTCGGGCGCG 
CCGCACGCGT GGCTCGTGAC GAGCTCGGAG GGCGTGCGCA ATCTGCAGGA GCTCGCGCAC 
GAGCATTTGA ACGAAACGGA GATCGACGCG CTCAAGCACG CCCGGTTCGT CGCGCCGCAT 
TCGAGGATCG TCGAGACCGC GCGCGCACTC GGTTTTGATA GGATTACGCT GACCGGCGCG 
GGCGATGAGC GCATCGTCCG CGCGTTTCGT ACGTTGGCCG ATCAGGCCGA TCAACCGGCG 
ACAGCCGCAC CGATGCCTTC TCGCATGACA GACACCAACG ATACCAAAGA CGTCTCTTCC 
AAACCGGCCG CGGCTCCCGT TGCGCCGCCG AATCAACCGT TTACGCCGTT TGAAACGAAG 
GAGCGGCGCG GCGCGGCGAG CGCGGCGCTC TGGTTCGTGG TCGTCGTGAT CGCGGCCGCG 
GCGGGCGTCG GCGGCTATGC GCTGAACCGC AAGGTCGACC GCCTCGATCA GCACGCGACC 
GAGCGGCAAA AGGCGCTCGA CGCGCAAACG GCCGAGCTCC GCACGAAGAC CGAACAGGCG 
CTCGCGAGCG TGCGCCAGGC CGATTCGCAA CTGTCGCAGC TCGAAGGCAA GCTCGCCGAC 
GCGCAGACCG CGCAGACCGC GCTGCAGCAG CAATATCAGG ATCTGTCGCG CAACCGCGAC 
GCGTGGATGA TCGAGGAAGT CGGTCAGATG CTGTCGAGCG CGAGCCAGCA ACTGCTGCTC 
ACGGGCAACA CGCAGCTCGC GCTGATCGCG CTGCAGAACG CCGATGCGCG GCTCGCGTCG 
TCGCAGAGCG CGCAGGCGGT CGTCGTGCGC AAGGCGATCG CGCAGGATAT CGAACGGTTG 
AAGGCCGCGC CTTCGGCGGA TCTCACGGGG CTTGCGATCA AGCTCGACGA CGCGATCGCG 
AAGGTCGACA CGCTGCCGCT CGCGGGCGAA GTGCTCGCGC CGCACGCGCA GGCGAAGCCC 
GACGCCGCCG CGAGCGCCCG GCAGGCGGCC GCGGCGGCGG GCGAGCCGCG CTGGAAGGCC 
TGGTGGCGCG GCTTCTCGGC GGGCATCGGC GAGCAACTGA AGTCGCTCGT CGAGGTGCGC 
CGCATCGATC ACGCGGACGC GATGCTCGCG TCGCCCGAAC AGGGCTACTT CGTGCGCGAG 
AACGTGAAGC TGCGTCTGCT GAGCGCGCGG CTGTCGCTGC TCGCGCGCGA CGACGGCGCG 
ATGAAGTCCG ATCTGCATGC CGCGCAGGCG GCCGTGGCGC GCTACTTCGA CGGCGCATCG 
AAGGACACCC GGGTCGTTCA GGATCTGCTC AAGCAGGTCG ACGCCGCGTC GCTGACGGTC 
GCGGTGCCGA ACCTCAATAC GAGCCTGAAC GCGGTTCAAC AGTTCAAGAG CCGGGGTTGA

Protein sequence

MAGAPRTFTA VLTRPDGQSA ALAAQLAAAG IDVLDFPLID IAPLADDAPL AEAFARLDAY 
ALVVFVSPNA VDHALARLGA IWPHPLPIGV VGPGSVAALA RHGIAAPAHR VIAPSAPDDG 
GEPHYDSESL FAEIARAFNG EAKLAGKRVL IVRGDGGREW LAERLREAGA EVELVAAYRR 
VSPEPSIGAW ERVHALLSGA PHAWLVTSSE GVRNLQELAH EHLNETEIDA LKHARFVAPH 
SRIVETARAL GFDRITLTGA GDERIVRAFR TLADQADQPA TAAPMPSRMT DTNDTKDVSS 
KPAAAPVAPP NQPFTPFETK ERRGAASAAL WFVVVVIAAA AGVGGYALNR KVDRLDQHAT 
ERQKALDAQT AELRTKTEQA LASVRQADSQ LSQLEGKLAD AQTAQTALQQ QYQDLSRNRD 
AWMIEEVGQM LSSASQQLLL TGNTQLALIA LQNADARLAS SQSAQAVVVR KAIAQDIERL 
KAAPSADLTG LAIKLDDAIA KVDTLPLAGE VLAPHAQAKP DAAASARQAA AAAGEPRWKA 
WWRGFSAGIG EQLKSLVEVR RIDHADAMLA SPEQGYFVRE NVKLRLLSAR LSLLARDDGA 
MKSDLHAAQA AVARYFDGAS KDTRVVQDLL KQVDAASLTV AVPNLNTSLN AVQQFKSRG