Gene BURPS1106A_A0747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0747
Symbol
ID	4903420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	738058
End bp	739326
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	64%
IMG OID	640143853
Product	Rieske family iron-sulfur cluster-binding protein
Protein accession	YP_001074783
Protein GI	126457442
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.239242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGCAA GGAATCCGGA GCAAACGATG AAAGTATCGG CAGACGTCCG CGCGCTGGTG 
GCGCGCCGCA AGGCAGGCTA CAGCCTCGAA GCCCCGTTCT ATCTGAGCGA CGAGATCTTT 
GCGCTCGACA TGGACGCGAT CTTTCGGCGG CACTGGATCC AGGTGGGCGT CGAGCCGGAC 
GTGCCCGAGC CCGGCGATTA CGTGACGGTG CAGCTCGGGG GCGATTCGAT CCTGATCGTG 
CGCGACGACG ACATGCAGGT TCGCGCGTTC CACAACGTCT GCCGCCATCG CGGCGCGCGC 
CTGTGCAACG AGGAAAAAGG GTCGGTCGGC AACATCGTGT GCCCGTATCA CAGCTGGACC 
TACAACCTCA CGGGCCAGTT GATGTTCGCC GAGCACATGG GCGAGAAGTT CGACCGCTGC 
AAGCACAGCC TGAAGCCCGT GCATCTGGAG AATCTCGCGG GGCTGCTGTT CGTGTGCCTC 
GCCGACGAGC CGCCCGTCGA TTTCGCGACG ATGCGCGCGG CGATGGAGCC GTATCTGCTG 
CCGCACGATC TGCCGAACAC GAAGATCGCC GCGCAGATCG ACATCGTCGA GAAAGGCAAC 
TGGAAGCTGA CGATGGAGAA CAATCGCGAG TGCTATCACT GCGTCGCGAA CCATCCGGAG 
TTGACCATTT CGTTGTACGA ATACGGCTTC GGCTATCAGC CATCGCCCGC GAACGCCGAA 
GGCATGGCCG CGTTCGAGCG CACCTGCGTC GAGCGCGCCG CGCAGTGGGA AGCGCTGAAC 
CTGCCGTCCG TCGAAGTGGA GCGCCTCACC GACGTGACGG GCTTTCGCAC GCAGCGTCTG 
CCGCTCGACC GCAGCGGCGA ATCGCAAACG CTCGATGCGA AGGTCGCGTC GAAGAAGCTG 
CTCGGCGAAT TCCGCCAGGC GGATCTCGGC GGCCTGTCGT TCTGGACGCA GCCGAATTCG 
TGGCACCACT TCATGAGCGA TCACATCGTC ACGTTCTCGG TGATTCCGCT GTCGGCGGGC 
GAGACGCTCG TGCGCACGAA ATGGCTCGTT CACAGGGACG CGAAGGAAGG CATCGACTAC 
GACGTGAAGA ACCTCACGGC CGTCTGGAAC GCGACGAACG ATCAGGATCG CGCGCTCGTC 
GAATTCTCGC AGCGCGGCGC GGCGAGCAGC GCCTACGAGC CCGGCCCGTA TTCGCCGTAC 
ACCGAAGGGC TCGTCGAGAA GTTCTGCGAG TGGTACGTCG GCCGGCTGGC CGCGCATATC 
GGCGCATAG

Protein sequence

MDARNPEQTM KVSADVRALV ARRKAGYSLE APFYLSDEIF ALDMDAIFRR HWIQVGVEPD 
VPEPGDYVTV QLGGDSILIV RDDDMQVRAF HNVCRHRGAR LCNEEKGSVG NIVCPYHSWT 
YNLTGQLMFA EHMGEKFDRC KHSLKPVHLE NLAGLLFVCL ADEPPVDFAT MRAAMEPYLL 
PHDLPNTKIA AQIDIVEKGN WKLTMENNRE CYHCVANHPE LTISLYEYGF GYQPSPANAE 
GMAAFERTCV ERAAQWEALN LPSVEVERLT DVTGFRTQRL PLDRSGESQT LDAKVASKKL 
LGEFRQADLG GLSFWTQPNS WHHFMSDHIV TFSVIPLSAG ETLVRTKWLV HRDAKEGIDY 
DVKNLTAVWN ATNDQDRALV EFSQRGAASS AYEPGPYSPY TEGLVEKFCE WYVGRLAAHI 
GA