Gene BURPS1106A_A0390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0390
Symbol
ID	4905109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	371369
End bp	372361
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	71%
IMG OID	640143497
Product	Rieske family iron-sulfur cluster-binding protein
Protein accession	YP_001074433
Protein GI	126455605
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.494645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACGG TCGCTCAGAT TCGTTTCGAT TCCATTGCCC GCTGGATGCC GGTCGCGCTG 
TCCGAGCAGG TGAGCGGCAG GGCGGCGCTT GCCGTCATCT GCATGGAGCA GCCGCTCGTG 
CTGTTTCGCG ACGCGTCGGG CGCCGTATGC GCGATGGAGG ATCGTTGCGC GCATCGCCGA 
GCGCCGCTAT CGCTCGGGCG CGTCACGCCC GACGGCCGGC TGCAGTGCGC GTATCACGGC 
TGGACCTACG ACGGCGCGAC GGGCGCCTGC GTGGCGATTC CGAATCTGTC GGCGAGCGAG 
CGCGTGCCCG CGCACTATGC CGCGCATGCG TACAAGACGC TCGAACGCGA CGGCTTCATA 
TGGGCCTGCG CGCGCGATGC ACCGCCACCC GCCGAAGCGA TCGCTCGCGA CGCCCGCAGC 
GCCCGGCGAT TCGCGGGCTC GGTGACGGTC GCCATCGCGC GCGACGAATA CGTCGCCGCA 
TTGGCCGACG GGCCGCATCT GACGATGCGC ATCGCCGGCC TGTACATCAC GGATTACGTG 
ATCGCGGACG CGACGCCGCA CGACGGCGAC ATCGCGACGG AACGCGGCGT CACGTGGCTG 
GCGCACATCG TCGACAGGCA CTTCGGCGTG CGTCATCCGT GGACGCTGCG CGTCACGTCG 
CCGCGAGACG GTGCCCTCGC GTCGGTCGAA CTCGCATCGC GCGACGGCGC GACGGCGCTC 
TGGGCGTCGA TCGCGATCAC GCCGGCGGCG CGCGGCGCGA CGAACGTACT GTGGCGCGGC 
GGCGTCGCGG CCGACGCGAG CGGCTTCGGC GCAAAACTGT TTCGGACGTG GGCGCGCCTG 
CACGCCGCGC CGTTCGCGAT GCTCGCGCAC GTCGACGGCC GCGCGCTGTC GACGCTCGAC 
GCGCTCTATT CGCGGGCATG GCGCGGCCCG ATCCCGGAGG GCATCGCCCA CACGCGGCCG 
ATGCCGGCCG ACTATCGCAC AAGGAGCCGA TGA

Protein sequence

MNTVAQIRFD SIARWMPVAL SEQVSGRAAL AVICMEQPLV LFRDASGAVC AMEDRCAHRR 
APLSLGRVTP DGRLQCAYHG WTYDGATGAC VAIPNLSASE RVPAHYAAHA YKTLERDGFI 
WACARDAPPP AEAIARDARS ARRFAGSVTV AIARDEYVAA LADGPHLTMR IAGLYITDYV 
IADATPHDGD IATERGVTWL AHIVDRHFGV RHPWTLRVTS PRDGALASVE LASRDGATAL 
WASIAITPAA RGATNVLWRG GVAADASGFG AKLFRTWARL HAAPFAMLAH VDGRALSTLD 
ALYSRAWRGP IPEGIAHTRP MPADYRTRSR