Gene BURPS1106A_3962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3962
Symbol
ID	4899538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3866697
End bp	3867761
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	65%
IMG OID	640137188
Product	Rieske family iron-sulfur cluster-binding protein
Protein accession	YP_001068182
Protein GI	126453073
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTCG ATACGGACCT CCTCCATCGC CACTGGCATC TCGGCTGTCA CCGCCGGGAG 
CTTCCGAACG ACGGCGATTT CGTGCGCTTC GACACCGCAA TCGGCGAAAT CGTGATCTTC 
AACGATGCGG GCGAGCTCGT CGCGTTCGAC AACCGCTGCC CGCACCGCGG CGCCCGCATG 
TATGTGGACG ACAGCGGCAA CCAGCCGGCG AGCTGCCCGT ACCACGGCTG GACGTATCGC 
GAGGGCCGGC TGCTGATACC GGGCCGCGAG CGCTTCGACG GCTGCGCGCT CGAGCGCGCG 
AAGCTGCGTA CGTTCGCCGT CGACTGGTGC GGCGACTTCC TGTTCTTTGC CGTCCACCCG 
CAGACCGATC TCTACACGCA GCTCGGCAGA TTCGCCGAGG CCGTCGAGAA CATCTCGTTC 
AACATCGATC GACGCCTCGA CTTGAACCGC TACGATTTCG AATGCTACTG GCCGCTCGCG 
ATCGAGAACG CGCTCGAGCC GTACCACATC GGCGCCGTTC ATCCGCAGAC ACTCGCCACG 
CTCGGGCTCG AAGACGGCGA GAACGTGTTC GACGGCGTCA ATTGCGCATG GTACGCCCCC 
GTCGGCGCGA GCCGGCAGCG CAATCAGCTC GCCCGGCTCA AGCGCTTCTT CAATCTCGAT 
TACCAATACG AAGGGTACGC GAGCATCTAT CTGTTTCCGT TCACGATGAT CTCGTCGACG 
TACGGCTACT CGTATTCGCT GCAGCATTTT CTGCCCGCGG GCGGCGGCGG CGATCGCACG 
CGCTTCACTA GCCGGCTTTA TGCGGCGCCC GCGGCGAGCG AACAGGCGGC GCAGGCGCTC 
GGCGCCTTCT TCGAATCGAC GCGAGACGTC AATCGGCGGG TGTTCGAAGA GGACCACGCG 
ATCTGCAAGC GAATGCCGAG GAACGCGTGG TCGATGGCGC CGCTCGCGTG CGCGGCCGAC 
ACCGAAGCGA AAATCGATCA TTTCCGCCGC GCGTGCCGCA CGTTCGCCGC GTCGCGCGCC 
GCGCTTCCCG TCGTCGACGC GACACGCGAG GCGGCGGCCG GGTAA

Protein sequence

MNFDTDLLHR HWHLGCHRRE LPNDGDFVRF DTAIGEIVIF NDAGELVAFD NRCPHRGARM 
YVDDSGNQPA SCPYHGWTYR EGRLLIPGRE RFDGCALERA KLRTFAVDWC GDFLFFAVHP 
QTDLYTQLGR FAEAVENISF NIDRRLDLNR YDFECYWPLA IENALEPYHI GAVHPQTLAT 
LGLEDGENVF DGVNCAWYAP VGASRQRNQL ARLKRFFNLD YQYEGYASIY LFPFTMISST 
YGYSYSLQHF LPAGGGGDRT RFTSRLYAAP AASEQAAQAL GAFFESTRDV NRRVFEEDHA 
ICKRMPRNAW SMAPLACAAD TEAKIDHFRR ACRTFAASRA ALPVVDATRE AAAG