Gene BURPS1106A_A2395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2395
Symbol
ID	4904699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2372063
End bp	2373175
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	63%
IMG OID	640145500
Product	Rieske family iron-sulfur cluster-binding protein
Protein accession	YP_001076427
Protein GI	126457482
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGAATGT CCAATCTGAG CGACGCACTG CAGCTGAAGT CGGCACATAG CCAGCTTCCC 
GTCACCGCTT ATTTCGATGA GGCGCTCCTC GCGCGCGAAA TCGAAACACT TTTCAAGAAA 
GGACCTCGCT ATGTCGGGCA CGAATTGATG GTGCCCGAAG CAGGAGATTA TTTTGCGCTG 
CCTTCCGAAG ACGAAGGCCG CGTGCTGGTG CGCAACCAGG CTTCGCAGAT CGAGCTGCTG 
TCGAACGTGT GCCGCCACCG CCAGGCGATC ATGCTGAACG GCCGCGGGCG TACGCAGAAC 
ATCGTCTGCC CGCTGCATCG CTGGACCTAC GATCTCGAAG GCCAGTTGCT CGGCGCGCCG 
CACTTTCCGG ACAAGCCCTG CCTGAACCTG CACGCGACGC CGCTGCAGCA CTGGCAAGGG 
CTGCTGTTCG AGGCCGAGGG CCGCGATGTC GCGCACGATC TCGCGCAACT CGGCACGAAG 
CACCATTTCG ACTTTTCGGA CTACCTGTTC GATCACGTCG AGATCCACGA GTGCAATTAC 
AACTGGAAGA CCTTCATCGA GGTCTACCTC GAGGACTACC ACGTCGTGCC GTTCCATCCG 
GGCCTCGGCA GCTTCGTGTC GTGCGACGAC CTGAAGTGGG AATTCGGCGA CTGGTACAGC 
GTGCAGACGG TGGGCGTGCA CAACGCGCTC GCGAAGCCGG GCAGCCCGAC GTACCAGAAG 
TGGCACGATC AGGTGCTCCG TTATCGCAAC GGCGTGCCGC CGGAGTTCGG CGCGATCTGG 
ATGGTCTATT ACCCGGGCCT CATGATCGAG TGGTATCCGC ACGTGCTCGT GGTGTCGTGG 
CTGATTCCGC GCGGCCCGCA GAAGACGACG AACATCGTCG AGTTCTACTA CCCCGAGGAA 
ATCGCGCTGT TCGAGCGCGA GTTCGTCGAG GCGGAGCGCG CCGCCTATAT GGAGACCGCG 
ATCGAGGACG ACGAGATCGC ATGGCGCATG GACGCCGGCC GCCGCGCGCT AATGGAGCGC 
GGCGAATCGC AGGTCGGCCC GTATCAGAGC CCGATGGAAG ACGGCATGCA GCACTTCCAC 
GAGTTCCTGC GCCGGCAACT CGGCGCGATC TGA

Protein sequence

MGMSNLSDAL QLKSAHSQLP VTAYFDEALL AREIETLFKK GPRYVGHELM VPEAGDYFAL 
PSEDEGRVLV RNQASQIELL SNVCRHRQAI MLNGRGRTQN IVCPLHRWTY DLEGQLLGAP 
HFPDKPCLNL HATPLQHWQG LLFEAEGRDV AHDLAQLGTK HHFDFSDYLF DHVEIHECNY 
NWKTFIEVYL EDYHVVPFHP GLGSFVSCDD LKWEFGDWYS VQTVGVHNAL AKPGSPTYQK 
WHDQVLRYRN GVPPEFGAIW MVYYPGLMIE WYPHVLVVSW LIPRGPQKTT NIVEFYYPEE 
IALFEREFVE AERAAYMETA IEDDEIAWRM DAGRRALMER GESQVGPYQS PMEDGMQHFH 
EFLRRQLGAI