Gene BURPS668_A2537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2537
Symbol
ID	4886944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2449313
End bp	2450419
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	62%
IMG OID	640132474
Product	Rieske family iron-sulfur cluster-binding protein
Protein accession	YP_001063530
Protein GI	126445482
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAATC TGAGCGACGC ACTGCAGCTG AAGTCGGCAC ATAGCCAGCT TCCCGTCACC 
GCTTATTTCG ATGAGGCGCT CCTCGCGCGC GAAATCGAAA CACTTTTCAA GAAAGGACCT 
CGCTATGTCG GGCACGAATT GATGGTGCCC GAAGCAGGAG ATTATTTTGC GCTGCCTTCC 
GAAGACGAAG GCCGCGTGCT GGTGCGCAAC CAGGCTTCGC AGATCGAGCT GCTGTCGAAC 
GTGTGCCGCC ACCGCCAGGC GATCATGCTG AACGGCCGCG GGCGTACGCA GAACATCGTC 
TGCCCGCTGC ATCGCTGGAC CTACGATCTC GAAGGCCAGT TGCTCGGCGC GCCGCACTTT 
CCGGACAAGC CCTGCCTGAA CCTGCACGCG ACGCCGCTGC AGCACTGGCA AGGGCTGCTG 
TTCGAGGCCG AAGGCCGCGA TGTCGCGCAC GATCTCGCGC AACTCGGCAC GAAGCACCAT 
TTCGACTTTT CGGACTACCT GTTCGATCAC GTCGAGATCC ACGAGTGCAA TTACAACTGG 
AAGACCTTCA TCGAGGTCTA CCTCGAGGAC TACCACGTCG TGCCGTTCCA TCCGGGCCTC 
GGCAGCTTCG TGTCGTGCGA CGACCTGAAG TGGGAATTCG GCGACTGGTA CAGCGTGCAG 
ACGGTGGGCG TGCACAACGC GCTCGCGAAG CCGGGCAGCC CGACGTACCA GAAGTGGCAC 
GATCAGGTGC TCCGTTATCG CAACGGCGTG CCGCCGGAGT TCGGCGCGAT CTGGATGGTC 
TATTACCCGG GCCTCATGAT CGAGTGGTAT CCGCACGTGC TCGTGGTGTC GTGGCTGATT 
CCGCGCGGCC CGCAGAAGAC GACGAACATC GTCGAGTTCT ACTACCCCGA GGAAATCGCG 
CTGTTCGAGC GCGAGTTCGT CGAGGCGGAG CGCGCCGCCT ATATGGAGAC CGCGATCGAG 
GACGACGAGA TCGCATGGCG CATGGACGCC GGCCGCCGCG CGCTAATGGA GCGCGGCGAA 
TCGCAGGTCG GCCCGTATCA GAGCCCGATG GAAGACGGCA TGCAGCACTT CCACGAGTTC 
CTGCGCCGGC AACTCGGCGC GATCTGA

Protein sequence

MSNLSDALQL KSAHSQLPVT AYFDEALLAR EIETLFKKGP RYVGHELMVP EAGDYFALPS 
EDEGRVLVRN QASQIELLSN VCRHRQAIML NGRGRTQNIV CPLHRWTYDL EGQLLGAPHF 
PDKPCLNLHA TPLQHWQGLL FEAEGRDVAH DLAQLGTKHH FDFSDYLFDH VEIHECNYNW 
KTFIEVYLED YHVVPFHPGL GSFVSCDDLK WEFGDWYSVQ TVGVHNALAK PGSPTYQKWH 
DQVLRYRNGV PPEFGAIWMV YYPGLMIEWY PHVLVVSWLI PRGPQKTTNI VEFYYPEEIA 
LFEREFVEAE RAAYMETAIE DDEIAWRMDA GRRALMERGE SQVGPYQSPM EDGMQHFHEF 
LRRQLGAI