Gene BTH_II2121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_II2121
Symbol
ID	3845828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007650
Strand	+
Start bp	2606460
End bp	2607452
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	71%
IMG OID	637839422
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_440309
Protein GI	83718255
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACGG TCGCTCAGAT TCGTTTCGAT TCCATTGCCC GCTGGATGCC GGTCGCGCTG 
TCCGAGCAGG TGAGCGGCAG GGCGGCGCTT GCCGTCATCT GCATGGAGCA GCCGCTCGTG 
CTGTTTCGCG ACGCGTCGGG CGCCGTATGC GCGATGGAGG ATCGTTGCGC GCATCGCCGA 
GCGCCGCTAT CGCTCGGGCG CGTCACGCCC GACGGCCGGC TGCAGTGCGC GTATCACGGC 
TGGACCTACG ACGGCGCGAC GGGCGCCTGC GTGGCGATTC CGAATCTGTC GGCGAGCGAG 
CGCGTGCCCG CGCACTATGC CGCGCATGCG TACAAGACGC TCGAACGCGA CGGCTTCATA 
TGGGCCTGCG CGCGCGATGC ACCGCCACCC GCCGAGGCGA TCGCTCGCGA CGCCCGCAGC 
GCCCGGCGAT TCGCGGGCTC GGTGACGGTC GCCATCGCGC GCGACGAATA CGTCGCCGCA 
TTGGCCGACG GGCCGCATCT GACGATGCGC ATCGCCGGCC TGTACATCAC GGATTACGTG 
ATCGCGGACG CGACGCCGCA CGACGGCGAC ATCGCGACGG AACGCGGCGT CACGTGGCTG 
GCGCACATCG TCGACAGGCA CTTCGGCGTG CGTCATCCGT GGACGCTGCG CGTCACGTCG 
CCGCGAGACG GTGTCCTCGC GTCGGTCGAA CTCGCATCGC GCGACGGCGC GACGGCGCTC 
TGGGCGTCGA TCGCGATCAC GCCGGCGGCG CGCGGCGCGA CGAACGTACT GTGGCGCGGC 
GGCGTCGCGG CCGACGCGAG CGGCTTCGGC GCAAAACTGT TTCGGACGTG GGCGCGCCTG 
CACGCCGTGC CGTTCGCGAT GCTCGCGCAC GTCGACGGCC GCGCGCTATC GACGCTCGAC 
GCGCTCTATT CGCGGGCATG GCGCGGCCCG ATCCCGGAGG GCATCGCCCA CACGCGGCCG 
ATGCCGGCCG ACTATCGCAC AAGGAGCCGA TGA

Protein sequence

MNTVAQIRFD SIARWMPVAL SEQVSGRAAL AVICMEQPLV LFRDASGAVC AMEDRCAHRR 
APLSLGRVTP DGRLQCAYHG WTYDGATGAC VAIPNLSASE RVPAHYAAHA YKTLERDGFI 
WACARDAPPP AEAIARDARS ARRFAGSVTV AIARDEYVAA LADGPHLTMR IAGLYITDYV 
IADATPHDGD IATERGVTWL AHIVDRHFGV RHPWTLRVTS PRDGVLASVE LASRDGATAL 
WASIAITPAA RGATNVLWRG GVAADASGFG AKLFRTWARL HAVPFAMLAH VDGRALSTLD 
ALYSRAWRGP IPEGIAHTRP MPADYRTRSR