Gene BMA10229_A3251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A3251
Symbol
ID	4791936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	-
Start bp	3303398
End bp	3305089
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	74%
IMG OID
Product	RNA pseudouridine synthase family protein
Protein accession	YP_001029187
Protein GI	124384572
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.9005
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCACAA AATTGACCGT CAAGAATCCG CGCCCGGCGA CGCCCGGCCG CGCCCCCGTC 
CGCTCCGGCA GCCTCACCGC GCGCAAGGTC GCGCGGCCCG ACCCGAAAGC GGCGGGCGCA 
AAACCCGCCG CGGCGAAGCC TGCTGCGAAG TCCGCATCGG CTGCCAAGCC GGCGGCGCCG 
CGCAGCGCGG CGAACGCTGC GCCGAAGCGC GCGCCGGGGC CGTCGCGCCC GGCCGCGGCA 
TCGGAAGGCA AGCGCGTCGC GAAGCCGCGC ACCGCGCACG ACGCCGGCCG CACGGGCGGC 
GAGCGTGCGC CGGCCAAGCG CGCCACCACG CCCGGCGCGG CGTCCGCGCC GCGCACGCGC 
CGCACCGACG CGAAGCCGGC GCGCCGCACC AACGAACGCC CTGCCGGCCG CGACGAGCGT 
GCACCGCGCG ACTCGGATGC GCGCGCGTTC GATGCGGGCA CGCGCGGTAA GGACCGCGCG 
CCCCGCGAGG GCGCAAGGCC CGGCGCACGG GGCGCGACGG GCGCGAAGTT CGGCGGCGCG 
GCGCGTCGAT CGGACGACGC CGACCGTCGA ACGCCCCGCG CGACGCGTGC GGACAGCCGC 
GCGCGCGATG CCGCGCCGTC GTCGTTCGCG GGCAAGACCG CGACAGCCGG CAAGCGTGCG 
CCGCAGCGCG CCGACGATCG CTACGGCGCA GCCGGGAAGC GCACATCGCC GCGCACCGAG 
CGAACCGAGC GAACCGAGCG CCCCGCCCGC TTCGGCGAAC GGCCGGCCAC CCGCGCGAGC 
GCATCCGGCG AGCGCCGCCC CACGGCCCGC GCGGCGACGG GTTCGCGCCT CAAGCTCGCG 
CAGCCGATCA AGCGCGGCAG CGGCGAACTG GGCGAATCCG CTCGCGGCGG TGAGCACGGC 
GAACGCGGCA AGCGTATCGA GCGCGGCGAC GAAACCGGCC TCGTGCGCCT GTCGAAGCGC 
ATGTCGGAGC TGGGTCTCTG CTCGCGCCGC GAAGCAGACG AATGGATCGA GAAAGGCTGG 
GTGCTCGTCG ACGGCGAGCG CATCGACACG CTCGGCACGA AGGTGCGCGC CGACCAGCGC 
ATCGAGATCG ATTCGAACGC GCGCGCCGCG CAGGCCGCGC AAGTGACGAT CCTGCTGCAC 
AAGCCGGTGG GCTACGTGTC GGGCCAGGCG GAGGACGGCT ACGCCCCCGC CGCGACGCTC 
GTCACGCGCG AGAACCACTG GAGCGGCGAC CGCTCGCCGC TGCGCTTCTC GCCGCAGCAC 
CTGCGCGCGC TCGCGCCCGC GGGCCGGCTC GACATCGATT CGACGGGCCT TCTCGTGCTG 
ACGCAGAACG GGCGCGTCGC GAAACAGCTG ATCGGCGAAC AATCGGACAT CGACAAGGAA 
TACCTGGTGC GCGTGCGCTT CGGCGAGCGC ACGGCCGACA TCGAACGCCA CTTCCCCGCC 
GAGTCGCTCG CGAAGCTGCG CCACGGCCTC GAGCTCGACG GCGTGCCGCT CAAGCCCGCG 
ATGGTCAGTT GGCAGAACGG CGAGCAACTG CGCTTCGTGC TGCGCGAAGG CAAGAAGCGC 
CAGATTCGCC GGATGTGCGA ACTCGTCGGC CTCGAGGTGA TCGGCCTGAA GCGCGTGCGG 
ATGGGCCGCG TGATGCTGGG CGCGCTGCCG CAAGGCGAGT GGCGCTATCT CGGGCCGGAC 
GAATCGTTCT GA

Protein sequence

MRTKLTVKNP RPATPGRAPV RSGSLTARKV ARPDPKAAGA KPAAAKPAAK SASAAKPAAP 
RSAANAAPKR APGPSRPAAA SEGKRVAKPR TAHDAGRTGG ERAPAKRATT PGAASAPRTR 
RTDAKPARRT NERPAGRDER APRDSDARAF DAGTRGKDRA PREGARPGAR GATGAKFGGA 
ARRSDDADRR TPRATRADSR ARDAAPSSFA GKTATAGKRA PQRADDRYGA AGKRTSPRTE 
RTERTERPAR FGERPATRAS ASGERRPTAR AATGSRLKLA QPIKRGSGEL GESARGGEHG 
ERGKRIERGD ETGLVRLSKR MSELGLCSRR EADEWIEKGW VLVDGERIDT LGTKVRADQR 
IEIDSNARAA QAAQVTILLH KPVGYVSGQA EDGYAPAATL VTRENHWSGD RSPLRFSPQH 
LRALAPAGRL DIDSTGLLVL TQNGRVAKQL IGEQSDIDKE YLVRVRFGER TADIERHFPA 
ESLAKLRHGL ELDGVPLKPA MVSWQNGEQL RFVLREGKKR QIRRMCELVG LEVIGLKRVR 
MGRVMLGALP QGEWRYLGPD ESF