Gene BURPS668_2801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2801
Symbol
ID	4881801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2764372
End bp	2765379
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	68%
IMG OID	640128729
Product	RluA family pseudouridine synthase
Protein accession	YP_001059822
Protein GI	126439038
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.000617612
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAGT TAGGCAAAAA ATCCCATAAT TCGGTCGCAA GCGGTCAGGT TTCGCTCATC 
GAGATCGACG AAAGCGCGGC CGGGCAGCGC ATCGACAACT TCCTGCTGCG CGTCTGCAAG 
GGCGTGCCGA AGAGTCATAT TTACCGGATC CTGCGCAGCG GCGAAGTCCG CGTGAACAAG 
GGCAGGATCG ATGCGCAGTA CCGGCTCGCG TTCGGCGACG TCGTGCGCGT GCCGCCCGTG 
CGCGTCGCGG CGGCCGATCT TGCGCGCGCG GCCGGCCCGG CGCCCGTGCC CGCCGCGGAA 
TTCGAGATCC TGTTCGAGGA CGACGCGATC ATCGTGCTGA ACAAGCCGGC AGGCGTCGCC 
GTGCACGGCG GCAGCGGCGT CGCGTTCGGC GTGATCGAGC AGATGCGCCA TGCGCGGCCG 
CACGCGAAAT TCCTCGAACT CGCGCACCGG CTCGACCGCG AGACCTCGGG CATCCTGATG 
CTCGCGAAGA AGCGCTCGGC GCTCGTCGGG CTGCACGAGC AGATTCGCGA GAACCGGATG 
GACAAGCGCT ACTTCGCCTG CGTGCATGGC GACTGGGCGG CCGACTGGGG CCGCCGCCGC 
GTGGTGAGGG CGCCCCTTTT CAAGTACGCG ACGCCCGACG GCGAGCGGCG CGTGCGGGTT 
CAGGAGGACG GCCTGCCGTC GCACACGGTG TTCAATCTCG TCGACCGCTG GCCGGACTAC 
GCGCTCGTCG AAGCGGAACT CAAGACGGGG CGGACCCATC AGATCCGCGT GCACCTCGCG 
CATCTCGGCC TGCCGATCGT CGGCGACGCC AAGTACGGCG ATTTCGCGCT GAACAAGGCG 
CTTGCGCGCG CGAACGCGGT GCCGTCGATC AAGCGGATGT TCCTGCACGC GCATCGGCTG 
CGCCTCGCGC ATCCGCTGAC GGGCGAGCCG CTGCAGTTCG ACGCGCCGCT GCCCGCCGAG 
TGCCGGCAAT TCATCGATCA ACTCTCCGAC TTGCGCGACA CCGCGTGA

Protein sequence

MNELGKKSHN SVASGQVSLI EIDESAAGQR IDNFLLRVCK GVPKSHIYRI LRSGEVRVNK 
GRIDAQYRLA FGDVVRVPPV RVAAADLARA AGPAPVPAAE FEILFEDDAI IVLNKPAGVA 
VHGGSGVAFG VIEQMRHARP HAKFLELAHR LDRETSGILM LAKKRSALVG LHEQIRENRM 
DKRYFACVHG DWAADWGRRR VVRAPLFKYA TPDGERRVRV QEDGLPSHTV FNLVDRWPDY 
ALVEAELKTG RTHQIRVHLA HLGLPIVGDA KYGDFALNKA LARANAVPSI KRMFLHAHRL 
RLAHPLTGEP LQFDAPLPAE CRQFIDQLSD LRDTA