Gene BURPS1106A_2799 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2799
Symbol
ID	4901096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2758030
End bp	2759088
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	72%
IMG OID	640136026
Product	luciferase-like monooxygenase
Protein accession	YP_001067050
Protein GI	126453937
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03558] luciferase family oxidoreductase, group 1

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGGC CCGCGTTCCG TCCCCATGCC AACCGTTCCG TCGTCGCCAT GATCCCGTTT 
TCCGTTCTCG ACCTCGCGCC GATTCCCGCC GGCGCCGACG CCGCCCAGGC GTTGCGCCAT 
TCCGTCGACC TCGCGCGGCA CGCCGAGCGC CTCGGCTATC GCCGCTACTG GCTCGCCGAG 
CACCACAACA TGCCCGGCAT CGCGAGCGCG GCGACCGCGG TCGTGATCGG CCACGTCGCG 
GGCGCGACGC GGACGATTCG CGTCGGCTCG GGCGGCGTGA TGCTGCCGAA CCATGCGCCG 
CTCGTGATCG CCGAGCAGTT CGGCACGCTC GCGTCGCTGT ACCCGGGCCG CATCGATCTC 
GGTCTCGGGC GCGCGCCCGG CACCGATCAG ACGACGGCCC GCGCGCTGCG CCGCGACCTG 
ATCGGCAGCG CCGATTCGTT CCCCGACGAC GTGGTGGAGC TGCAGCGCTA CTTCGCCGCA 
CCCGCCGCCG GCCAGCGCGT GCGCGCCGTG CCGGGCGCGG GGCTCGACGT GCCGATCTGG 
CTGCTCGGCT CGAGCCTGTT CAGCGCGCAG CTCGCCGCGA TGCTCGGGCT GCCGTTCGCG 
TTCGCTTCGC ATTTCGCGCC GGACTACCTG ATGCGCGCGC TCGACGTGTA CCGCGCGCAG 
TTCCGGCCGT CCGCCGCGCT CGACAAGCCG TATGCGATGG TCGGCGTGAA CGTGTTCGCC 
GCCGACACCG ACGACGACGC GCGACGCCTG TTCACGTCGC TGCAGCAGCA GTTCCTGAAG 
CTGCGGCGCG GCACGCCCGG CCAACTGCCG CCGCCCGTCG AATCGCTCGA CGCGCTCGGC 
GCGACCGAGC AGGAACTCGC GAACGTCGCG CATGCACTGT CGTTCGCCGC GGTCGGCTCG 
CGCGACACCG TGCACGAGCG GCTGCGGCGG TTGATCGCGC AGACGGGCGC GGACGAGCTG 
ATCGTCGCCG CGCAAATCTT CGATCACGGC GCACGGGTGC GCTCGTACGA GATCGCCGCG 
CAGGTGCGCG ACGCGCTTCG CGACGAAGCC GGGGTTTGA

Protein sequence

MRRPAFRPHA NRSVVAMIPF SVLDLAPIPA GADAAQALRH SVDLARHAER LGYRRYWLAE 
HHNMPGIASA ATAVVIGHVA GATRTIRVGS GGVMLPNHAP LVIAEQFGTL ASLYPGRIDL 
GLGRAPGTDQ TTARALRRDL IGSADSFPDD VVELQRYFAA PAAGQRVRAV PGAGLDVPIW 
LLGSSLFSAQ LAAMLGLPFA FASHFAPDYL MRALDVYRAQ FRPSAALDKP YAMVGVNVFA 
ADTDDDARRL FTSLQQQFLK LRRGTPGQLP PPVESLDALG ATEQELANVA HALSFAAVGS 
RDTVHERLRR LIAQTGADEL IVAAQIFDHG ARVRSYEIAA QVRDALRDEA GV