Gene BURPS1106A_A0838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0838
Symbol
ID	4905849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	835896
End bp	836990
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	67%
IMG OID	640143944
Product	luciferase family monooxygenase
Protein accession	YP_001074874
Protein GI	126456412
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.304793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCATG AGCCGGACCC CCTCAAGTTC GCCTACTGGG TGCCCAACGT CAGCGGCGGC 
CTCGTCGTCA GCAAGATCGA GCAGCGCACG AGCTGGGATA TCGATTACAA CCGCCGCCTC 
GCGCGCCTCG CCGAGCAGAG CGGCTTCGAC TATGCGTTGT CGCAGATCCG TTTCACGGCC 
GGCTACGGCG CCGAATATCA GCACGAGTCC GTTGCGTTCA GCCATGCGCT GCTCGCGGCG 
ACCGAGCGCC TCAACGTGAT CGCGGCGATC CTGCCGGGGC CGTGGCATCC GGCCGTCGTC 
GCGAAACAGC TCGCGACGAT CGATCAACTG AACCAGGGGC GCGTCGCGAT CAATGTCGTG 
AGCGGCTGGT TCAAGGGCGA ATTCACCGCG ATCGGCGAGC CGTGGCTCGA GCACGACGAG 
CGCTATCGCC GCTCCGAGGA GTTCATCCGC GCGGTGAAGG GCGTCTGGAC GCAGGACAAC 
TTCACGTTCA AGGGCGACTT CTACCGGTTC AACGATTACA CGCTCAAGCC GAAGCCGCTG 
CGGCAGCCGC ACCCGGAAAT CTTCCAGGGC GGCAATTCGG CGGCCGCGCG CCGGATGGCG 
GCCGCCGTGT CCGACTGGTA CTTCATGAAC GGCAACACGC CCGACGGCCA TCGCGCGCAG 
ATCGACGAGA TTCGCGCGGC GGCGGCGGCG CACGGGCGGC GGGTGAAGTT CGGCGTCAAT 
GCGTTCATCA TCGCGCGCGA CACCGAGCGC GAGGCGCGCG ACGTGCTCGA CGAGATCGTG 
CGCCACGCGG ACGTCGACGC GGTCAACGCG TTCGGCCATG CGGTCCAGCA GGCGGGCAAG 
GCCGCGCCCG AAGGGCGGGG AATGTGGGCC GATTCGAAGT TCGCCGATCT CGTGCAGTAC 
AACGACGGCT TCAAGACCAA CCTGATCGGC ACCCCCGAGC AGATCGCCGA GCGCATCGTC 
GCGCTGAAGG CGATCGGCGT CGATCTCGTG CTCGGCGGAT TCCTGCATTA TCTGGAAGAC 
GTCGAGTATT TCGGCAAGCG CGTGCTGCCG CTCGTGCGCG AACTGGAGCG GCGGCGCGAC 
GCGCAGCCGG CGTGA

Protein sequence

MSHEPDPLKF AYWVPNVSGG LVVSKIEQRT SWDIDYNRRL ARLAEQSGFD YALSQIRFTA 
GYGAEYQHES VAFSHALLAA TERLNVIAAI LPGPWHPAVV AKQLATIDQL NQGRVAINVV 
SGWFKGEFTA IGEPWLEHDE RYRRSEEFIR AVKGVWTQDN FTFKGDFYRF NDYTLKPKPL 
RQPHPEIFQG GNSAAARRMA AAVSDWYFMN GNTPDGHRAQ IDEIRAAAAA HGRRVKFGVN 
AFIIARDTER EARDVLDEIV RHADVDAVNA FGHAVQQAGK AAPEGRGMWA DSKFADLVQY 
NDGFKTNLIG TPEQIAERIV ALKAIGVDLV LGGFLHYLED VEYFGKRVLP LVRELERRRD 
AQPA