Gene BURPS668_1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1821
Symbol	msuD
ID	4882851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1789616
End bp	1790773
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	69%
IMG OID	640127749
Product	alkanesulfonate monooxygenase
Protein accession	YP_001058857
Protein GI	126439281
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03565] alkanesulfonate monooxygenase, FMNH(2)-dependent

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTGT TCTGGTTCAT CCCCACGCAC GGCGACAGCC GCTATCTCGG CACGGCCGAG 
GGCGCGCGCG CCGCGGACTA CGACTACTTC CGGCAGGTTG CCGTCGCAGC CGACACGCTC 
GGCTACGACG GTGTGCTGCT GCCGACGGGG CGTTCGTGCG AGGATGCGTG GGTGGTCGCC 
TCGAGCCTGA TTCCGGCGAC GAAGCGCCTG AAGTTCCTGG TCGCGATCCG CCCGGGCCTG 
TCGTCGCCGG GGCTCTCCGC GCGGATGGCG TCGACGTTCG ACCGGCTCTC CGATGGGCGT 
TTGCTGATCA ACGTCGTGAC GGGCGGCGAT TCGGCCGAGC TAGAAGGCGA TGGCCTCTTC 
GCCGATCACG ACACGCGCTA CGCGATCACC GACGACTTCC TGCACATCTG GCGCGGGCTG 
CTCGCCGAAT CGCACGAGAA CGGCGGCATC GATTTCGACG GCGAGCACCT GAGCGCGAAG 
GGCGGCAAGC TGCTGTACCC GCCCGTTCAG CGCCCGCATC CGCCGCTCTG GTTCGGCGGC 
TCGTCGCCCG CCGCGCACGC GATCGCGGCC GACCACATCG ATACGTACCT GAGCTGGGGC 
GAGCCGCCTG CGGCGGTCGA GAAGAAGATC GCCGACATCC GCGCGCGCGC GGCCGCGCGC 
GGCCGCGAGA TCAAGTTCGG GATTCGCCTG CACGTGATCG TGCGCGAGAC GCAGGAAGAG 
GCATGGCGCG ACGCCGATCG CCTCATCAGC CGGCTCGACG ACGATACGAT CGCGCGCGCG 
CAACAGGCGT TCGCGAAGAT GGATTCCGAA GGGCAGCGCC GGATGGCCGC GCTGCACGGC 
GGCAAGCGCG GCTCGCGCCA GGAGCTCGAG ATCTATCCGA ACCTGTGGGC GGGCGTCGGG 
CTCGTGCGCG GCGGCGCGGG GACGGCGCTC GTCGGGAATC CCGAGCAAAT CGCCACGCGG 
ATGCGCGAGT ACGCGGCGCT CGGCATCGAG ACGTTCATCC TGTCCGGCTA TCCGCATCTC 
GAGGAATCGT ACCGCTTCGC CGAGCTCGTG TTTCCGCTCG TCAAGGGCGG CGGCAACACG 
CGCCGCGCGG GGCCGCTGTC GGGGCCGTTC GGCGAAGTCG TCGGCAACCA GTATCTGCCG 
AAGGCGAGCC AGAGCTGA

Protein sequence

MNVFWFIPTH GDSRYLGTAE GARAADYDYF RQVAVAADTL GYDGVLLPTG RSCEDAWVVA 
SSLIPATKRL KFLVAIRPGL SSPGLSARMA STFDRLSDGR LLINVVTGGD SAELEGDGLF 
ADHDTRYAIT DDFLHIWRGL LAESHENGGI DFDGEHLSAK GGKLLYPPVQ RPHPPLWFGG 
SSPAAHAIAA DHIDTYLSWG EPPAAVEKKI ADIRARAAAR GREIKFGIRL HVIVRETQEE 
AWRDADRLIS RLDDDTIARA QQAFAKMDSE GQRRMAALHG GKRGSRQELE IYPNLWAGVG 
LVRGGAGTAL VGNPEQIATR MREYAALGIE TFILSGYPHL EESYRFAELV FPLVKGGGNT 
RRAGPLSGPF GEVVGNQYLP KASQS