Gene BURPS668_A1482 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1482
Symbol
ID	4888043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1426594
End bp	1428252
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	67%
IMG OID	640131421
Product	putative halogenase
Protein accession	YP_001062478
Protein GI	126442935
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.133442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACA ATCAGGTCAG GAAATACGAC GTCGTCATCA TCGGGACGGG CATCGGCGGC 
ACGACGCTCG GCGCGATCCT CGCGCGGTAC GGGCTGCGGG TCGCGATGAT CGATTCCGGC 
ACGCATCCGC GCTTTGCCGT CGGCGAATCG ACGATCGCCA CGACCACGCT GACGCTCGAG 
CTGATGGCGA TGCGCTTCGA CGTGCCGGAG CTCAAGCACA TCACGTCGAT CGCCGAAGTG 
AGCGAGAACG TGATGCCGTC GTGCGGCGTG AAGCGCAACT TCGGCTTCGT GTATCACCGC 
GAGCACACCG AGCAGAATCC GCAGGAGGTC AATCAGGCGC TCGTCGTCAA CGAGGTGCAC 
TATTTCCGGC AGGACATCGA CGCGTACATG CTTCACGTGG CCATTCGCTA CGGCTGCGAC 
GCGTATCAGA ACACCGTCGT CGACGATATC CGGATCGACG CCGGCGGCGT GACGGTGACG 
ACGCGCGGCG GCCTCACGTT CGAGGCGGAT TTCGTCGCCG ACGGCGCGGG GTACCGCTCG 
GTGCTGGCCG ACAAGCTCGG CCTGCGCGAG ACGCCGTGCC GCGCGAAGAC GCATGCGCGC 
GGCCTGTTCA CGCACATGAT CGACGTGAAG CCGTTCGACG CCTGCCGCGA GGTGCCCAAG 
GCGCTGCAGC AGCCGGTGCC GTGGCATCAG GGGACGCTGC ACCACCTGTT CGACGGCGGC 
TGGATGTGGG TGATTCCGTT CAACAACACG CCGGAATCGA AGAACCCGCT CGTGAGCGTC 
GGCCTGATGC TCGATCCGCG CAAGCATCCG AAGCCGGACG TGCGGCCCGA GCAGGAATTC 
GCCGATTTCA TCGCGAAGCA TCCGGACATG GCGCGGCAGT TCGCCGATGC GCGCGCGGTG 
CGCGAATGGG TGTCCTCGGG CCGCATCCAG TACAGCGCGA GCGCATGCAC GGGCGACCGG 
TTCTGCCTGC TCTCGCATGC GACGGGCTTC ATCGATCCGC TGTTCTCGCG CGGCCTGTTC 
AACACGATGC AGACGACCAA CGCGCTCGCG GGGCTGCTGA TCGAAGCCGC GAAGGACCGC 
GATTTCAGCA AGGCGCGCTT CGCGCCGGTC GAGAAGCTCC AGCAGGGCCT GATCGATTTC 
AACGATCGGC TCGTCAACTG CTCGTACCTC TCGTGGGGCC ACTATCCGCT CTGGAACGCG 
TGGTTCCGCC TGTGGCTGCT CACCGGCAAC TACGGCCAGC TTCACCTGCA GCGCGCGATG 
ATGAAGTACC GGCAAACCGG CGACGCGCGC TGGCTCGAGC CGGCCGACGC GCTGTTGCCG 
GGCGCGTTCA CCACGCTCGA GCCGATCATG CGGCTGTTCG AGGAGGCGGC GGTGTGCGTC 
GAGCGGTACG GCGCGGGCGA ACTCTCGGGC GAGGCGGCCG AGCGGGCGAT CTACGCGCTG 
CTCGAGGAGA ACGCCGCGCT GCTGCCGCCG TTCTTCGATT TCGTTTCGCC CGCCGAGCGG 
ATCACCTGGC CGAGCACGCC CGAGAAGATC GCCGCGCTGC TGCTCGAGTG GGTCGAGCGG 
CTGCCGGAGG ACGTGCGGGC GGAATACTTC GACTACGACG TGCGGGCGCT GCTCCAGCAG 
CCGGTCGTCA AGGACACGAT CACCGCGGAC GTCGCGTGA

Protein sequence

MSNNQVRKYD VVIIGTGIGG TTLGAILARY GLRVAMIDSG THPRFAVGES TIATTTLTLE 
LMAMRFDVPE LKHITSIAEV SENVMPSCGV KRNFGFVYHR EHTEQNPQEV NQALVVNEVH 
YFRQDIDAYM LHVAIRYGCD AYQNTVVDDI RIDAGGVTVT TRGGLTFEAD FVADGAGYRS 
VLADKLGLRE TPCRAKTHAR GLFTHMIDVK PFDACREVPK ALQQPVPWHQ GTLHHLFDGG 
WMWVIPFNNT PESKNPLVSV GLMLDPRKHP KPDVRPEQEF ADFIAKHPDM ARQFADARAV 
REWVSSGRIQ YSASACTGDR FCLLSHATGF IDPLFSRGLF NTMQTTNALA GLLIEAAKDR 
DFSKARFAPV EKLQQGLIDF NDRLVNCSYL SWGHYPLWNA WFRLWLLTGN YGQLHLQRAM 
MKYRQTGDAR WLEPADALLP GAFTTLEPIM RLFEEAAVCV ERYGAGELSG EAAERAIYAL 
LEENAALLPP FFDFVSPAER ITWPSTPEKI AALLLEWVER LPEDVRAEYF DYDVRALLQQ 
PVVKDTITAD VA