Gene BURPS1106A_3374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3374
Symbol
ID	4901100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3291528
End bp	3293183
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	67%
IMG OID	640136600
Product	mce family protein
Protein accession	YP_001067611
Protein GI	126453320
COG category	[R] General function prediction only
COG ID	[COG3008] Paraquat-inducible protein B
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAGAC CGCAAGGCCC GCAACACGAC CCGAACGCGG CCCCTCCCAC CCCGCCCGGC 
GGCGAGCCGC CCGTACTGCC CGAGCCCGTG ATCACGCGTC GCTCCGGGTG GCTGCCGTCG 
CTCGTGTGGC TCGTGCCGCT CGTCGCCGCG CTGATCGGCA TCGGGCTCGT CGTCAAATCG 
GTGCTCGAAC GCGGGCCCGA GATCACGATC AGCTTCAAGA GCGCCGAGGG CCTCGAGCCC 
GGCAAGACGC AGGTCAAGTA CAAGGACGTC GAGATCGGGA TGGTCGAGAC GATCAAGCTG 
TCGAAGGATC TGTCGCACGT GCTTGTCGAA GTGCAACTGA AGAAGGAGGC CGAGGACTTC 
GCGGTGAAAG GCACGCGCTT CTGGGTCGTG CGGCCGCGGA TCGGCGCGAC GGGCGTGTCC 
GGGCTCGGCA CGCTGCTGTC CGGCGCGTAC ATCGGCGTCG ACGCGGGCCG CTCGGACGAG 
ACCGAGAAGT CGTTCACCGG GCTCGAGACG CCGCCTGCCG TCACGGGCGA CCAGAAGGGC 
ACGCAATACG TGCTGCGCGG CGATTCGCTC GGCTCGATCG ACATCGGCTC GCCGGTGTAC 
TACCGGCGCG TGCAGGTGGG CCAGGTCGTC GGCTTCTCGC TCGACAAGGA CGGCACGGGC 
GTCACGTTCC GCGTGTTCGT CAATGCGCCT TACGACCAAT ACGTCGGCCT GAACTCGCGC 
TGGTGGCAGG CGAGCGGCGT CGATCTGCGG CTCGATTCGA GCGGCTTCAA GCTGAACACG 
CAGTCGCTCG CGACGGTGAT CCTCGGCGGC ATCGCGTTCC AGTCGCCGCC GAATCAGGCG 
GCCGGCCCGC CCGCGCCGAA CAACATGACG TTCCGCCTGG GCGCCGACGA AGGCGACGCG 
ATGCGCGAGC CGGACGGCGA GCCGGTGCAG GTCGTGATGA ACTTCAACCA GTCGCTGCGC 
GGGCTGTCGG TCGGCGCGCC CGTCGATTTC CGCGGCATCG TGCTCGGCCA GGTGACGAAC 
ATCGGCATCG ATTTCGATCC GAAGACGAAG AATTTCACGA TGCCGGTGAC GATGAACGTC 
TACCCCGACC GGCTCGGCCG CAAGTTCCGC GAGGTATCGC AGGACAAGGG CTACGCGGCG 
CGGCGCGAGG TGCTGTCGCG GCTCGTCCAG CACGGGCTGC GCGGCCAGTT GCGCACGGGC 
AACCTGCTGA CGAGCCAGTT GTACGTCGCA CTCGACTTCT TCCCGAAGGC GCCGCCCGTG 
AAGATCGATC TCGCCCGCGA GCCGGTCGAA CTGCCGACCG TGCCGAACAC GCTCGACGAG 
CTGCAGTTGC AGGTGGCGGA CATCGCGAAG AAGCTCGACA AGGTGCCGTT CGACCAGATC 
GGCGCGAACC TGAACAGCGC GCTCGCGAAC GCGGACAAGC TGTTCAAGCG GCTCGACACC 
GAGATCGCGC CCGAGGCGCG CGACACGCTG TCCGCCGCGA AGCAGACGTT CACGACCGCG 
GAGGCGACCT TGCAGCAGGA TTCGCCGCTG CAATCGGACG TGCGCGGCGC GCTCAAGGAG 
CTCACGCGCA CGCTGCAATC GCTGAACGCG CTCGCCGACT ACCTCGAGCG GCATCCCGAA 
TCGCTGCTGA AAGGCAAACC AGGAGATCAG AAATGA

Protein sequence

MNRPQGPQHD PNAAPPTPPG GEPPVLPEPV ITRRSGWLPS LVWLVPLVAA LIGIGLVVKS 
VLERGPEITI SFKSAEGLEP GKTQVKYKDV EIGMVETIKL SKDLSHVLVE VQLKKEAEDF 
AVKGTRFWVV RPRIGATGVS GLGTLLSGAY IGVDAGRSDE TEKSFTGLET PPAVTGDQKG 
TQYVLRGDSL GSIDIGSPVY YRRVQVGQVV GFSLDKDGTG VTFRVFVNAP YDQYVGLNSR 
WWQASGVDLR LDSSGFKLNT QSLATVILGG IAFQSPPNQA AGPPAPNNMT FRLGADEGDA 
MREPDGEPVQ VVMNFNQSLR GLSVGAPVDF RGIVLGQVTN IGIDFDPKTK NFTMPVTMNV 
YPDRLGRKFR EVSQDKGYAA RREVLSRLVQ HGLRGQLRTG NLLTSQLYVA LDFFPKAPPV 
KIDLAREPVE LPTVPNTLDE LQLQVADIAK KLDKVPFDQI GANLNSALAN ADKLFKRLDT 
EIAPEARDTL SAAKQTFTTA EATLQQDSPL QSDVRGALKE LTRTLQSLNA LADYLERHPE 
SLLKGKPGDQ K