Gene BURPS668_0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0049
Symbol
ID	4882405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	47677
End bp	48777
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	66%
IMG OID	640125977
Product	putative porin
Protein accession	YP_001057104
Protein GI	126441408
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.30645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGT TTGCGGTAGC GGCGGCGGGC CTTGCCGTCG CGACGGGCGC GCACGCGTCC 
GACGGCAGCG TCACGCTGTT CGGCCTGATC GATGCCGGCG TGTCGTACGT GTCGAACGAA 
GGCGGCAAGC GCAACGTGTA TTTCGACGAC GGCATCGCGG TGCCGAATCT ATGGGGGCTT 
CGGGGCACCG AGGATCTCGG CGGCGGCGCG AAGGCGATTT TCGAGCTGAC GTCGCAATAC 
GCGCTCGGCA ACGGCGCCGC GCTGCCGACG CCGGGCTCGA TTTTCTCGCG CACCGCGCTC 
GTCGGCCTCT GGAGCGAGCG GCTCGGCAGC ATGACGCTCG GCCAGCAATA CGACTTCATG 
ACCGATTCGC TGACGTTCGG CTCGTTCGAC GGTGCGTTCC GCTACGGCGG CCTGTACAAC 
TTCCGCCAGG GGCCGTTCTC GAAGCTCGGG ATTCCCGACA ATCCCACCGG CTCGTTCGAC 
TTCGACCGGT TGGCGGGTTC GAGCCGCGTG CCGAACTCGG TCAAGTACAC GAGCGCGAAC 
CTGAACGGGC TCGTGTTCGG CCTGATGTAC GGTTTCGGCA ATCAGGCGGG CGGCGGGCTC 
GCGGCGAACA GCACCGTCAG CGCCGGCCTA AAGTACGAGA CGGGCAGTTT CGCGCTCGGC 
GCCGCCTATG TCGAAGTCAA GTATCCGCAG ATGAACAACG GGCACGACGG GCTGCGCAAC 
TGGGGGCTCG GCGCGCGTTA TGCGCTGTCC GCGTTCGATC TGAATCTGCT GTACACGAAC 
ACGCGCAACA CGCTGACGGG CGCCGCGATC GACGTGATCC AGGCCGGCGT GCGCTACGTC 
GGCGCGCCGT GGACGATCGG CGCGAACTAC GAGTACATGA AGGGCAACGC GCAGCTCGAT 
CGCAACTACG CGCATCAAGT CACGGCGGCC GCGCAGTATG CGCTGTCCAA GCGCACGTCC 
GCGTACGTCG AGACCGTGTA CCAGTACGCG GGCGGCAGCG CGGGCGCGCA TGCGTGGATC 
AACGGCGTGA TGGGGCCCGA TGCGCAGTCG AGCTCGCGTT CGCAGTTTCT CGCGCGAATC 
GGCATGCTTA CCCGTTTCTG A

Protein sequence

MKKFAVAAAG LAVATGAHAS DGSVTLFGLI DAGVSYVSNE GGKRNVYFDD GIAVPNLWGL 
RGTEDLGGGA KAIFELTSQY ALGNGAALPT PGSIFSRTAL VGLWSERLGS MTLGQQYDFM 
TDSLTFGSFD GAFRYGGLYN FRQGPFSKLG IPDNPTGSFD FDRLAGSSRV PNSVKYTSAN 
LNGLVFGLMY GFGNQAGGGL AANSTVSAGL KYETGSFALG AAYVEVKYPQ MNNGHDGLRN 
WGLGARYALS AFDLNLLYTN TRNTLTGAAI DVIQAGVRYV GAPWTIGANY EYMKGNAQLD 
RNYAHQVTAA AQYALSKRTS AYVETVYQYA GGSAGAHAWI NGVMGPDAQS SSRSQFLARI 
GMLTRF