Gene BURPS1106A_A0947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0947
Symbol
ID	4904412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	922772
End bp	923863
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	68%
IMG OID	640144053
Product	outer membrane porin
Protein accession	YP_001074983
Protein GI	126458389
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.651765
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC ATCGCCGCCT TGCCGGCACG ACTGCGATCT CAGCGAGCCT CGCCGCGTGC 
GCGGGCCTCG CGTCCGGCCA CGCGCTCGCG CAATCGAGCG TCACGCTGTA CGGGATCATG 
GACGCGGGCA TCGAATACGT GAACCACGCG GCGCCCGACG GCGGCGGCGC GTTCCGGATG 
AAATCGGGCA ACAAGAACAC TTCGCGCTGG GGTCTGCGCG GCGTCGAGGA TCTCGGCGGC 
GGGCTGAAGG CGGTGTTCCG GCTCGAAAGC GGGATCGATC TCGCGAACGG CGCGTTCGAC 
GACGGCCCCG ACTCGATCTT CGCGCGGCGC GCGACGGTCG GCCTCAAGGG CCAGTGGGGC 
GAGCTCACGC TCGGGCGCAA CTTCACGCCC ACGTACGACT ACATGCTGCC GTTCGACCCG 
ATGGGCTACG CGCAGAACTA TTCGTGGGCG ACGTCCTCGA CGGCCACGGG CGGCCGCAAG 
GACGGCCTCT TCACGCGCTC GTCGAACGCG GTGCGCTACG ACGGCGCGTA CGGCGGCCTG 
CGCTTCGGCG CGATGTACGG CTTCGGCAAC GTGCCGGGCA GCATGAAGAC GAGCTCGAAA 
TACGATTTCG CGCTCGGCTA CGAGAGCGGC CCGTTTGCCG CGGTCGTCAC GTTCGACCGC 
CAGAACGGCG CGGCCGACAG CGTGACCCCG GCGGACCCCG TCAATTACGT GCAGGGCATT 
CACGCGGGCG TCAGCTACGA CTTCGGCCGC CTGAAGACGA TGGCGGGCTA CCGCAACTAC 
CGCCGCACGT ATCACACGGC GGCGGCGACG CAATTGAGCG ACATGTACTG GCTCGGCGGC 
TCGTACGACT TCACGCCGGC GTTCTCGCTG ACGGGCGCGC TCTACCACCA GAACATCAAG 
GGCGGCACCG ACGCCGATCC GACGCTCGTG TCGCTGCGCG CGCAATACGC GCTGTCCAAG 
CGCACGGTGC TGTACGCGGC GGGCGGCTTC GCGATCGCCA AGCACGGGCA GAACGTCAGC 
GTGTCGCGCG ACTCGGTCGG ATACGCGGAT ACGCAGCTCG GCGTGACCGT CGGGATGCAG 
CAGCGGTTCT GA

Protein sequence

MKKHRRLAGT TAISASLAAC AGLASGHALA QSSVTLYGIM DAGIEYVNHA APDGGGAFRM 
KSGNKNTSRW GLRGVEDLGG GLKAVFRLES GIDLANGAFD DGPDSIFARR ATVGLKGQWG 
ELTLGRNFTP TYDYMLPFDP MGYAQNYSWA TSSTATGGRK DGLFTRSSNA VRYDGAYGGL 
RFGAMYGFGN VPGSMKTSSK YDFALGYESG PFAAVVTFDR QNGAADSVTP ADPVNYVQGI 
HAGVSYDFGR LKTMAGYRNY RRTYHTAAAT QLSDMYWLGG SYDFTPAFSL TGALYHQNIK 
GGTDADPTLV SLRAQYALSK RTVLYAAGGF AIAKHGQNVS VSRDSVGYAD TQLGVTVGMQ 
QRF