Gene BURPS1710b_A1789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1789
Symbol
ID	3692644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2177869
End bp	2179068
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	66%
IMG OID	637732043
Product	outer membrane porin
Protein accession	YP_336946
Protein GI	76818828
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGG GGGCAGCAGC ATGGTTGGTG GCGGGGAGCA TGTGCGCCGG CGCGCACGCG 
CAAGGCACGG TGACGCTCTA CGGGATCGTC GACGCGGGGC TCGGCTATAC GAGCGAGCAG 
CGCGTCGCGC AGACCAAGGG GGCGCTCGGC TCGCCCGTCG GCTACCGCAA TGAGTCGAGC 
TACGGCTTCG CGAGCGGCAT CTGGTCGGGC AGCCGCTGGG GGCTGAAGGG CAAGGAGGAG 
CTGGGCGGCG GTCTCGCAGC CGTGTTCCAG CTCGAGAACG GCTTTAACAT CGGCACCGGA 
CAGGCGGGAC AGGGCGGGCG AATGTTCGGC CGGCAGGCGT GGATGGGGCT GTCGAGCGAA 
CGCTACGGGA CGCTCACGAT GGGGCGCCAG TACGATCCGA TCGTCGACTT CGTCGGCACG 
ATCGGCGCGG GCGCGTTCCT GACCGGCATG GGCGCGCATC CGGGCGATCT CGACAACATC 
GACAATCAGG CGCGCGAGAA CAACTCGATC AAGTACGTGA GCCCGAAGTT CGGCGGCCTC 
GCGCTCGGCG CGCTGTACGG CTTCGGCAAT CAGGCGGGCA GCGTGAAGAA CCAGAACACG 
TGGAGCGTGG GCGGCCAGTA TGTGAACGGG CCGTTCTCGC TCGGCGCCGC GTACCTGTAT 
GCGACGAACG CGTACGGCGC GAACGGCGGC GCGTGGACGG GTTCGTACGA CGGCACGTTC 
GCTTCGTCGA TCAACGAAGG CTTCGCATCG GCGAAGAGCA TGCAGATCGT CGCGGCGGCG 
AGCACCTATC AGATCGGCGC GGTGACGCTC GGCCTGTCTT ACAGCAACAC GCGGTACAAA 
TCCGGCGCGT TCTCGACGTT CAACGGCACC GCGACGTACA ACTCGATCGG CGGCACCGTA 
TCGTGGCAGG CGACGCCCGA GCTGCGCGTC GCGGCGGGCT ATGATTTCAC GCGTGGCAGC 
TCGATCGACG GTCAGTCCGC GCCGAAATAC CATCAGGTGA ACTTCGCGTC GTACTACTAC 
CTGTCCAAGC GCACCGCGCT GTATGGCCTC GTCGATTATC AGAAGGCGAG CGGCAAGACG 
CTCGATGCGT ACGGCAACGT CGTCGCGGCG ACGGCGTCGG TCGGCGACGT CGGCAACGGC 
ATTTCGTCGG CGGGCGATAC GCAGACGCTC GTGCGCATCG GCGTGCGTCA CACGTTCTGA

Protein sequence

MKKGAAAWLV AGSMCAGAHA QGTVTLYGIV DAGLGYTSEQ RVAQTKGALG SPVGYRNESS 
YGFASGIWSG SRWGLKGKEE LGGGLAAVFQ LENGFNIGTG QAGQGGRMFG RQAWMGLSSE 
RYGTLTMGRQ YDPIVDFVGT IGAGAFLTGM GAHPGDLDNI DNQARENNSI KYVSPKFGGL 
ALGALYGFGN QAGSVKNQNT WSVGGQYVNG PFSLGAAYLY ATNAYGANGG AWTGSYDGTF 
ASSINEGFAS AKSMQIVAAA STYQIGAVTL GLSYSNTRYK SGAFSTFNGT ATYNSIGGTV 
SWQATPELRV AAGYDFTRGS SIDGQSAPKY HQVNFASYYY LSKRTALYGL VDYQKASGKT 
LDAYGNVVAA TASVGDVGNG ISSAGDTQTL VRIGVRHTF