Gene BURPS1106A_2048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2048
Symbol
ID	4900024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2031294
End bp	2032394
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	65%
IMG OID	640135278
Product	outer membrane porin
Protein accession	YP_001066313
Protein GI	126454873
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.569362
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC TCTTGATCGC GCTGCCGCTC GCCGCGGCCG CTACCACCCA CGCCCAGAGC 
AGCGTCACGC TATACGGCGT CCTCGAGGAC GGCGTCGACT ATGTGTCGAA CGTGCAGGGT 
AAGCATCTCG TGCAGCTCGC GTCGGGCGTG ACGGCCGGCA GCCGCTGGGG CGTGCGCGGT 
ACCGAGGATC TCGGCGGGGG CCTGAGCGCG ATCTTCCGGC TCGAAAGCGG CTTCGACATC 
AATTCCGGCC GCCTCGGCAG CGGTCTTGCG TTCTCGCGCA ACGCGTACGT CGGCGTCGGC 
GACGCGAAGC TCGGCACGCT CACGCTCGGC CGCCAGTGGG ATTCGATCGT CGATTACGTC 
GAGCCGTTCA CGCTGAACGG CAACATCGGC GGCTACTACT TCGCGCACCC GAACGACATG 
GACAATACCG ACAACGGCTT CCCGATCTCG AACGCGGTCA AGTACCGCAG CCCGACGATC 
GCGGGCTTCA CGTTCGGCGG CCTCTACGCG TTCGGCGGCC AGCCGGGCCG CTTTTCGGAC 
AACGCGACGT TCAGCGTCGG CGCGAACTAC GCGGCGGGCC CGGTCGGCTT CGGCATCGGC 
TATTTGCGGA TCAACAATCC GGGCGTATCG ACGCAGGGTT ACCAGAACTA TCCGGGCTTC 
ACGAACGCGG TGTACGGCAA CTATCTCGAC GCGGCACGTG CTCAGAAGGT GTTCGGCGTC 
GGCGCGTCGT ACCAGGTCGT GCAATGGCTG AAGCTGCTGG CCGATTTCAC GAACACGAAC 
TTCCAGCAAG GCAGCGCGGG ACATGATGCG ACCTTCCAGA ACTATGAGCT GTCGGCGCTC 
GTCAAGCCGA CGCCCGCGGT AACGATCGGC GCGGGCTATA CGTACACAAC GGGCCGCGAC 
CACGCGACGA ATGCGGAGCC GAAGTATCAT CAGTTCAACC TGAGCGTTGA ATACGCGCTG 
TCCAAGCGCA CGAGCGTCTA TGCGATGGGT GCGTTCCAGA AGGCGGCGGG GGATGCACCG 
GTCGCGCAGA TCGCGGGTTT CAATCCGTCG GGCAACCAGA AGCAGGCGGT CGGGCGAGCC 
GGTATCCGCC ACGTGTTCTG A

Protein sequence

MKKLLIALPL AAAATTHAQS SVTLYGVLED GVDYVSNVQG KHLVQLASGV TAGSRWGVRG 
TEDLGGGLSA IFRLESGFDI NSGRLGSGLA FSRNAYVGVG DAKLGTLTLG RQWDSIVDYV 
EPFTLNGNIG GYYFAHPNDM DNTDNGFPIS NAVKYRSPTI AGFTFGGLYA FGGQPGRFSD 
NATFSVGANY AAGPVGFGIG YLRINNPGVS TQGYQNYPGF TNAVYGNYLD AARAQKVFGV 
GASYQVVQWL KLLADFTNTN FQQGSAGHDA TFQNYELSAL VKPTPAVTIG AGYTYTTGRD 
HATNAEPKYH QFNLSVEYAL SKRTSVYAMG AFQKAAGDAP VAQIAGFNPS GNQKQAVGRA 
GIRHVF