Gene BURPS1106A_3561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3561
Symbol
ID	4902400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3466818
End bp	3467978
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	640136787
Product	outer membrane porin
Protein accession	YP_001067797
Protein GI	126452945
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGT CGCTTCTCGC GCTCGTCGCG CTGAGCGCGT TTGCTGGCGC GGCTCATGCG 
CAAAGCAGCG TGACGCTGTA CGGCATCATC GACGAAGGCT TCAACATCAA TACCAATGCA 
GGCGGCAAGC ACCTGTACAA CCTGTCGAGC GGTGTCATGC AGGGTAGCCG TTGGGGCCTG 
CGCGGCACGG AAGACCTGGG CGGTGGCCTG AAGGCGCTGT TCGTCCTCGA AAACGGCTTC 
GACGTGAACT CGGGCAAGCT GAACCAGGGC GGCCTCGAAT TCGGCCGTCA AGCGTACGTC 
GGCCTGTCGA GCGGCTTCGG CACCGTCACG CTCGGCCGTC AGTACGACTC CGTCGTCGAC 
TTCGTCGGCC CGCTGGAAGC CGGCGACCAG TGGGGCGGCT ACATCGCCGC TCACCCGGGC 
GATCTCGACA ACTTCAACAA CGCATATCGC GTGAACAACG CAGTCAAGTT CACGAGCGCG 
AACTACGGCG GCTTCACGTT CGGCGGCCTG TACAGCTTCG GCGGCGTCGC CGGCGACTTC 
AGCCGCAACC AGACCTGGTC GCTCGGCGCG GGCTACACGA ACGGCCCGCT CGTGTTGGGC 
GTCGGCTACC TGAACGCGCG CACGCCGTCG ACGGCTGGCG GCCTGTTCGG CAACAACACG 
ACGTCGAGCA CGCCGGCTGC CGTGACGACC CCGGTCTACG CGGGCTATGC GTCGGCCCAT 
ACGTACCAGG TGATCGGTGC GGGCGGCGCC TATTCGTTCG GCGCGGCGAC GGTCGGCATC 
ACGTACTCGA ACATCAAGTT CATGAACTTC GCGAGCACGG TGTTCCCGAA CCAGACCGCG 
ACGTTCAACA ACGCGGAAAT CAACTTCAAG TATCAGTTGA CCCCGACGCT GCTCGCCGGC 
GCGGCGTATG ACTACACGCA AGGCAGCAAG ATCGCCGGCT CGTCCGCGGC CAAGTATCAC 
CAAGGCTCGG TCGGCGTCGA CTACTTCCTG TCGAAGCGCA CCGACGTCTA CGCGATCGGC 
GTGTATCAGC ACGCTTCGGG CAACGTGATC GAAGCCGACG GCAACACGGT CGGCCCGGCG 
ACCGCCGCGA TCAACGGCCT GACGCCGTCG TCGAACCGCA ACCAGTTCGC AGCGCGCGTC 
GGCATCCGCC ATAAGTTCTA A

Protein sequence

MKKSLLALVA LSAFAGAAHA QSSVTLYGII DEGFNINTNA GGKHLYNLSS GVMQGSRWGL 
RGTEDLGGGL KALFVLENGF DVNSGKLNQG GLEFGRQAYV GLSSGFGTVT LGRQYDSVVD 
FVGPLEAGDQ WGGYIAAHPG DLDNFNNAYR VNNAVKFTSA NYGGFTFGGL YSFGGVAGDF 
SRNQTWSLGA GYTNGPLVLG VGYLNARTPS TAGGLFGNNT TSSTPAAVTT PVYAGYASAH 
TYQVIGAGGA YSFGAATVGI TYSNIKFMNF ASTVFPNQTA TFNNAEINFK YQLTPTLLAG 
AAYDYTQGSK IAGSSAAKYH QGSVGVDYFL SKRTDVYAIG VYQHASGNVI EADGNTVGPA 
TAAINGLTPS SNRNQFAARV GIRHKF