Gene BURPS1106A_A1214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1214
Symbol
ID	4904039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1154244
End bp	1155368
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	63%
IMG OID	640144320
Product	outer membrane porin
Protein accession	YP_001075249
Protein GI	126456618
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGA CTCTGATTGT TGCAGCAGTT GCTGCATCGT TCGCAACCGT CGCGCACGCG 
CAAAGCAGCG TCACGCTGTA CGGTGTGCTC GACGCGGGCA TCACGTACCA AAGCAACGTC 
GCGACGCCGT CGGGCTCGGG CAAGTCGCTG TGGTCGGTCG GCGCCGGCGT CGACCAAAGC 
CGTTTCGGTC TGCGCGGCTC GGAAGACCTG GGTGGCGGCC TGAAGGCGAT CTTCACGTTG 
GAAAGCGGCT TCAACATCGG TAACGGCCGC TTCAACAACG GTGGCGGCAT GTTCAACCGT 
CAAGCGTTCG TCGGTCTGTC GAGCAACTAC GGCACCGTCA CGCTGGGCCG TCAGTACGAC 
GCAACCCAAG ACTACCTGTC GCCGCTGTCG GCAACGGGCA CCTGGGGCGG CACGTACTTC 
GCGCACCCGC TCAACAACGA CCGCCTGAAC ACGAACGGCG ACGTCGCGGT GAACAACACG 
GTCAAGTTCA CGAGCGCGAA CTACGCCGGC CTGCAATTCG GCGGCACGTA CTCGTTCTCG 
AACAACTCGC AATTCGCGAA CAACCGTGCA TACAGCGCGG GCGCTTCGTA CCAGTTCCAA 
GGCCTGAAGG TCGGTGCGGC GTACTCGCAA GCTAACAACG CTGGCGCGAA CACCACGGGC 
GCAACGGATC CGCTGACCGG CTTCAACATC GGCGGCACGA ACGCAGCAAG CATCCAAGGC 
CGTTCGCGCG TGTACGGCGC CGGCGCAAGC TACGCTTACG GCCCGCTGCA AGGCGGCCTG 
CTCTGGACGC AATCGCGTCT CGACAACCTG GCAAACGGCG CGCCGACCAC CCGTGCCGAC 
AACTACGAAG CAAACGTGAA GTACAACCTG ACGCCGGCTC TGGGTCTGGG TGTTGCTTAC 
ACGTACACGA ACGCGAAGGC GAACGGCGAA AGCACTCACT GGAACCAAGT TGGCGTCCAG 
GCCGACTACG CGCTGTCGAA GCGCACCGAC GTGTACGCAC AAGCCGTGTA CCAGCGTTCG 
TCGAAGAACG CGAATGCGTC GATCTACAAC GGCGACCTCA GCACGCCGTT CAGCACGTCG 
ATCAACCAAA CCGCAGCGAC GGTTGGTCTG CGTCACCGCT TCTAA

Protein sequence

MNKTLIVAAV AASFATVAHA QSSVTLYGVL DAGITYQSNV ATPSGSGKSL WSVGAGVDQS 
RFGLRGSEDL GGGLKAIFTL ESGFNIGNGR FNNGGGMFNR QAFVGLSSNY GTVTLGRQYD 
ATQDYLSPLS ATGTWGGTYF AHPLNNDRLN TNGDVAVNNT VKFTSANYAG LQFGGTYSFS 
NNSQFANNRA YSAGASYQFQ GLKVGAAYSQ ANNAGANTTG ATDPLTGFNI GGTNAASIQG 
RSRVYGAGAS YAYGPLQGGL LWTQSRLDNL ANGAPTTRAD NYEANVKYNL TPALGLGVAY 
TYTNAKANGE STHWNQVGVQ ADYALSKRTD VYAQAVYQRS SKNANASIYN GDLSTPFSTS 
INQTAATVGL RHRF