Gene BURPS1710b_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_3043
Symbol	opcP1
ID	3690261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	3356318
End bp	3357457
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	63%
IMG OID	637729498
Product	outer membrane protein
Protein accession	YP_334420
Protein GI	76809014
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000337977
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA CCCTCATCGT TGCCGCTCTT TCCGGCGTTT TCGCAACGGC CGCTCACGCG 
CAAAGCAGCG TGACGCTGTA CGGCCTGATC GACGCCGGCA TCACCTACAC GAACAACCAA 
GGCGGCCACA GCGCATGGTC GCAATCCACC GGCTCGGTCA ACGGCAGCCG CTGGGGCCTG 
CGCGGCGCCG AGGATCTCGG CGGCGGCCTG AAGGCGATTT TCGTGTTGGA AAACGGCTTC 
GGCATCAATA ACGGCACGCT GAAGCAGAAC GGCCGCGAGT TCGGCCGTCA GGCGTTCGTC 
GGCCTGTCGC ACGAGCAATA CGGCGCGCTG ACGCTCGGCC GTCAATACGA CAGCGTCGTC 
GACTACCTCG GGCCGCTGTC GCTGACGGGC ACGCAATTCG GCGGCACGCA GTTCGCCCAC 
CCGTTCGACA ACGACAACCT GAACAATTCG TTCCGGATCA ACAACGCGGT CAAGTACACG 
AGCGTGAACT GGGCGGGCCT GAAATTCGGC GCGTTGTACG GCTTCTCGAA CAACAATCAG 
TTCGCGAACA ACCGCGCCTA TAGCGCGGGC GTATCGTACA GCTACGCCGG CTTCAACATC 
GGCGCCGGCT ACCTGCAGTT GAACAACAAC TTCGGCCCGA CGGTCTCCAA CGCATCCGGC 
GCGGTCGCGC TCGACAACAC GTTCGTCGGC AAGCGCCAGC GCGTGTTCGG CGGCGGCCTG 
AACTACACGT TCGGCCCGGC AACGGCCGGC TTCGTGTTCA CGCAATCGCG CGTCAACCGC 
GCGACGGCAA TCGGCGCGGG CGCATCGGGC GTGTCGAGCG GCATTGCGCT CGACGGCACG 
TTCATGCGCT TCAACAACTA CGAAGTGAAC GCGCGCTACG CGATCACGCC GGCATGGACG 
GTGGCCGGTT CGTACACGTA CACCGCCGGC TTCATCGAGA ACCACCACCC GGGCTGGAAC 
CAATTCAACC TGCAAACGGC CTACGCGCTG TCCAAGCGCA CGGACATGTA CCTGCAAGGC 
GTGTATCAGA AGGTCAACAA CGACGGCACG GGCCTCGGCG CGTACATCAA CGGTATCGGC 
GGCATGTCGT CGACGGAAAA ACAGATCGCC GTCACGGCCG GCCTGCGTCA CCGCTTCTAA

Protein sequence

MKKTLIVAAL SGVFATAAHA QSSVTLYGLI DAGITYTNNQ GGHSAWSQST GSVNGSRWGL 
RGAEDLGGGL KAIFVLENGF GINNGTLKQN GREFGRQAFV GLSHEQYGAL TLGRQYDSVV 
DYLGPLSLTG TQFGGTQFAH PFDNDNLNNS FRINNAVKYT SVNWAGLKFG ALYGFSNNNQ 
FANNRAYSAG VSYSYAGFNI GAGYLQLNNN FGPTVSNASG AVALDNTFVG KRQRVFGGGL 
NYTFGPATAG FVFTQSRVNR ATAIGAGASG VSSGIALDGT FMRFNNYEVN ARYAITPAWT 
VAGSYTYTAG FIENHHPGWN QFNLQTAYAL SKRTDMYLQG VYQKVNNDGT GLGAYINGIG 
GMSSTEKQIA VTAGLRHRF