Gene BURPS668_A1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1043
Symbol	opcP
ID	4888968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1008346
End bp	1009548
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	67%
IMG OID	640130983
Product	porin
Protein accession	YP_001062042
Protein GI	126444745
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC GCACTGCGGT CGCGATGACG GCCGCCGGAC TGGCGGCTGT CGCCACCGCG 
CACGCTCAGA GCAGCGTGAC GCTTTACGGC ATCGCCGATA ACGGCATCGC GTATCAAAGC 
AGCAGCACGT CGCTCGGCTC GACGACGGGC GGCCGCTCGG CGGTGAAGAT GTCGACGGGC 
GTGTGGGCGG GCAGCCGCTT CGGCCTGAAG GGCAGCGAGG ATCTCGGTGA CGGCTCGAAG 
GCGATCTTCC AGCTCGAATC GGGCTTCAGC ACGGCCAACG GCACGTCGCA GTTCGCGGGC 
GGCATCTTCA CGCGCCAGGC GTGGGTCGGC CTGACCAACC CGACGTACGG CACGCTGACG 
GCGGGCCGCC AGTACACCGC GTACTACACG CTGCTGTCGC CGTATAGCCC GACGACCTGG 
CTCACCGGCT ATTTCGGCGC GCATCCGGGT GACATCGATT CGCTCGATAC CAGCTACCGC 
ACGAACAATT CGCTCGTCTA CCTGTCGCCG AAGTTCTACG GCTTCACGTT CGGCGGCTCG 
TATGCGTTCG GCGGACAGCC GGGCAGCGTG AACGCCGGCT CCACGTGGAG CGCGGGCATC 
CAGTACATGA ACGGTCCGCT CGGCATCGCG GCGGCGTTCC AGCGCGTGAA CAACTCGACG 
TCGGGCGGCG GCGACTGGGG CGCGAATTCG ACGACGTCGA ACGGCGGCGC GCAGACGGCC 
GTGTCGGCGA TCAACAACGG CTACAAGACC GCGCAGGCGC AGCAGCGCGT CGCGGTGACG 
GCCGGCTATC AGTTCTCGTC CGCATGGGAC ATCTCGGTGT CGTACTCGAA CGTGCAGTAC 
ATCCCGGGCG TGAACTCGGC GTTCCGCAAC ACGGCGATCT TCAACACGGC GGGTGCGGTG 
CTGCACTTCA AGCCGTCGGC TCAGTGGGAC TTCGCGGGCG GCTACGCGTA CACGCGCGCG 
ACCCAGTCGA ACGGCATCAC GAGCGCCGCG CAGTACCATC AGTTCACGCT GTCGCAGTAC 
TACAGCCTGT CGAAGCGCAC GGGCCTGTAC GCGGTTGAAG CGTATCAGCG CGCGAACGGC 
AAGACGCTCG CGGGCGGCAA GATCATCGAC GCGACCGCGT CGATCGGCGA CGGCTTCAAC 
ACGTCGCCAT CGTCGTCGCG CAGCCAGGTA GGCGTCGGCG TCGGCCTGAT CCACCGTTTC 
TGA

Protein sequence

MKKRTAVAMT AAGLAAVATA HAQSSVTLYG IADNGIAYQS SSTSLGSTTG GRSAVKMSTG 
VWAGSRFGLK GSEDLGDGSK AIFQLESGFS TANGTSQFAG GIFTRQAWVG LTNPTYGTLT 
AGRQYTAYYT LLSPYSPTTW LTGYFGAHPG DIDSLDTSYR TNNSLVYLSP KFYGFTFGGS 
YAFGGQPGSV NAGSTWSAGI QYMNGPLGIA AAFQRVNNST SGGGDWGANS TTSNGGAQTA 
VSAINNGYKT AQAQQRVAVT AGYQFSSAWD ISVSYSNVQY IPGVNSAFRN TAIFNTAGAV 
LHFKPSAQWD FAGGYAYTRA TQSNGITSAA QYHQFTLSQY YSLSKRTGLY AVEAYQRANG 
KTLAGGKIID ATASIGDGFN TSPSSSRSQV GVGVGLIHRF