Gene BURPS668_A3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3041
Symbol
ID	4888370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2890280
End bp	2891359
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	70%
IMG OID	640132977
Product	outer membrane porin
Protein accession	YP_001064032
Protein GI	126443633
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAAAC GACTGTCCGC GCTTTGCGGA CTGGGCCTCG CCTCGGCCGG CGCATGCGCG 
CAAACGAGCG TGACGCTTTA CGGCGTCGCG GACGCGTACG TCGAGTACGC GACGAACCAG 
GCGGACGCGA AAGGCAAGCC CGCCGCGCTC GCGCGAATGG GCTCGGGCGG CAAGAGCGGC 
TCGCGCTGGG GAATCAAGGG CACCGAAGTG CTCGGCGGCG GCTGGCGCGC CGCGTTCCGG 
CTCGAGAGCG GCGTCAACCT GAACAACGGC GCCGGCACGG GCGCGGGCGG CTTCGACCGC 
TCCGCGTGGG TCGGGCTCGA GCATCCGCGC TGGGGCGCGC TGCGCTTCGG TCGCCAATAC 
ACGACGATGT TCGACATCAT GGAGCACTAC TCGCCGACGG GCGCGTATTC GACGCTGTAC 
GAACCGGACG GCGCGATCGT CGGCATCAGC TTTCGCGAGA ACAACGTCGT CAAATATCTG 
GCGACGGCCG GCCCGCTCAC GTTCGAAGCG CACTACGCGT TCAGCAACGA ACCGGGCGCG 
TTCCAGGCGA GCGCCGCGCA CGGCGCGGGC TTCGAGTACA CGGGCGGCGC GCTGTCGTTC 
GCGTTCGCAT ACGACGACGT GCACACGCCG CAAGCCGGCG GCTTCGCGCA CTTGCGCCGC 
TACGCGGCCG CCGCGATGCT GACCGTCGAG GCGACGCAAC TGATCGCGGG CGCCGCGCAC 
GGGCAAGGCA ACGTCGCGAC GCCATCGGTC GTCACGCGCT ACACGTTCTG GTGGATCGGC 
GTGCGTCAGG CGATCACGCC CGTCGTTCAA CTGATCGGCG CGCTGTATGC GGAGCGCGTG 
CGCGCGCAAA ACCCGGCGAG CCCGCCCGCC GCGCGACATG CGTCGGGCAC GCCGCAGCAG 
GCGACGCTGC AGTTGAACTA CTTCGTCTCG AAAACCACGA CGCTGTACGC GGCAACCGGT 
TACGCGCGCC ACGCGGCGCT CGATTTCGAC AACTATAACT ACGGCTTCCT CCACTACTCG 
CTCGCCGGCG CGCGCGCCGG CAGCGCGGGC GCCGCCGTCG GCGTGCGCAA GTTGTTCTGA

Protein sequence

MDKRLSALCG LGLASAGACA QTSVTLYGVA DAYVEYATNQ ADAKGKPAAL ARMGSGGKSG 
SRWGIKGTEV LGGGWRAAFR LESGVNLNNG AGTGAGGFDR SAWVGLEHPR WGALRFGRQY 
TTMFDIMEHY SPTGAYSTLY EPDGAIVGIS FRENNVVKYL ATAGPLTFEA HYAFSNEPGA 
FQASAAHGAG FEYTGGALSF AFAYDDVHTP QAGGFAHLRR YAAAAMLTVE ATQLIAGAAH 
GQGNVATPSV VTRYTFWWIG VRQAITPVVQ LIGALYAERV RAQNPASPPA ARHASGTPQQ 
ATLQLNYFVS KTTTLYAATG YARHAALDFD NYNYGFLHYS LAGARAGSAG AAVGVRKLF