Gene BURPS1106A_A1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1072
Symbol
ID	4904137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1029673
End bp	1030812
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	71%
IMG OID	640144178
Product	outer membrane porin
Protein accession	YP_001075107
Protein GI	126457262
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID	[TIGR03304] outer membrane insertion C-terminal signal

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.645195
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACATT CGGCCCGCCT GCTGGCCTGC GGCGCGCTCT GCGTCACCGC CGCGCATGCG 
CACGCGCAAT CGAGCGTCAC GCTATACGGC ATCGTCGACA CCGGCATCGA ATTCGTTTCG 
CACGCGAGCG CGAAGGGCGG TTCCGCGTGG CGCATGCCGG CCGTCACGGG CGAGCTGCCG 
TCGCGCTGGG GCTTGCGCGG CGTCGAGGAT CTCGGCGGCG GCTATCGCGC GCTCTTCGCG 
CTCGAAAGCG GCTTCAACCT GCGCGGCGGC GAGCTCGGCC AGGGCGGGCG ACTGTTCGGG 
CGTCAGGCAT ACGTGGGCCT GCGCGCGCCG TTCGGCACGC TCGCGTTCGG CCGGCAATAC 
ATGATGACTT ATGTCGCGCT GCAGGGCGCG GACATCATCG GCCCCGACAT CTATGGGCTC 
GGCTCGCTCG ACGCTTACAT CCCGAACGGC CGCGCGGACA ACGCGGTGAC CTATGTCGGC 
AGCTATCGCG GCGTGACGCT CGGCGCCGGC TATTCGTTCG GCCGCGACTC GGCAGGCACC 
GGCAATTCGC CGGGGCAGGG CACGTGCGTC GGCTCGGTGC CGGGGCGCGC GGTCGAATGC 
CGGAGCGGGT CGGCGATGCT GAAGTACGAC GCCGAGCGCT TCGGCGTGGC TGCGTCGTAC 
GAAGAGCAGC GCGGCGGCGC GAACGCGGCG GCGAACTTCT TCGACGGTGC CGCGCCGATG 
CCGATCGCAA GCAGTGCGGA CAAGGACACG CGCGCGCACG TGAGCGCGTA CGCGAACGCG 
GGGCCGGTCA AGCTCGGCGC GGGCTGGATC GGCCGGCGCG TGTCGACCGA CGCGCCCGCC 
GCGCCCGACG TGCGCACCGA TCTGTTCTTC GTCGGCGCCG CCTATCGCGC GACGCCGTTC 
GTGACGATCG ACGGCGAAGC CTACCGGATC GTCGATGCGC GGCACGACGC GCGCGCGACG 
ATGGCGACGC TGCGCGCGAG CTTCTCGCTG TCGAAGCGCA CCGCCGTCTA TGCGCAGACC 
GCGTACCTAT GGAACAGCGC GCACGCGCGC TATTCGGTGA GCGGCGGCGG AGGCGGCACG 
ATGCCCGCGG CCGGCGTCGG CCAGCTCGGC GCGATGGTCG GCGTTCGGCA CATGTTCTGA

Protein sequence

MRHSARLLAC GALCVTAAHA HAQSSVTLYG IVDTGIEFVS HASAKGGSAW RMPAVTGELP 
SRWGLRGVED LGGGYRALFA LESGFNLRGG ELGQGGRLFG RQAYVGLRAP FGTLAFGRQY 
MMTYVALQGA DIIGPDIYGL GSLDAYIPNG RADNAVTYVG SYRGVTLGAG YSFGRDSAGT 
GNSPGQGTCV GSVPGRAVEC RSGSAMLKYD AERFGVAASY EEQRGGANAA ANFFDGAAPM 
PIASSADKDT RAHVSAYANA GPVKLGAGWI GRRVSTDAPA APDVRTDLFF VGAAYRATPF 
VTIDGEAYRI VDARHDARAT MATLRASFSL SKRTAVYAQT AYLWNSAHAR YSVSGGGGGT 
MPAAGVGQLG AMVGVRHMF