Gene BURPS668_0044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0044
Symbol
ID	4882911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	40428
End bp	41588
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	640125972
Product	putative porin
Protein accession	YP_001057099
Protein GI	126441436
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGTCA ACACGATATC GGAGGGGACG ATCTTGAAAC GACAATACCT GGCACTTTCC 
ATCGCGACGG CCGCCTGCGC GGCGCCGCAA GCGCACGCGC AGTCGAGCGT CCAGCTCTAC 
GGGCTCATCG ACCTGAGCAT TCCGACCTAT CGCTCGCACG CGAACGCGAA GGGCGATCAC 
GTGATCGGCA TGGGGCTCGG CGGCGAGCCG TGGTTCAGCG GCAGCCGCTG GGGGCTGAAG 
GGCGCGGAGG ACATCGGCGG CGGCACGAAG GTGATCTTCC GGCTCGAAAG CGAATACACG 
GTAGCCGACG GCAACATGGA GGACCCGGGC CAGATCTTCG ACCGCGATGC GTGGGTCGGC 
GTCGAAAACG ACACGTTCGG CAAGCTCACC GCGGGCTTCC AGAACACGAT CGCGCGCGAC 
GCGGCGGCGA TCTACGGCGA CCCTTACGGC TCGGCGAAGC TCACGACCGA GGAAGGCGGC 
TGGACGAACG CGAACAACTT CAAGCAGATG ATCTTCTACG CGGCCGGTGC GACGGGCACG 
CGCTACAACA ACGGCCTCGC GTGGAAGAAG CTGTTCGGCA ACGGCATCTT CGCGAGCGCG 
GGCTACGCGT TCAGCAATTC GACGAGCTTC GGGCAGAACT CGACCTATCA GGTCGCGCTC 
GGCTACAACG GCGGCCCGTT CAACGTGTCG GGCTTCTTCA GCCACGTGAA CCACGCGGGC 
TACGCGAACA AGTCGTTCTC GGTCGGCGGC AACTACACGT TCGACATCTT CCGCGTGAAC 
GCCGGCTACT TCCGCTACCT GGGCGATCAG GGCGCGCTCG GCCAGCGCCA GGACAACGCG 
TGGACGGTGT CGTTCAAGGT CGCGCCGAAG GGCGCGCTCG ACTACGAGCT CGGCTATCAG 
CAGATGCGCG TGCACAACGC CGCGTACAAC AGCGACGGCA ACGTGCCGAA CGCGAACATC 
GGCGACTTCA GCCTCACGTC GGGCGTCGGC AACGGCTTCA AGGAAACGCT GTACGGCTCG 
GTGTTCTACC ACCTGTCGAA GCGTACCGAG CTGTACCTCG CCGGCGACTA CATGCGCCTG 
CACGGCGGCT ATACGGTCGC GTCCACGCAC GGCGCGACCA ATCAGCTCGA GCTGACGACC 
GGCATCCGCA CGCGGTTCTG A

Protein sequence

MAVNTISEGT ILKRQYLALS IATAACAAPQ AHAQSSVQLY GLIDLSIPTY RSHANAKGDH 
VIGMGLGGEP WFSGSRWGLK GAEDIGGGTK VIFRLESEYT VADGNMEDPG QIFDRDAWVG 
VENDTFGKLT AGFQNTIARD AAAIYGDPYG SAKLTTEEGG WTNANNFKQM IFYAAGATGT 
RYNNGLAWKK LFGNGIFASA GYAFSNSTSF GQNSTYQVAL GYNGGPFNVS GFFSHVNHAG 
YANKSFSVGG NYTFDIFRVN AGYFRYLGDQ GALGQRQDNA WTVSFKVAPK GALDYELGYQ 
QMRVHNAAYN SDGNVPNANI GDFSLTSGVG NGFKETLYGS VFYHLSKRTE LYLAGDYMRL 
HGGYTVASTH GATNQLELTT GIRTRF