Gene BURPS1106A_0145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0145
Symbol
ID	4902568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	139035
End bp	140048
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	65%
IMG OID	640133375
Product	PBSX family phage portal protein
Protein accession	YP_001064430
Protein GI	126451629
COG category	[R] General function prediction only
COG ID	[COG5518] Bacteriophage capsid portal protein
TIGRFAM ID	[TIGR01540] phage portal protein, PBSX family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGGAACA GGCCGCGCCA AATCCGAGCG CCGGCGCGCG CCGAGGTCTT CACGTTCGAC 
GATCCGACGC CCGTCATGAA CCGGGCCGAG ATTCTCGATT ACGTCGAGTG CTGGTCGAAC 
GGCGAATGGT TCGAGCCGCC GGTCAGCTTC GCCGGCCTGG CGAAATCGTT TCGCGCGAGC 
ACGCACCATA GCTCGGCGCT GTTCTTCAAG GCGAACGTGC TGGCGTCGAC ATTCCGCCCG 
CACCGCTGGC TGTCGCGGCA CGCGTTCGAG CGGTGGGCGC TCGATTTCCT GACGTTCGGC 
AACGGCTATC TGGAACGCCG CCGCAACATG GTCGGCGGCA CGCTGCGGCT CGAGCCCGCG 
CTCGCGAAGT ACGTCCGGCG CAAGGCCGAT TTCAACGGCT TCGTGTACGT GAACGGCTGG 
CAGGAGCGGC ACGAGTTCGA GCCCGACAGC GTGTTCCAGC TCGTGCGGCC GGACATCAAT 
CAGGAGGTCT ACGGCCTGCC CGAGTATCTG AGCTCGCTGC ACTCGGCCTG GCTGAACGAA 
TCGTCGACGC TGTTCCGGCG CAAGTATTAC GAGAACGGCA GCCACGCCGG CTTCATCCTG 
TACATGACCG ACGCCGCGCA GAAACAGGAC GACGTGGACA ACATGCGCGA CGCGCTGAAG 
AACGCGAAGG GGCCGGGCAA CTTCCGCAAC GTGTTCATGT ACGCGCCGGG CGGGAAGAAG 
GACGGCATCC AGCTCATTCC CGTGTCCGAG GTCGCCGCGA AGGACGAGTT CTTCAACATC 
AAGAACGTGA CGCGCGATGA CCTGCTCGCC GCGCACCGCG TGCCGCCGCA GTTGCTTGGC 
ATCGTGCCGA GCAATTCGGG CGGGTTCGGC ACGCCGGATA CCGCTGCACG CGTGTTCGGG 
CGCAACGAAA TCAGGCCGCT ACAGGCGCGG TTCGCCGAGC TGAACGACTG GCTCGGCGAC 
GAGGTCGTGA CGTTCGACGA TTACGAGATT CCGCCGGTGC CGGTCGCGGC GTAG

Protein sequence

MRNRPRQIRA PARAEVFTFD DPTPVMNRAE ILDYVECWSN GEWFEPPVSF AGLAKSFRAS 
THHSSALFFK ANVLASTFRP HRWLSRHAFE RWALDFLTFG NGYLERRRNM VGGTLRLEPA 
LAKYVRRKAD FNGFVYVNGW QERHEFEPDS VFQLVRPDIN QEVYGLPEYL SSLHSAWLNE 
SSTLFRRKYY ENGSHAGFIL YMTDAAQKQD DVDNMRDALK NAKGPGNFRN VFMYAPGGKK 
DGIQLIPVSE VAAKDEFFNI KNVTRDDLLA AHRVPPQLLG IVPSNSGGFG TPDTAARVFG 
RNEIRPLQAR FAELNDWLGD EVVTFDDYEI PPVPVAA