Gene BURPS1710b_1680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1680
Symbol
ID	3691521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	1799308
End bp	1800558
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	59%
IMG OID	637728136
Product	HK97 family phage portal protein
Protein accession	YP_333083
Protein GI	76809174
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.905165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCCATTT CGCTGACCGA CGGGAGCTTC TGGTCCGCGT GGGGCGGTAT GGGGTCATCG 
AGCGGAGAGA CGGTGACGGC CGATTCGGCA CTTCAGCTAT CTGCGGTGTG GTCGTGTGTC 
CGTCTGATCG CGGAAACAAT CGCGACTCTT CCGTTGAATC TCTATCAGAC CAAGCCAGAC 
GGAACGCGTG TTCTCGCGAA GCAACACCGG CTGTACACGG TCATCCATTC TCAGCCAAAC 
GCAGAGAACA CTGCGGCCGA GTTCTGGGAA GTGATCGTCG CGAGCATGCT GCTATGGGGG 
AATGGGTACG CGAGAAAGCT CCGGCCGGCG GGTGTGCTCA TCGGCCTTGA GCTGATGCTG 
CCACAGCGTA CGACTGTGAA GCGCCTCACA AGCGGAGCGT TGCAATACAC CTATCGCAAC 
GTCGATGGAA CTGTCAGCAC GCTGGCCGAG GACGATGTGT TTCACGTTCG AGGGTTCAGT 
CTCGATGGCT TGATGGGTCT TACGCCGATT CAATACGCAC GTGAGGTTCT TGGGAATTCG 
ACGGCCGCGA ATAAGACGAG CGCGAGCGTC TTTCGGAATG GGTTGCGACC ATCAGGTGTG 
CTCTCGACCG ACCAGATCCT CCAGAAAGAA AAGCGTGCGG AGATTCGAAC GGATCTAGCA 
GAGCAGTTTG GCGGCGCCAT GCAGGCCGGG AAAACGATGG TGCTGGAAGC CGGGATGAAG 
TACCAGGCCA TCACGATGAA TCCCGGTGAT GTCCAGTTGC TGGAGACGCG GGCATTCAAC 
ATCGAGGAAA TCTGCCGCTG GTATCGCGTT CCGCCGTTTA TGGTCGGCCA CAGCGAGAAA 
TCGACAAGCT GGGGAACTGG GATCGAACAA CAGACGCTCG GCTTTTTGAC ATTCACCCTG 
CGGCCTTGGT TGACGCGGAT TGAACAGGCA GCGCGACGGT CCCTGCTGAG GCCGGGAGAG 
CGCGATCAGT TTTATGCGGA GTTCTCCGTC GAAGGGCTGT TGCGAGCCGA TAGTGCAGGC 
CGAGCGGCGT TCTATTCAAC GATGACCCAA AACGGCCTGA TGACGCGTGA CGAATGTCGG 
GCGAAGGAAA ACCTGCCGCC GATGGGTGGC AATGCAGCGG TGTTGACGGT TCAGTCGGCA 
TTGCTCCCAA TCGACAAGCT CGGTGAGCAC ACGACGGCTA CGGCTGCGCA GGACGCCTTG 
AAAGCGTGGC TCTACCAGGA GGAAAAAACA CGTGCAACGC AAGAACGGTA A

Protein sequence

MPISLTDGSF WSAWGGMGSS SGETVTADSA LQLSAVWSCV RLIAETIATL PLNLYQTKPD 
GTRVLAKQHR LYTVIHSQPN AENTAAEFWE VIVASMLLWG NGYARKLRPA GVLIGLELML 
PQRTTVKRLT SGALQYTYRN VDGTVSTLAE DDVFHVRGFS LDGLMGLTPI QYAREVLGNS 
TAANKTSASV FRNGLRPSGV LSTDQILQKE KRAEIRTDLA EQFGGAMQAG KTMVLEAGMK 
YQAITMNPGD VQLLETRAFN IEEICRWYRV PPFMVGHSEK STSWGTGIEQ QTLGFLTFTL 
RPWLTRIEQA ARRSLLRPGE RDQFYAEFSV EGLLRADSAG RAAFYSTMTQ NGLMTRDECR 
AKENLPPMGG NAAVLTVQSA LLPIDKLGEH TTATAAQDAL KAWLYQEEKT RATQER