Gene BURPS1106A_3086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3086
Symbol
ID	4899719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3010852
End bp	3012072
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	67%
IMG OID	640136312
Product	putative lipoprotein
Protein accession	YP_001067325
Protein GI	126453435
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAACA ACTCCTCGCT GTCCATCCTG ATAGCGGCCG CCTGCATTCA GGCATTCGCG 
GCGACGGCCT CGCTCGCGCA GGGCCCCGCG CATCCGCCGT CGTACGTCGA AGGCACCCGC 
GTGCCGAAAG GCTTCGCGCG CCCGCCGTTC CACACGAATC CCGCACGCTT CTCGGCCACC 
ACCGTCTCGG GCCTCGCGCC CGCCACCGTG CGGCACGCGT ACGGCTTCGA CTCGATCGCG 
AACCAGGGCG ACGGCATGGT CGTCGCGATC GTCGACGCAT ACGACGACCC GAAGATCGAA 
TCCGATCTCG GCGTGTTCAG CAAGAATTTC TCGCTGCCGC CCTGCACGAC GTCGAACGGC 
TGCTTCAAGA AGCTCTACGC GAGCGGCAGC AAGCCGAGCC CCAACGCCGG CTGGGCGCTC 
GAGATGTCGC TCGATGTCGA ATGGGTGCAT GCGATCGCGC CAAAGGCGAA GATCGTGCTC 
GTCGAGGCGG CGTCGAACAG CTTCAACGAT CTGATGACCG CGGTCGATGT CGCCGTCGGG 
GCCGGCGCGT CGGTCGTGTC GATGAGCTTC GGCGGCAGCG AATTCAGTTC CGAGACGAGT 
TTCGACAGCC ACTTCGGCGC ACCGTCGAAC GTCACGTTCG TCGCATCGTC CGGCGACAGC 
GGCAACGGCA CCGAGTATCC GGCGGCGTCG CCGTACGTCG TCGCCGTCGG CGGCACGACG 
CTGTCGGCCG ACGCGTCCGG CAACTACGTC GGCGAAACCG CATGGAGCGG CAGCGGCGGC 
GGCGTCAGCG CGTACGAACT GGAGCCGGTG GGCCAGACGC TCTGGCCGAT TCCGTACGCC 
GGCCAACGCG GCGTGCCCGA CGTCGCGTAC GACGCGAATC CGAATTCCGG CTTCGCGGTG 
TACGATTCCG TCACCTATCA GGGGCAATCG GGATGGTTCG TCGTCGGCGG CACGAGCGCC 
GGCGCGCCGC AATGGGCGGC GCTCTTCGCG ATCGCGAACT CGATGCGCAC CGCAGCCGGC 
AAGGCGAAGC TCGCCGGCGC GTACAACCAG CTCTATACGG TCGGCAAGAC CGCGTACGGC 
AGCGACTATC ACGACGTCAC GTCGGGCACC AACGGCAGTT GCGGGATGAT TTGCACCGCG 
AGCGGCGGCT ACGATTACGT GACGGGCCTG GGCTCGCCGC AGGCGCTCAA CCTGGTTCAG 
GCGCTCGTCG CGCAACCCTG A

Protein sequence

MKNNSSLSIL IAAACIQAFA ATASLAQGPA HPPSYVEGTR VPKGFARPPF HTNPARFSAT 
TVSGLAPATV RHAYGFDSIA NQGDGMVVAI VDAYDDPKIE SDLGVFSKNF SLPPCTTSNG 
CFKKLYASGS KPSPNAGWAL EMSLDVEWVH AIAPKAKIVL VEAASNSFND LMTAVDVAVG 
AGASVVSMSF GGSEFSSETS FDSHFGAPSN VTFVASSGDS GNGTEYPAAS PYVVAVGGTT 
LSADASGNYV GETAWSGSGG GVSAYELEPV GQTLWPIPYA GQRGVPDVAY DANPNSGFAV 
YDSVTYQGQS GWFVVGGTSA GAPQWAALFA IANSMRTAAG KAKLAGAYNQ LYTVGKTAYG 
SDYHDVTSGT NGSCGMICTA SGGYDYVTGL GSPQALNLVQ ALVAQP