Gene BURPS668_1775 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1775
Symbol
ID	4884239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1751381
End bp	1753189
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	71%
IMG OID	640127703
Product	hypothetical protein
Protein accession	YP_001058814
Protein GI	126440828
COG category	[S] Function unknown
COG ID	[COG4655] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00194073
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGTTAG CCCGCCGCCG CGCCGAGCGC CGCCCGCCCG CCCGCGGGCG CGGGCCGATC 
GCGCGCGAGC GCGGCTCGTT CGCGCTCGTC GCGGCGATCT GGATGCTGGT CGCCATCGCC 
GCGCTCGGCG CGGTCGACAT CGGCAACGTG TTCTTCGTGC GGCGCGACTT GCAGCGGGTC 
GCCGACATGG CCGCGCTCGC CGGCGCGCAG AGAATGGACG ATCAGTGCGC GCAGCCGAAC 
GCGGCGGCCG CCGCGAACGC GCGCTCGAAC GGCTTCGATC CGGCGGCGGG CGGCAACACG 
CTCGCGCTCG CGTGCGGGCG CTGGGATACG CAAAGCAACG CGGGGCCGAG CTACTTCAAC 
GCGGCCGCGA CGCCGCTCAA CGCGGTGCAG GTGACGGCCA CGCAGAGCGT GCCGTATTTC 
TTCCTGGGCC CATCGCGCAC GGTGAGCGCG ACGTCGACCG CGAAGGCGAC CAACGTCGAC 
CAGTTCACGA TCGGCACGAC GCTCGCGAGC CTGCAGGGCG GCCTCGTGAA CAATGTGCTC 
AATGCGTTGC TCGGCACGAA CCTGGGTTTA AGCGCGCTGT CGTATCAGGC GCTCGCGTCG 
ACGCAGATCA AGATCGGCGA CCTGATGGCG GCCGCGAACG TGCTGACCGT CAACGAGCTG 
CTCGCGACGC AGGTGACGGC CGGACAGTAC GCGCAACTGA TGCTGACCGC GCTGTCGCGC 
ACGCAGGTCG TGAACGCGAA TCTGCAGGCG AGCGTCGCCG CGCTGCAGGC GATCGCCGGC 
GCGCATCTCG GCGGCGGGAC ATTCAGGCTC GGCGGCCAGC CGGGCGCGCC CGGCGTGTTC 
GCGCTCGGGC TGTCCGACAC GCAGGCGGCC GCCGACGCGA AGATCAACGT GTTCGACGCG 
CTGATGGTCG CGGCCGAAGT CGCGGCGGCG GGCAAGCCGG CCGTCGACGT CGCGACGGGG 
CTGCAGCTCG CGGGCCAGGG CGCGAGGCTG AAGCTGCAGG TCATCGAGCC GCCGACGATC 
GTGATCGGCG AGGCGGGCAC GGACCCGAAG ACGGGCGCGT GGCGCACGCA GGCGAACAAT 
GCGCAGATTC GGTTGTATGT GAGCGTCGAT CTCGGCACGA CGGGCTTGTC GCCCACCGGC 
GTGCTGCTGC CGATCGCGCC GCTCGTGAGC CTCGTGCAGA ACCTGATCCA GGTCGATCTG 
AGCCTGCCGC TCACGCTGCA GGTCGCGACG GGCTCCGCGT GGCTGCAGTC GACGAGCTGC 
GCGGCGAGCG CCGCCGCGAG CCGCGCGACG CTCGGCGTGC AGCCGGGTCT CGCGAACCTG 
TGCATCGGTG ACGTGCCGAC GGATCTCCCC GCGCAGCAGA CATTCGCCTG CAACGTGCCC 
GCGACGCTCG CGACGCTCGG CGTGCTGAGC GCGCCGCTGC TGCAGGTCAA GTCGGCCGTC 
GCGCTGCCGG CGGTCGTGCC GAAGGCGAGC GCGGCGACGC TCACGTTCAA CGGCGTGGCG 
GGCGACGCCG ACGACTATCA GACGACGAAT TCGAACGCGG TGGGCTCGGT GATCGCGAAC 
GCGCTGTCGG GCGCCGCGCA ATCGCTGACG GGATCGAACG GCCTTGCGCT CTATGTGCTC 
GGCGTGTCCG TGCCGGTCGG CACGATACTC AATCCGGTGG TCTCCGTGCT GCTGAACCTG 
CTCGGCCCCG TGTTGAGCTC GCTCGATCAG GTCGTCGTGC CGCTGTTGAA CCTGCTCGGC 
GTGCAGCTCG GCGCGGCGAC GGTTCACAAT CTGGCGCTGA CCTGCGGCAC CGCGCAAACG 
GTCTATTGA

Protein sequence

MPLARRRAER RPPARGRGPI ARERGSFALV AAIWMLVAIA ALGAVDIGNV FFVRRDLQRV 
ADMAALAGAQ RMDDQCAQPN AAAAANARSN GFDPAAGGNT LALACGRWDT QSNAGPSYFN 
AAATPLNAVQ VTATQSVPYF FLGPSRTVSA TSTAKATNVD QFTIGTTLAS LQGGLVNNVL 
NALLGTNLGL SALSYQALAS TQIKIGDLMA AANVLTVNEL LATQVTAGQY AQLMLTALSR 
TQVVNANLQA SVAALQAIAG AHLGGGTFRL GGQPGAPGVF ALGLSDTQAA ADAKINVFDA 
LMVAAEVAAA GKPAVDVATG LQLAGQGARL KLQVIEPPTI VIGEAGTDPK TGAWRTQANN 
AQIRLYVSVD LGTTGLSPTG VLLPIAPLVS LVQNLIQVDL SLPLTLQVAT GSAWLQSTSC 
AASAAASRAT LGVQPGLANL CIGDVPTDLP AQQTFACNVP ATLATLGVLS APLLQVKSAV 
ALPAVVPKAS AATLTFNGVA GDADDYQTTN SNAVGSVIAN ALSGAAQSLT GSNGLALYVL 
GVSVPVGTIL NPVVSVLLNL LGPVLSSLDQ VVVPLLNLLG VQLGAATVHN LALTCGTAQT 
VY