Gene BURPS668_A1215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1215
Symbol
ID	4887950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1155898
End bp	1157055
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	67%
IMG OID	640131154
Product	selenocysteine lyase
Protein accession	YP_001062212
Protein GI	126443750
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00299865
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCCC CACTGAAATC GTTGTTTCTT CTCGACCCGA GCGTGACCTA TCTGAACCAC 
GGCGCGTACG GCGCGACGCC GCGCCCGGTG TTCGAGCGCC ACGTGCAGTG GCAGTACGAG 
CTCGAACGCG AGCCGGTCGA TTTCCTGTCG CGCCGCTTCG CCGAACGCAT GGCGCAGGCG 
AGGGCGATAC TGGCCGAATA CGTGGATACC GAACGCGACA ATCTAGTATA TGTGAGCAAC 
GGCACCACGG GCGTGAACAT CGTCGCGCGC AGCCTCCCGC TCGGCCCGGG CGACGAACTG 
CTCACCACCG ATCACGAGCA CGGCGGCATC GAGCGGCTGT GGCGCTTCAC CGCGCAAAAG 
CGCGGGTTCG AGATCGTCCG GCACAAGGTG CCGCTGCCGG TGACGACGCA TGCCCGGTTC 
ATCGAGGATT TCTGGCGCGA CGTGACGCCG CGCACGCGCG CGATCCTGAT CAGCCAGCTG 
ACGTCGCCCA CCGCGCTCGT GTTTCCGGTT GCGGCGATCT GCGCGCGCGC GCGGGCGCGC 
GGCATCCTGA CGATCGTCGA CGGCTCGCAC GTGCCCGGGC AACTGCCGCT GTCGCTGCGC 
GAGATGGATC CGGATTTTTA TGTCGGCATC CTGCATAAAT GGGTGTGCGC GCCGAAGGGC 
AGCGCGTTCC TGTATGCGAG GCCGGACGTG CAGCCGCTTG TCGAGCCGCT CGTCGTCAGT 
TGGGGCTGGG AGCCGAAGAA CCCGGGGCCG TCAAAGTTCG TCGAGTATCA CGAGTGGCAG 
GGCAGCCGCG ACATCTCCGC GTTCCTGAGC GTGCCGAGCG CGATCGCGTT TCAGCGCGAG 
CACGACTGGG ACGGCGTGCG CAAGCGCTGC ATCGCGCTCG CGAGCGACGC GCAGCGCGAA 
GTGGCCGCGT TGACGCGCGA GCCGCTCTAC CATCCGCCGG GCGCACACGA GTGGCACGGC 
CAGATGGTCT GCGCGCAACT GCCGCCGCAG ACGGACGACA TCGCGCTGCT TGCCCGCTTG 
CGCAACGAAT GCGGGATCGA CGTCTCGGTC GACCGTTTCG GCGGCCGGCC TCGCATCCGA 
GTGTCGATTC AGGGCTATAA CGGCCCGGAC GACGTCGATC GATTGCTCGG CAGTCTGAAG 
CAACTGCTGC GGCTTTGA

Protein sequence

MTAPLKSLFL LDPSVTYLNH GAYGATPRPV FERHVQWQYE LEREPVDFLS RRFAERMAQA 
RAILAEYVDT ERDNLVYVSN GTTGVNIVAR SLPLGPGDEL LTTDHEHGGI ERLWRFTAQK 
RGFEIVRHKV PLPVTTHARF IEDFWRDVTP RTRAILISQL TSPTALVFPV AAICARARAR 
GILTIVDGSH VPGQLPLSLR EMDPDFYVGI LHKWVCAPKG SAFLYARPDV QPLVEPLVVS 
WGWEPKNPGP SKFVEYHEWQ GSRDISAFLS VPSAIAFQRE HDWDGVRKRC IALASDAQRE 
VAALTREPLY HPPGAHEWHG QMVCAQLPPQ TDDIALLARL RNECGIDVSV DRFGGRPRIR 
VSIQGYNGPD DVDRLLGSLK QLLRL