Gene BURPS668_3711 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3711
Symbol
ID	4881776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3633716
End bp	3634711
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	640129639
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001060715
Protein GI	126440984
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGATCA AGAAAACGCT GCGCGCGGCG CTTGCCGGCG ACGACATCCC GCGCAGCGAA 
ATCACGCCGC GAGCGGTGTT CGAGCATCGC CGCCGCATCC TGCAGGCGGC GGGCGCCGCC 
GCGGCGGGCG GACTCGTCGG CGCGCACGGG CTCGCGCTCG CCGCGTACGC ATCGCCGGAT 
GCGACGGCGC GCAAGCTTGC GGCGCCGGCC AATCCGAAGT TCGTCGTCCC GGAGAAGGTG 
ACGTCGTTCA AGGACATCAC GACCTATAAC AACTTCTACG AATTCGGCAC CGACAAGAGC 
GATCCCGCGC GCCGTGCCGG CACGCTGCGG CCGCATCCGT GGCGCGTGTC GGTCGAAGGA 
GAAGTCAGGA ACCCGAAGGT GTACGACATC GACGCGCTGC TGAAGCTCGC GCCGCTCGAG 
GAGCGCGTGT ACCGGCTGCG CTGCGTCGAA GGCTGGTCGA TGGTGATTCC GTGGATCGGC 
TTTCCGCTGG CGGAGCTCAT CAAGCGCGTC GAGCCGACCG CCAACGCGAA GTACGTGCAG 
TTCGTCACGC TCGCGGACCC GTCGCAGATG CCGGGGCTGT CCGCGCCGAT CCTCGACTGG 
CCGTATTCGG AAGGCCTGCG GATGGACGAG GCGATGAATC CGCTGACGCT GCTCACGATA 
GGCGTCTACG GGCAGGTGCT GCCCAATCAG AACGGCGCGC CCGTGCGGGT GATCGTGCCG 
TGGAAGTACG GCTTCAAGAG CGCGAAATCG ATCGTGAAGA TCCGCTTCGT CGACCGGCAG 
CCGCCGACGA GCTGGAACAC GTATGCGCCG AACGAATACG GCTTCTATTC GAACGTCAAC 
CCGAACGTCG ACCATCCGCG CTGGAGCCAG GCGACCGAGC GGCGCATCGG CGAGGACGGC 
TTCTTCACGC CGAAGCGCAA GACGCTGATG TTCAACGGCT ATGGCGATTG GGTCGCGTCG 
ATGTATCGCG GGATGGATCT GAAGAAATAC TTCTGA

Protein sequence

MLIKKTLRAA LAGDDIPRSE ITPRAVFEHR RRILQAAGAA AAGGLVGAHG LALAAYASPD 
ATARKLAAPA NPKFVVPEKV TSFKDITTYN NFYEFGTDKS DPARRAGTLR PHPWRVSVEG 
EVRNPKVYDI DALLKLAPLE ERVYRLRCVE GWSMVIPWIG FPLAELIKRV EPTANAKYVQ 
FVTLADPSQM PGLSAPILDW PYSEGLRMDE AMNPLTLLTI GVYGQVLPNQ NGAPVRVIVP 
WKYGFKSAKS IVKIRFVDRQ PPTSWNTYAP NEYGFYSNVN PNVDHPRWSQ ATERRIGEDG 
FFTPKRKTLM FNGYGDWVAS MYRGMDLKKY F