Gene Bphyt_3608 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphyt_3608
Symbol
ID	6284163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phytofirmans PsJN
Kingdom	Bacteria
Replicon accession	NC_010681
Strand	-
Start bp	4050358
End bp	4051353
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	60%
IMG OID	642623188
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001897222
Protein GI	187925580
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0264425
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0000000362399
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTGGATCA AACGTAGCGA CAGAATTCTA CTCAGCGGCG ACGACATTGC GCGCAGCGAA 
ATCACGCCGC AACATGTTTT TCAGAACCGG CGGCGCGTGT TGCAGGCGGC CGGCGCGGCG 
GCGCTCGGCA GTCTGATCGG GGTGAATGGC GAGGCGCTGG CGGCTTACAC GTCGCCGGAT 
CCGAAGGCGC AGAAGCTGGC GGCGAAGACC AACGCCAAGT TCGTCGCGCT CGACAAAATC 
ACGCCTTACA AGGACATCAC CACGTACAAC AACTTCTACG AGTTCGGCAC CGACAAAGCC 
GATCCCGCGC ATAACGCCGG GACGCTGCGG CCGCATCCGT GGAAGGTGAG CGTCGAGGGT 
GAGATCAAGA ATCCCAAGGT CTACGATATC GACGAATTGC TCAAGCTCGC GCCGCTCGAA 
GAGCGCGTGT ACAGAATGCG CTGCGTCGAA GGCTGGTCGA TGGTGATTCC GTGGATCGGC 
GTGCCGCTCG CGGAATTGAT CAAGCGCGTG CAACCGACGG GCAACGCAAA GTACGTACAG 
TTCATCACGC TGGCCGATCC GTCGCAAATG CCCGGACTGT CGACGCCCGT ACTCGATTGG 
CCATACTCCG AAGGGCTGCG CATGGACGAA GCGATGAATC CGCTGACGTT GCTGACGATG 
GGCCTCTACG GCCAGGTGTT GCCTAATCAG AACGGCGCGC CGGTGCGCGT CGTGGTGCCG 
TGGAAATACG GCTTCAAGAG CGCGAAGTCG CTGGTGAAGA TCCGCTTCCT CGACAAGCAG 
CCGCCGACCA GTTGGAATAC GTATGCATCG AACGAATACG GGTTTTACTC GAACGTGAAT 
CCGAACGTCG ATCATCCGCG CTGGAGTCAG GCGACGGAGC GTCGCATCGG CGAAGATGGT 
TTCTTCACGC CCAAGCGCAA GACGTTGATG TTCAACGGCT ACGGCGAACA GGTCGCATCG 
CTCTATCAGG GCATGGACCT GAAGAAGAAT TTCTGA

Protein sequence

MWIKRSDRIL LSGDDIARSE ITPQHVFQNR RRVLQAAGAA ALGSLIGVNG EALAAYTSPD 
PKAQKLAAKT NAKFVALDKI TPYKDITTYN NFYEFGTDKA DPAHNAGTLR PHPWKVSVEG 
EIKNPKVYDI DELLKLAPLE ERVYRMRCVE GWSMVIPWIG VPLAELIKRV QPTGNAKYVQ 
FITLADPSQM PGLSTPVLDW PYSEGLRMDE AMNPLTLLTM GLYGQVLPNQ NGAPVRVVVP 
WKYGFKSAKS LVKIRFLDKQ PPTSWNTYAS NEYGFYSNVN PNVDHPRWSQ ATERRIGEDG 
FFTPKRKTLM FNGYGEQVAS LYQGMDLKKN F