Gene Bcen_4401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcen_4401
Symbol
ID	4094714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia cenocepacia AU 1054
Kingdom	Bacteria
Replicon accession	NC_008061
Strand	-
Start bp	1632231
End bp	1633421
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	638017688
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_624256
Protein GI	107026745
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGACT CCCTCAACTT CGACACGCTT GCCGTGCGCG CGGGCACGCT GCGCAGCGAC 
TTCAACGAGC ATTCGGAAGC GCTGTTCCTC ACGTCGAGCT TCTGCTTCTC GAGCGCGGCC 
GACGCGGCCG AGCGCTTCGC GAATTCGGAA GACTATTTCA CCTATTCGCG CTTCACGAAT 
CCGACCGTCA CCATGTTCCA GGAGCGTCTC GCGGCGCTCG AGGGCGGCGA GGCGTGCATC 
GCGACGGCGT CGGGCATGGC CGCGATCATG TCGGTCGTGA TGTCCGCGCT GCAGGCAGGA 
GACCACCTCG TCAGCTCGCG CAGCCTGTTC GGCTCGACGC TCGGGATGTT CTCGCAGATC 
TTCAGCAAGT TCGGGATCAC GACGACCTTC GTCGACCCGA CCGACCTGAA CGCGTGGCAG 
GAAGCGGTGC GGCCGGAAAC GAAGATGTTC TTCCTCGAGA CGCCGTCGAA CCCGCTGACC 
GAGCTCGCCG ACATCGAGGC CATCGGCAAG ATCGCGAAGG CGGCGAACGC GCTGTTCGTC 
GTCGACAACT GTTTCTGCAG CCCGGTACTG CAGCAGCCAC TGAAGCTCGG CGCGGATGTC 
GTGATGCACT CCGCAACGAA ATTCCTCGAC GGGCAGGGCC GCGTGCTCGG CGGCGCACTG 
GTCGGCTCGA AGGAATTCAT CATGGGCAAG GTGTTCCCGT TCGTGCGCAG CGCGGGCCCG 
ACGCTGTCGG CGTTCAACGC GTGGGTGCTG CTGAAGGGGG TGGAGACGCT GTCGCTGCGC 
GTCGAGAAGC AGTCGGCGAA CGCGCTGGAG ATCGCGCGCT GGCTCGACTC GCATCCGGCG 
GTGGCGCGCG TGTTCTATCC GGGGCTCGAA TCGCATCCGC AGCATGAACT CGCGAAGCGT 
CAGCAGAAGG CGGGCGGTGC GATCGTGTCG TTCGAGCTGA AGGGCGACAC GCCCGAGCAG 
CAGCGCGCGA ACGCATGGCG CGTGATCGAC GGCACGAAGC TGGTGTCGAT CACCGGCAAC 
CTCGGCGACA CGCGTACGAC GATCACGCAT CCGGCCACCA CGACGCACGG CCGGATTACG 
CCGGAAGCGC GTGCGGCGGC GGGGATCACC GAAGGGTTGA TCCGCCTCGC GGTCGGCCTG 
GAGCATGCGG GCGACATTCG CAACGATCTG GCGCGTGGTC TGGACGGCTG A

Protein sequence

MDDSLNFDTL AVRAGTLRSD FNEHSEALFL TSSFCFSSAA DAAERFANSE DYFTYSRFTN 
PTVTMFQERL AALEGGEACI ATASGMAAIM SVVMSALQAG DHLVSSRSLF GSTLGMFSQI 
FSKFGITTTF VDPTDLNAWQ EAVRPETKMF FLETPSNPLT ELADIEAIGK IAKAANALFV 
VDNCFCSPVL QQPLKLGADV VMHSATKFLD GQGRVLGGAL VGSKEFIMGK VFPFVRSAGP 
TLSAFNAWVL LKGVETLSLR VEKQSANALE IARWLDSHPA VARVFYPGLE SHPQHELAKR 
QQKAGGAIVS FELKGDTPEQ QRANAWRVID GTKLVSITGN LGDTRTTITH PATTTHGRIT 
PEARAAAGIT EGLIRLAVGL EHAGDIRNDL ARGLDG