Gene Bcep18194_B2117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B2117
Symbol
ID	3753882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	-
Start bp	2427931
End bp	2429121
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	637766963
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_372872
Protein GI	78062964
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.175356
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACT CCCTCAACTT CGACACGCTT GCCGTGCGCG CGGGCACGCT GCGCAGCGAC 
TTCAACGAGC ACTCGGAAGC GCTGTTCCTC ACGTCGAGCT TCTGCTTCCA GAGCGCGGCC 
GACGCGGCCG AGCGCTTCGC GAATTCGGAA GACTACTTCA CCTATTCGCG CTTCACGAAC 
CCGACCGTCA CCATGTTCCA GGAGCGTCTC GCGGCGCTCG AGGGCGGCGA GGCCTGCATC 
GCGACGGCGT CGGGGATGGC CGCGATCATG TCGGTCGTGA TGGCCGCGCT GCAGGCCGGC 
GACCACCTCG TCAGCTCGCG CAGCCTGTTC GGCTCGACGC TCGGCATGTT CTCGCAGATC 
TTCAGCAAGT TCGGCATCAC GACGACCTTC GTCGACCCGA CCGACCTGAA TGCATGGAAG 
GAAGCCGTGC GGCCGGAAAC GAAGATGTTC TTCCTCGAGA CGCCGTCGAA CCCGCTGACC 
GAACTCGCCG ACATCGAGGC GATCGGCAAG ATCGCGAAGG CATCGAACGC ACTGTTCGTC 
GTCGACAACT GTTTCTGCAG CCCGGTGCTG CAGCAGCCGC TGAAGCTCGG CGCGGATGTC 
GTGATGCACT CGGCGACGAA ATTCCTCGAC GGCCAGGGGC GCGTGCTCGG CGGCGCGCTG 
GTCGGCTCGA AGGAATTCAT CATGGGCAAG GTGTTCCCGT TCGTGCGCAG CGCGGGCCCG 
ACGCTGTCGG CGTTCAACGC GTGGGTGCTG CTGAAGGGGA TGGAGACACT GTCGCTGCGC 
GTCGAGAAGC AGTCGGCGAA CGCGCTGGAG ATCGCGCGCT GGCTCGATTC GCATCCGGCC 
GTCGCGCGCG TGTTTCATCC GGGCCTCGAA TCGCACCCGC AGCACGAACT CGCGAAGCGT 
CAGCAAAAGG CGGGCGGGTC GATCCTGTCG TTCGAGCTGA AGGGCGATAC GCCTGAGCAG 
CAGCGCGCGA ATGCGTGGCG CGTGATCGAC AACACGAAGC TGATCTCGAT CACCGGCAAC 
CTCGGCGACA CGCGCACGAC GATCACTCAT CCGGCGACGA CCACGCACGG CCGCATCACG 
CCGGAAGCGC GTGCGGCAGC GGGGATCAGC GAAGGGCTGA TCCGGTTGTC GGTCGGCCTC 
GAAGACGTGG GCGACCTGCG CAAGGATCTC GCGCGCGGCC TCGAAGGCTG A

Protein sequence

MDDSLNFDTL AVRAGTLRSD FNEHSEALFL TSSFCFQSAA DAAERFANSE DYFTYSRFTN 
PTVTMFQERL AALEGGEACI ATASGMAAIM SVVMAALQAG DHLVSSRSLF GSTLGMFSQI 
FSKFGITTTF VDPTDLNAWK EAVRPETKMF FLETPSNPLT ELADIEAIGK IAKASNALFV 
VDNCFCSPVL QQPLKLGADV VMHSATKFLD GQGRVLGGAL VGSKEFIMGK VFPFVRSAGP 
TLSAFNAWVL LKGMETLSLR VEKQSANALE IARWLDSHPA VARVFHPGLE SHPQHELAKR 
QQKAGGSILS FELKGDTPEQ QRANAWRVID NTKLISITGN LGDTRTTITH PATTTHGRIT 
PEARAAAGIS EGLIRLSVGL EDVGDLRKDL ARGLEG