Gene BMA10229_A3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A3103
Symbol	iscS-1
ID	4792758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	+
Start bp	3140750
End bp	3141973
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	65%
IMG OID
Product	cysteine desulfurase
Protein accession	YP_001029044
Protein GI	124385796
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.412431
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAACG ATATCCCCCA CCTGCCCATC TACATGGACT ACAGCGCGAC GACCCCCGTC 
GATCCGCGCG TCGTCGACAA GATGGTGCCG TATCTGCGCG AGCAGTTCGG CAACCCGGCG 
TCGCGCAGCC ACGCATACGG CTGGGACGCG GAGCGCGCGG TCGAAGAGGC GCGCGAGCAG 
GTGGCCGCCC TCGTGAACGC CGATCCGCGC GAGATCATCT GGACCTCCGG CGCGACCGAG 
TCCGACAACC TCGCGATCAA GGGCGCCGCG CACTTCTATC AGGGCAAGGG CAAGCACATC 
GTCACCGTGA AGACCGAGCA CAAGGCGGTG CTCGACACCT GCCGCGAGCT CGAGCGCGAA 
GGCTTCGAGG TGACCTATCT CGACGTGAAG GACGACGGGC TCGTCGATCT CGACGTGTTC 
AAGGCCGCGC TGCGCCCGGA CACGATCCTC GTGTCGGTGA TGCATGTGAA CAACGAGATC 
GGCGTGATCC AGGACATCGC GACGATCGGC GAGATCTGCC GCGAGAAGGG CATCATCTTC 
CACGTCGACG CCGCGCAGGC GACGGGCAAG GTCGAAATCG ACCTCGCGAA GCTGAAGGTC 
GACCTGATGT CGTTCTCCGC GCACAAGACC TACGGCCCGA AGGGCATCGG CGCGTTGTAT 
GTGCGCCGCA AGCCGCGCGT GCGCATCGAG GCGCAGATGC ACGGCGGCGG CCACGAGCGC 
GGCATGCGCT CGGGCACGTT GCCGACGCAC CAGATCGTCG GCATGGGCGA GGCGTTTCGC 
ATCGCGCGCG AAGAGATGGC GACCGAGAAC GAGCGCATCC GGATGCTGCG CGACAAGCTG 
CTGCGCGGCC TGTCGGAAAT CGACGAAACC TACGTGAACG GCGATCTCGA GCACCGGATT 
CCGCACAACC TGAACATCAG CTTCAATTTT GTCGAAGGCG AATCGCTGAT CATGGCGATC 
AAGGACGTCG CGGTGTCGTC GGGTTCCGCG TGCACGTCGG CGTCGCTCGA GCCGTCCTAC 
GTGCTGTGCG CGCTCGGCCG CAACGACGAG CTCGCGCACA GCTCGATCCG CTTCACGGTC 
GGCCGCTTCA CGACGGAGCA GGAAGTCGAC TACGTGATCG ACCTGCTGAA GAGCAAGATC 
GCGAAGCTGC GCGACCTGTC GCCGCTTTGG GAGATGCATC AGGAAGGCAT CGATCTGTCG 
ACGATCGAAT GGGCGGCGCA CTGA

Protein sequence

MNNDIPHLPI YMDYSATTPV DPRVVDKMVP YLREQFGNPA SRSHAYGWDA ERAVEEAREQ 
VAALVNADPR EIIWTSGATE SDNLAIKGAA HFYQGKGKHI VTVKTEHKAV LDTCRELERE 
GFEVTYLDVK DDGLVDLDVF KAALRPDTIL VSVMHVNNEI GVIQDIATIG EICREKGIIF 
HVDAAQATGK VEIDLAKLKV DLMSFSAHKT YGPKGIGALY VRRKPRVRIE AQMHGGGHER 
GMRSGTLPTH QIVGMGEAFR IAREEMATEN ERIRMLRDKL LRGLSEIDET YVNGDLEHRI 
PHNLNISFNF VEGESLIMAI KDVAVSSGSA CTSASLEPSY VLCALGRNDE LAHSSIRFTV 
GRFTTEQEVD YVIDLLKSKI AKLRDLSPLW EMHQEGIDLS TIEWAAH