Gene SbBS512_E1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1047
Symbol	dcyD
ID	6271005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	960762
End bp	961748
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	54%
IMG OID	641725189
Product	D-cysteine desulfhydrase
Protein accession	YP_001879708
Protein GI	187733033
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2515] 1-aminocyclopropane-1-carboxylate deaminase
TIGRFAM ID	[TIGR01275] pyridoxal phosphate-dependent enzymes, D-cysteine desulfhydrase family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.106931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACTGC ATAATTTAAC CCGTTTTCCA CGGCTGGAGT TTATCGGCGC GCCAACGCCG 
CTCGAATATC TGCCGCGCTT TTCTGATTAT CTTGGACGGG AAATTTTCAT CAAACGGGAT 
GACGTCACAC CCATGGCAAT GGGCGGCAAT AAATTACGTA AGCTGGAATT TCTCGCGGCA 
GATGCCCTGC GCGAAGGTGC CGATACGCTG ATTACTGCCG GCGCGATCCA GTCTAACCAT 
GTGCGGCAGA CTGCCGCAGT TGCGGCGAAA CTCGGCCTGC ACTGCGTGGC GCTGCTGGAA 
AATCCTATTG GCACAACCGC AGAAAACTAT TTAACCAACG GCAATCGTTT GTTGCTGAAT 
CTGTTCAATA CCCAGATTGA AATGTGCGAC GCACTGACCG ATCCCAATGC CCAACTGGAA 
GAGCTGGCGA CGCGAGTCGA AGCACAAGGC TTTCGCCCGT ATGTCATTCC GGTTGGCGGT 
TCTAATGCTC TGGGCGCGCT GGGTTATGTG GAGAGTGCGC TGGAAATCGC GCAACAGTGT 
GAAGGGGCGG TTAATATTTC GTCGGTGGTG GTCGCATCGG GCAGTGCCGG AACTCACGCC 
GGATTGGCTG TTGGGCTGGA ACACCTGATG CCTGAAAGCG AACTGATTGG CGTGACCGTG 
TCGCGTTCCG TTGCCGATCA ATTGCCGAAA GTGGTTAACC TACAACAGGC GATTGCGAAA 
GAACTGGAGC TGACCGCATC AGCGGAAATT TTACTCTGGG ATGACTATTT TGCACCTGGC 
TACGGCGTGC CGAACGACGA AGGCATGGAA GCAGTGAAAT TGCTGGCGCG TCTGGAAGGC 
ATTCTGCTTG ATCCTGTGTA TACCGGAAAA GCGATGGCGG GGCTGATTGA CGGTATCAGT 
CAGAAACGCT TCAAAGATGA AGGGCCGATT CTGTTTATTC ATACCGGCGG CGCGCCTGCG 
CTGTTCGCCT ATCATCCCCA CGTTTAG

Protein sequence

MPLHNLTRFP RLEFIGAPTP LEYLPRFSDY LGREIFIKRD DVTPMAMGGN KLRKLEFLAA 
DALREGADTL ITAGAIQSNH VRQTAAVAAK LGLHCVALLE NPIGTTAENY LTNGNRLLLN 
LFNTQIEMCD ALTDPNAQLE ELATRVEAQG FRPYVIPVGG SNALGALGYV ESALEIAQQC 
EGAVNISSVV VASGSAGTHA GLAVGLEHLM PESELIGVTV SRSVADQLPK VVNLQQAIAK 
ELELTASAEI LLWDDYFAPG YGVPNDEGME AVKLLARLEG ILLDPVYTGK AMAGLIDGIS 
QKRFKDEGPI LFIHTGGAPA LFAYHPHV