Gene SbBS512_E3744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3744
Symbol	cysG
ID	6273182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3469944
End bp	3471317
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	54%
IMG OID	641727608
Product	siroheme synthase
Protein accession	YP_001882043
Protein GI	187732394
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0007] Uroporphyrinogen-III methylase [COG1648] Siroheme synthase (precorrin-2 oxidase/ferrochelatase domain)
TIGRFAM ID	[TIGR01469] uroporphyrin-III C-methyltransferase [TIGR01470] siroheme synthase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATCATT TGCCTATATT TTGCCAATTA CGCGATCGCG ACTGTCTGAT TGTCGGCGGT 
GGTGATGTCG CGGAACGCAA AGCAAGGTTG CTGTTAGACG CAGGCGCTCG CTTAACGGTG 
AATGCATTAG CGTTTATTCC ACAGTTCACC GCATGGGCAG ATGCAGGCAT GTTAACCCTC 
GTCGAAGGGC CATTTGATGA AAGCCTTCTC GACACCTGCT GGCTGGCGAT TGCAGCGACG 
GATGATGACA CGCTTAACCA GCGCGTCAGC GAAGCCGCTG AAGCTCGTCG CATCTTCTGT 
AACGTAGTCG ATGCGCCGAA AGCCGCCAGC TTTATTATGC CGTCGATTAT TGACCGCTCA 
CCGCTAATGG TAGCGGTCTC CTCTGGCGGC ACCTCTCCGG TTCTGGCGCG CCTGTTGCGC 
GAAAAACTCG AATCACTGCT GCCGTTGCAT CTGGGCCAGG TGGCGAAATA TGCCGGGCAA 
TTACGCGGGC GAGTGAAACA ACAGTTCACC ACGATGAGTG AGCGTCGCCG TTTCTGGGAG 
AAATTGTTCG TTAACGACCG CCTAGCGCAG TCGCTGGCAA ACAACGATCA GAAAGCCATT 
ACTGAAACGA CCGAACAGTT AATCAACGAA CCGCTCGACC ATCGCGGTGA AGTGGTGCTG 
GTTGGTGCAG GTCCGGGCGA TGCCGGGCTG CTGACGCTGA AAGGACTGCA ACAAATTCAG 
CAGGCAGATG TGGTGGTCTA CGACCGTCTG GTTTCTGACG ATATTATGAA TCTGGTACGC 
CGCGATGCTG ATCGCGTTTT CGTCGGCAAA CGCGCGGGAT ACCACTGTGT ACCGCAGGAA 
GAGATTAACC AGATCCTGCT GCGGGAAGCG CAAAAAGGCA AACGCGTGGT GCGGCTGAAA 
GGTGGCGATC CGTTTATTTT TGGCCGTGGT GGCGAAGAGC TGGAAACACT GTGCAACGCG 
GGTATTCCGT TCTCGGTGGT TCCGGGTATT ACCGCAGCTT CTGGTTGCTC TGCCTATTCG 
GGTATTCCAC TCACGCATCG CGATTATGCC CAGAGCGTAC GCTTAATTAC CGGACACTTA 
AAAACCGGTG GCGAGCTGGA CTGGGAAAAC CTGGCGGCAG AAAAACAGAC GCTGGTGTTC 
TATATGGGGT TGAATCAGGC CGCGACTATT CAGCAAAAGC TGATTGAACA CGGTATGCCT 
GGCGAAATGC CGGTGGCAAT TGTCGAAAAC GGAACGGCAG TCACGCAGCG CGTGATTGAC 
GGTACGCTCA CGCAACTCGG TGAACTTGCT CAGCAAATGA ACAGTCCATC GCTAATTATT 
ATTGGTCGGG TTGTTGGCCT GCGCGATAAA CTGAACTGGT TCTCCAACCA TTAA

Protein sequence

MDHLPIFCQL RDRDCLIVGG GDVAERKARL LLDAGARLTV NALAFIPQFT AWADAGMLTL 
VEGPFDESLL DTCWLAIAAT DDDTLNQRVS EAAEARRIFC NVVDAPKAAS FIMPSIIDRS 
PLMVAVSSGG TSPVLARLLR EKLESLLPLH LGQVAKYAGQ LRGRVKQQFT TMSERRRFWE 
KLFVNDRLAQ SLANNDQKAI TETTEQLINE PLDHRGEVVL VGAGPGDAGL LTLKGLQQIQ 
QADVVVYDRL VSDDIMNLVR RDADRVFVGK RAGYHCVPQE EINQILLREA QKGKRVVRLK 
GGDPFIFGRG GEELETLCNA GIPFSVVPGI TAASGCSAYS GIPLTHRDYA QSVRLITGHL 
KTGGELDWEN LAAEKQTLVF YMGLNQAATI QQKLIEHGMP GEMPVAIVEN GTAVTQRVID 
GTLTQLGELA QQMNSPSLII IGRVVGLRDK LNWFSNH