Gene EcolC_0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0344
Symbol	cysG
ID	6065889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	395728
End bp	397101
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	54%
IMG OID	641599743
Product	siroheme synthase
Protein accession	YP_001723349
Protein GI	170018395
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0007] Uroporphyrinogen-III methylase [COG1648] Siroheme synthase (precorrin-2 oxidase/ferrochelatase domain)
TIGRFAM ID	[TIGR01469] uroporphyrin-III C-methyltransferase [TIGR01470] siroheme synthase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.898093
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATCATT TGCCTATATT TTGCCAATTA CGCGATCGCG ACTGTCTGAT TGTCGGCGGT 
GGTGATGTCG CGGAACGCAA AGCAAGGTTG CTGTTAGACG CAGGCGCTCG CTTAACGGTG 
AATGCATTAG CGTTTATTCC ACAGTTCACC GCATGGGCAG ATGCAGGCAT GTTAACCCTC 
GTCGAAGGGC CATTTGATGA AAGCCTTCTC GACACCTGCT GGCTGGCGAT TGCAGCGACG 
GATGATGACG CGCTTAACCA GCGCGTCAGC GAAGCCGCTG AAGCTCGTCG CATCTTCTGT 
AACGTAGTCG ATGCGCCGAA AGCCGCCAGC TTTATTATGC CGTCGATTAT TGACCGCTCA 
CCGCTCATGG TCGCGGTCTC CTCTGGCGGC ACCTCTCCGG TTCTGGCACG CCTGTTGCGC 
GAAAAACTCG AATCACTGCT GCCGTTGCAT CTGGGCCAGG TAGCGAAATA CGCCGGGCAA 
TTACGCGGGC GAGTGAAACA ACAGTTCGCC ACGATGGGTG AGCGTCGCCG TTTCTGGGAG 
AAATTGTTCG TTAACGATCG CCTGGCGCAG TCGCTGGCAA ACAACGATCA GAAAGCCATT 
ACTGAAACCA CCGAACAGTT AATCAACGAA CCGCTTGACC ATCGCGGTGA AGTGGTGCTG 
GTTGGTGCAG GTCCGGGCGA TGCCGGGCTG CTGACGCTGA AAGGACTGCA ACAAATTCAG 
CAGGCAGATG TGGTGGTCTA CGACCGTCTG GTTTCTGACG ATATTATGAA TCTGGTACGC 
CGCGATGCTG ATCGCGTTTT CGTCGGCAAA CGCGCGGGAT ACCACTGTGT ACCGCAGGAA 
GAGATTAACC AGATCCTGCT GCGGGAAGCG CAAAAAGGCA AACGCGTGGT GCGGCTGAAA 
GGTGGCGATC CGTTTATTTT TGGCCGTGGT GGCGAAGAGC TGGAAACACT GTGCAACGCG 
GGTATTCCGT TCTCGGTGGT TCCGGGTATT ACCGCAGCTT CTGGTTGCTC TGCCTATTCG 
GGTATTCCAC TCACGCATCG CGATTATGCC CAGAGCGTAC GCTTAATTAC CGGACACTTA 
AAAACCGGTG GCGAGCTGGA CTGGGAAAAC CTGGCGGCAG AAAAACAGAC GCTGGTGTTC 
TATATGGGGT TGAATCAGGC CGCGACTATT CAGCAAAAGC TGATTGAACA CGGTATGCCT 
GGCGAAATGC CGGTGGCAAT TGTCGAAAAC GGAACGGCAG TCACGCAGCG CGTGATTGAC 
GGTACGCTCA CGCAACTCGG TGAACTTGCT CAGCAAATGA ACAGTCCATC GCTAATTATT 
ATTGGTCGGG TTGTTGGCCT GCGCGATAAA CTGAACTGGT TCTCCAACCA TTAA

Protein sequence

MDHLPIFCQL RDRDCLIVGG GDVAERKARL LLDAGARLTV NALAFIPQFT AWADAGMLTL 
VEGPFDESLL DTCWLAIAAT DDDALNQRVS EAAEARRIFC NVVDAPKAAS FIMPSIIDRS 
PLMVAVSSGG TSPVLARLLR EKLESLLPLH LGQVAKYAGQ LRGRVKQQFA TMGERRRFWE 
KLFVNDRLAQ SLANNDQKAI TETTEQLINE PLDHRGEVVL VGAGPGDAGL LTLKGLQQIQ 
QADVVVYDRL VSDDIMNLVR RDADRVFVGK RAGYHCVPQE EINQILLREA QKGKRVVRLK 
GGDPFIFGRG GEELETLCNA GIPFSVVPGI TAASGCSAYS GIPLTHRDYA QSVRLITGHL 
KTGGELDWEN LAAEKQTLVF YMGLNQAATI QQKLIEHGMP GEMPVAIVEN GTAVTQRVID 
GTLTQLGELA QQMNSPSLII IGRVVGLRDK LNWFSNH