Gene Smed_4522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4522
Symbol
ID	5318497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1007760
End bp	1008920
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	640776323
Product	siroheme synthase
Protein accession	YP_001313255
Protein GI	150376659
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1648] Siroheme synthase (precorrin-2 oxidase/ferrochelatase domain)
TIGRFAM ID	[TIGR01470] siroheme synthase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGCCT CACCGTCGCA GCAGAGTGAG CGGCCCGCAA AGCGAGAGCG CGTGGCCGCG 
CTCGCGACGC TGCCGCTTTT CTGGCCTCTG AAGAGCAAAC GGGTGCTCGT CGCCGGCGGC 
AGCGATGCAG CCGCCTGGAA AGCCGAACTG CTGTCGGCCT GCGGTGCGGA AGTTCACGTC 
TATGCGCCGC GCGCGATACT GAGCGGTCTC TTCCTCGACG TCCTCGCCCG TGGAGCCGCG 
CATGAGCTCG GCCGTTTCGT TCACCACGAT AAGGCCTGGC ATGCAGACGC ATTTCGAGAC 
GCGGCAATCG CCATTGCCGA TTGTGACGAG CAATCCGAGG CGGAAGCGTT CTTCCATGCC 
GCACGAACCG CAGGCGTGCC CGTCAACGTC ATCGACAAGC CGGCCTTCTG CGAATTTCAG 
TTCGGATCGA TCGTGAACCG CTCGCCCGTG ATCGTCGCGA TCTCGACCGA TGGCGCGGCG 
CCGATACTGG CGCAGGCGAT CCGCAGACGG ATCGAGGCCC TGCTGCCGCC AGCGCTCAAG 
CATTGGGCGT CGATTGCCCA GGCTATCCGC GATCGCGTGA ATGCCCGTCT GAGCCCTGGG 
GCTGCCCGCC GCATCTTCTG GGAACGTTTC GTCGACCGGG CCTTTCTCGG CAAACCGGAG 
CAGGGTGTGG AGATGCGGCT GATGGCGGAG GCGGATCGTC AGGTCACGCG CCCCTCCGCC 
ATCGGCCGCG TCACCATCGT GGGGGCAGGA CCCGGCGACG CGGAACTCCT CACCTTGAAG 
GCGGTCCGCG CGCTGCAGGC TGCCGACGTG ATACTCTTTG ACGAATGCAT TCAGGACGAG 
GTCCTTGAAC TGGCGCGCCG GGAGGCGAGG CGCGTCCCTG TCGCAGGCAG CGACAAAGAT 
CGCAGCAGCA GCAACGCGAT TCTCGTCCAG GGAGACATTG CGGCGCTGGT CCGGAAGGGA 
AAGAACGTGG TGCGCCTCCG GTCCGGGAAT CCGATGGCAG TCGACGAGGA ATTCGCGGCA 
TTCGAACGCC TCGGACTGCC TGTGCAGATC GTACCTGGCG TCGAAGCCGA GGCTTACCGC 
CCCGACATGG GCTCCGATAT GGGCGAGCTA GCATTCAGCG GGAGACCGGT CCAGCCGGGA 
CTGCACACCA CCAACCACTG A

Protein sequence

MLASPSQQSE RPAKRERVAA LATLPLFWPL KSKRVLVAGG SDAAAWKAEL LSACGAEVHV 
YAPRAILSGL FLDVLARGAA HELGRFVHHD KAWHADAFRD AAIAIADCDE QSEAEAFFHA 
ARTAGVPVNV IDKPAFCEFQ FGSIVNRSPV IVAISTDGAA PILAQAIRRR IEALLPPALK 
HWASIAQAIR DRVNARLSPG AARRIFWERF VDRAFLGKPE QGVEMRLMAE ADRQVTRPSA 
IGRVTIVGAG PGDAELLTLK AVRALQAADV ILFDECIQDE VLELARREAR RVPVAGSDKD 
RSSSNAILVQ GDIAALVRKG KNVVRLRSGN PMAVDEEFAA FERLGLPVQI VPGVEAEAYR 
PDMGSDMGEL AFSGRPVQPG LHTTNH