Gene Rcas_1541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1541
Symbol
ID	5539017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1964853
End bp	1965968
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	57%
IMG OID	640893679
Product	magnesium-protoporphyrin IX monomethyl ester cyclase
Protein accession	YP_001431652
Protein GI	156741523
COG category
COG ID
TIGRFAM ID	[TIGR02029] magnesium-protoporphyrin IX monomethyl ester aerobic oxidative cyclase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00244092
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCAACA TGCCCGGCGA GTACAGTCCG ACGACACGCC ATGCGCTGCG CGAGGCGATC 
CTCAACCCGC GCTTCTACAC AACCGATTTC CGCGCAATTG ATCGTCTGAA TGTGGCGCAC 
ATGCGTGATG AGTTCGATTG GATTCGCAAC GAATTCGAGT TCGATTACAA CAAGAAGCAT 
TTTGTGCGCA ACGAGGAGTT TCTGGCAAAC TTCGACGATA TGCCAGCCCG CGATCTGTTC 
ATCGAGTTCC TCGAGCGTAG TTGCACCGCC GAATTCAGCG GGTGTCTGCT CTATGCCGAG 
ATGGTGAAAC ACCTGCACGA TCCGACGCTC AGGGCGATCT TTCGCTGTAT GAGCCGTGAT 
GAAGGGCGTC ATGCCGGTTT TCTCAACAAA ACCATGGCGG ATCTGGGCGT CGAGATGAAT 
CTTCAGGTGC TTCACACGCG CAAGAAGTAC ACGTATTTTC AGCCGAAATT CATTTTCTAT 
AGCGTCTATC TCTCCGAGAA GATCGGCTAT GCCCGGTATA TCACAATTTA TCGCCATTTG 
CAGCACCATC CGCAGGGCAT GATCCATCCG ATCTTCAAAT GGTTCGAGAA GTGGTGCAAC 
GATGAATATC GGCATGGCGA GTTCTTCTCG CTCTTGATGC GCAGTCAGCC TGATCTGTTG 
CGCGGCGGCA ACCTGCGCTG GATCCGATTC TTCCTGCTGG CGGTGTACGC CACGATGTAC 
CTGAATGACG CGCGCCGCGC CGGGTTCTAC GAGGCGCTTG GACTGAACTG GCGCGACTAC 
GATCAGCGCG TGATCCGGCT GACGAACCAT ATCGCCACGC AAGTGTTCCC GGTGACTCTG 
CCGGTGGACG ATCCGCGCTT CTTCCGCCAT CTCGACGCCT GTGTGCGCTA CGATGCTCAG 
ATCCGTGCGC TCGAAGGACG AAACGATCCG ATCGCGCAGG TGCAACGGGC GCGTCTGGGC 
GCCGGGATTG CTGCGCGCCT CCTGGCGACC TATCGCCTGC CGCCGGCGCC GACCACCGAT 
GCCAATCGTT GGAAGGGTCT CGAAGGCTTC CCGAACTATC CCGGTCCGGG CTGGAAACAG 
GACGCATCAC TCAACGAACG GGTCATATCA GCATAA

Protein sequence

MINMPGEYSP TTRHALREAI LNPRFYTTDF RAIDRLNVAH MRDEFDWIRN EFEFDYNKKH 
FVRNEEFLAN FDDMPARDLF IEFLERSCTA EFSGCLLYAE MVKHLHDPTL RAIFRCMSRD 
EGRHAGFLNK TMADLGVEMN LQVLHTRKKY TYFQPKFIFY SVYLSEKIGY ARYITIYRHL 
QHHPQGMIHP IFKWFEKWCN DEYRHGEFFS LLMRSQPDLL RGGNLRWIRF FLLAVYATMY 
LNDARRAGFY EALGLNWRDY DQRVIRLTNH IATQVFPVTL PVDDPRFFRH LDACVRYDAQ 
IRALEGRNDP IAQVQRARLG AGIAARLLAT YRLPPAPTTD ANRWKGLEGF PNYPGPGWKQ 
DASLNERVIS A