Gene Rcas_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2024
Symbol
ID	5539502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2596402
End bp	2597874
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	65%
IMG OID	640894159
Product	protoporphyrinogen oxidase
Protein accession	YP_001432130
Protein GI	156742001
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID	[TIGR00562] protoporphyrinogen oxidase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.364182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCGA TGCATTCGAC ATCGGCGGCA ACGCTGTTCC CGGGCGGTCA ACCGCACATC 
GTTGTGGTAG GCGGCGGGAT CAGCGGCATG AGCGCGGCAT ATGAACTGGG GCGCGCAACG 
CGCGACGGGG CGCCGCCGGT GATGGTCACG CTCATCGAGC GTGAGGCGCG TTTAGGGGGC 
AAGGTCGTCA CCGAGCGCAA CGGACCCTTC GTCATCGAAG GCGGACCCGA CTCGTTCATG 
GCGCAGAAAC CATGGGCTGC CGAACTGGCG CGTGAGATCG GTCTGGGTGA CGAGTTGATG 
GTCGCCTCGC CGATGCGCCG CACGACATGG GTGCTGATCC GTGGACGACC GCAACCGCTC 
CCCGAAGGCA TGCTCCTGAT CGTCCCCACA CGCATCGCAC CCTTTGCCTT CTCGCCGCTG 
ATTTCTCCCC TTGGAAAACT TCGTATGGCG CTCGACTTGT TCGTTCCGGC GCGCCGTGAC 
GATGGCGATG AGACGCTCGC CGACTTTATT CGCCGTCGCC TGGGGAATGA GGCGCTTGAT 
CGTCTGGCGG AGCCGATCCT CTCCGGCATT CACAGCGCTG AGTGCGAACG CCAGAGCATT 
CTGGCGACCT TTCCGCGCTT CCGCGAGTTG GAGAAACGCC ATGGCAGTCT GATCCGCGGC 
ATGCTTGCAG CGCGGCGCAC CGCGTCACCC TCTTCAGCGC ATCAGTCGCC CTTCATGACG 
CTGCGCGGCG GCATGGGGAC GCTCGTCGAG CGGTTGGAAC AACGTCTCAC GGCGCGTATC 
CTGACCAACC GCCGGGTGAT GGCGCTCACC TGTGATACAA CCGCTGCGCG TCCCTATCGT 
CTGTGGTTGG ACGACGGCGC CACGCTGGAT GCCGATGCCG TCATTCTGGC GACGCCATCC 
TACGCCGCTG CTGACCTCGT CGGTGCATCG TTCCCGGCGC TGGCGGATGC GTTACGCGCC 
ATCCGGTACG TTTCGACCGC CACGGTCTCA CTGGTCTACC GGCGCAGTGA GGTCGGGACG 
CCGCTCGATG GCTATGGTCT GGTCATTCCG CGCAGCGAAC AGACCTGGAT TAATGCATGC 
ACCCTCTCCT CGGTTAAGTT TCGCCATCGC GCGCCCGATG AGTATCTGTT GCTGCGCTGC 
TTCGTCGGCG GATCGCGTCG TCCAGAACTG CTGGCGCGGG ACGATGACGA CCTGGTGCGC 
ATGGCGCAGT CCGATCTGCG CGCCGTTCTG GGCATCACCG CCGTGCCGCT GCTGACGCGC 
GTGTATCGCT GGCATAACGG CAACCCGCAG TATGATGTCG GGCATCTGGA ACGAATCGCC 
GCGCTCGAGG CGCTTTGTCC GGCGGGTCTT TTGCTGGCCG GCGCCGCGTA TCGTGGCGTT 
GGCGTGCCCG ACTGCATCAA ACAGGGGCGT GAGGCGGCGC GTCGGGCGCT CGATGTGGTT 
GCGACCGCTC GCTATCCGGT GATGGAAAAG TAA

Protein sequence

MTAMHSTSAA TLFPGGQPHI VVVGGGISGM SAAYELGRAT RDGAPPVMVT LIEREARLGG 
KVVTERNGPF VIEGGPDSFM AQKPWAAELA REIGLGDELM VASPMRRTTW VLIRGRPQPL 
PEGMLLIVPT RIAPFAFSPL ISPLGKLRMA LDLFVPARRD DGDETLADFI RRRLGNEALD 
RLAEPILSGI HSAECERQSI LATFPRFREL EKRHGSLIRG MLAARRTASP SSAHQSPFMT 
LRGGMGTLVE RLEQRLTARI LTNRRVMALT CDTTAARPYR LWLDDGATLD ADAVILATPS 
YAAADLVGAS FPALADALRA IRYVSTATVS LVYRRSEVGT PLDGYGLVIP RSEQTWINAC 
TLSSVKFRHR APDEYLLLRC FVGGSRRPEL LARDDDDLVR MAQSDLRAVL GITAVPLLTR 
VYRWHNGNPQ YDVGHLERIA ALEALCPAGL LLAGAAYRGV GVPDCIKQGR EAARRALDVV 
ATARYPVMEK