Gene Rcas_2028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2028
Symbol
ID	5539506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2600567
End bp	2601625
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	61%
IMG OID	640894163
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001432134
Protein GI	156742005
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.562802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTTC ATCGCTTTCT GGCGGCGTGT CGCCGCCAGC CAACCGATGC CACGCCGGTC 
TGGTTTATGC GCCAGGCAGG GCGCTATATG CCGGAGTATC GCGCGATCCG CGAACGCTAC 
GGCTTTCTCG ATATGGTGAA AACGCCGGAA CTGGCTGCCG AGATCACCAT GCAGCCGCTC 
CTTGCTTTCC CCGTCGATGC AGCGATCATT TTCGCCGACA TTCTGCCGTT GCTCGAAGGG 
ATCGGTCTTC AGTTGACTTA TGAGCAGGGT GAAGGTCCGG TCATTCACAA TCCGTTGCGC 
TCCTCCGCCG ACATTGCCGC CCTGCGCGAC GCCGATCCGC GCGAAACGGT CGCGTACACG 
ATCCAGGCGA TCCGTTTGGT GAAACGTGAA CTGGAAGAGC GCGCGCCGCT CATTGGGTTC 
AGTGGCGCGC CGTTCACGCT GGCGGCGTAT GCCGTCGAGG GAGGATCGTC GCGGGATCAT 
CGCTTGACGA AGGCGCTGAT GTATGCCGAA CCGCAGGCAT GGCGCGATCT GATGGAGCGT 
TTGACAACCC AGGTGAGCGC CTACCTGATT GCGCAGATTG AGGCTGGCGC CGATGCGGTG 
CAGCTCTTCG ATAGTTGGGC AGGCGCACTC GCACCCGGCG ATTATGCCGA ATACGTGCTG 
CCGTTTGTGC AGCAATGTAT CATTAATGTG CGCGCCGGTT GTGGGGTCGT TCCGCCGCCG 
CCAATTATCT ACTTCGGTGT CGGCATGTCG GGTATGCTCG GTATGTTGCG TCAGACCGAC 
GCGGATGTCA TTGGTCTCGA TTGGCGCATC TATCTTGATG ATGGGTGGGC GCAGGTTGGT 
CCTGGCGTCG CGGTTCAGGG CAACCTCGAC CCGCACACGC TCCTGGCGCC CTGGTCCGAC 
GTCCGTCGTC GCGCCGCCGA TATTCTCGAC CGCGCGGCCA GTCGTCCAGG GCATATTTTC 
AACCTGGGGC ACGGGATCGT GCCCGAAACG CCGGTTGATA CTGTGCGTCG TCTGGCTGAG 
TTCGTTCATG AGTATTCAGC GGAAGAAACC TATGACTGA

Protein sequence

MTLHRFLAAC RRQPTDATPV WFMRQAGRYM PEYRAIRERY GFLDMVKTPE LAAEITMQPL 
LAFPVDAAII FADILPLLEG IGLQLTYEQG EGPVIHNPLR SSADIAALRD ADPRETVAYT 
IQAIRLVKRE LEERAPLIGF SGAPFTLAAY AVEGGSSRDH RLTKALMYAE PQAWRDLMER 
LTTQVSAYLI AQIEAGADAV QLFDSWAGAL APGDYAEYVL PFVQQCIINV RAGCGVVPPP 
PIIYFGVGMS GMLGMLRQTD ADVIGLDWRI YLDDGWAQVG PGVAVQGNLD PHTLLAPWSD 
VRRRAADILD RAASRPGHIF NLGHGIVPET PVDTVRRLAE FVHEYSAEET YD