Gene Rcas_0916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0916
Symbol
ID	5538382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1199934
End bp	1201121
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	63%
IMG OID	640893066
Product	dihydroorotase
Protein accession	YP_001431049
Protein GI	156740920
COG category	[R] General function prediction only
COG ID	[COG3964] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACC TTCTCATTCG TGGCGGGCAC GTCATCGACC CGGCAAACGA TCTGGACGCC 
CCTGCCGATG TTGCGATCCG CGACGGACGC ATTGCAGCCG TGGCGCCAGC GCTCGACCCG 
GCTCAGGCGC TCCACGTGAT CGACGCCTCA GGGCAGATCG TCACCCCGGG GCTGGTCGAT 
TTGCACACCC ACTTCTACTG GGGCGCCACG TACTGGGGCA TCGAAGCAGA CCCGGTTGCC 
GCACGTAGCG GCGTGACAAC CTGGGTGGAC GCGGGTAGCG CCGGGGCGTA TAGTTTTCCG 
GGGTTTCGCG AGTTTATCTG CGCTGCCAGT CGGGTGCGGA CGTTTGCTTT TCTCAACCTC 
TCGGCAATCG GGCTGATCGC GCCGACCTGG GAGTTCGCTA ATCTCGACTA CTGCGACGTC 
GATCTGGCGA TCAGGACGGT AGAGGAGAAC CGTGACATTA TTGTAGGGAT CAAGGCGCGC 
ATCGATCACA ACACGACGCG CGGCGTCGGC ATTCGCCCGC TGCACCTGGC GCGCGCCCTC 
GCCGACCGGG TGGCGCTGCC GCTCATGGTG CACATCGGCA ATGGCCCGCC TCCAATCGAC 
GAGATTGTTG CATTGCTGCG CCCCGGCGAT ATTCTGACGC ACTGTTTCAC TGGCGGAACG 
CATCGGTTGC TCTTGAAGGA CGGGCGCCTT TCCCCGATTG CGCGCGAGTT GCAGCAGCGC 
GGCGTGCTGC TTGACATCGG GCATGGAACA GGATCGTTCA GTTATCGCAC TGCCGAAGCG 
GCGCTCCAGG AAGGGGTGCT GCCGGATATT ATCAGCAGCG ATATTCACCA ACTCAGCGTC 
CAGGGTCCAA TGTTCGATCT GCCGACGACC CTCTCGAAGT TCCTTGACCT GGGTTTGACG 
CTGCCCGATG TTATCGACCG GGCAACGCGC CGTCCGGCGC TGGCGATTGG CAAGCCGGAA 
CTCGGAACGC TCCACCCCGG CAGTCCTGGC GATGTCGCGC TCTTTCGCGT CGAAGAGGGC 
GATTACACCT TTTTCGATGT CGAAATGAAC GCCCGCCGCG GCAATCGGCG ACTGACCTGC 
ACTGCCACCA TTGTGGGTGG AACGCTGCTG CCGCGCCTGC CGGAACGTCC CCCGGCAATC 
TGGGCGATCC TGCCCGATCA TCAGCGGCGG ATTCTTGTCC GGGAATAG

Protein sequence

MDDLLIRGGH VIDPANDLDA PADVAIRDGR IAAVAPALDP AQALHVIDAS GQIVTPGLVD 
LHTHFYWGAT YWGIEADPVA ARSGVTTWVD AGSAGAYSFP GFREFICAAS RVRTFAFLNL 
SAIGLIAPTW EFANLDYCDV DLAIRTVEEN RDIIVGIKAR IDHNTTRGVG IRPLHLARAL 
ADRVALPLMV HIGNGPPPID EIVALLRPGD ILTHCFTGGT HRLLLKDGRL SPIARELQQR 
GVLLDIGHGT GSFSYRTAEA ALQEGVLPDI ISSDIHQLSV QGPMFDLPTT LSKFLDLGLT 
LPDVIDRATR RPALAIGKPE LGTLHPGSPG DVALFRVEEG DYTFFDVEMN ARRGNRRLTC 
TATIVGGTLL PRLPERPPAI WAILPDHQRR ILVRE