Gene Rcas_2410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2410
Symbol
ID	5539891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3103018
End bp	3104028
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	63%
IMG OID	640894540
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001432508
Protein GI	156742379
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCGC CGCGCCTAAC CGATACGACC CTGCGCGATG GATCGCACGC GATGCGGCAT 
ATGTTCACCC GCCAGCATGT GCGCGACATT GTGACCGCAC TGGATCGCGC CGGAGTCCCG 
GTGATTGAGG TGACCCACGG CGATGGACTG GCAGGCTCGT CGTTGCAGTA CGGTTTCTCG 
TTCGTCTCCG ACCTCGACCT GATCGCCGAG GCGCGAGAGT CGGCAGAACG GGCGCGCATT 
GCAGCGTTGC TCCTTCCCGG CATTGGGACG CGCCGTGAAC TGAAGGCCGC CGTCGAACGC 
GGCGTTCAGG TGCTGCGGAT CGCCACACAA TGCACCGAAG CGGACATCAG TGAAGAACAT 
TTCAAGATGG CGAAGGACAT GGGGCTGGAA ACCGTCGGTT TTCTCATGAT GTCCCACATG 
CGCTCTCCCG AATTTCTGGC GGAGCAGGCA TTGCTTATGG AGTCGTATGG CGCCGACTGC 
GTCTATGTGG TCGATTCGGC AGGTGCTATG CTGCCGCGCG ACGCGGCGGC GCGTGTGCGG 
GCGCTCAAAG ATACGCTGCG GGTGCAGGTC GGTTTCCACG CGCACAACAA CCTGGGGCTG 
GGGATCGGCA ATACCCTGGC GGCGCTCGAA GCAGGCGCCG ACCAGATCGA TGGATGTCTT 
CGCGGGTTGG GCGCCGGTGC GGGCAACGCC GCCACCGAGT TGTTGGCGGC GGTGCTCGAC 
CGGCTGGGTG TCAATCCAGG GCTGGATGTG CTGGCGCTGA TGGATGCCGC TGAGTATGTA 
GTGGCGCCGA TCATGCCGTT TCAGCCCTTT CCCGACCGCG ATGCCATTAC TATCGGGTAC 
GCCGGAGTCT ACTCGACGTT TCTGCTGCAT GCCAAACGGG TGGGCGAGCA ACTGGGCGTT 
GATCCGCGCG CTATCCTGAT CGAGTTGGGG CGCCGCCAGA CAGTCGCCGG GCAGGAGGAC 
TGGATACTGG ACGTGGCGCT CGAACTGGTG CGCAAACGAG AAAGGGCATA G

Protein sequence

MNAPRLTDTT LRDGSHAMRH MFTRQHVRDI VTALDRAGVP VIEVTHGDGL AGSSLQYGFS 
FVSDLDLIAE ARESAERARI AALLLPGIGT RRELKAAVER GVQVLRIATQ CTEADISEEH 
FKMAKDMGLE TVGFLMMSHM RSPEFLAEQA LLMESYGADC VYVVDSAGAM LPRDAAARVR 
ALKDTLRVQV GFHAHNNLGL GIGNTLAALE AGADQIDGCL RGLGAGAGNA ATELLAAVLD 
RLGVNPGLDV LALMDAAEYV VAPIMPFQPF PDRDAITIGY AGVYSTFLLH AKRVGEQLGV 
DPRAILIELG RRQTVAGQED WILDVALELV RKRERA