Gene RoseRS_2573 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2573
Symbol
ID	5209542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	3189277
End bp	3190293
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	64%
IMG OID	640596177
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001276899
Protein GI	148656694
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCGC CGCGCCTGAC CGATACGACC CTCCGTGATG GATCGCACGC ACTGGCGCAT 
ACCTTTACCC GTCAGCAGGT GCGTGATATT GTTCGCGCGC TGGATCGCGC CGGTGTGCCG 
GTGATCGAAG TGACCCACGG CGATGGGTTG GCCGGTTCAT CGCTCCAGTA CGGTTTTTCG 
CGCGTGCCGG ACCTCGACCT GATTGCCGAG GCGCGTGAGA CGGCGGAACG GGCGCGTATT 
GCCGCGTTAC TCCTCCCCGG CATTGGCACG CGCCGCGAAC TGAGGGCCGC CGTCGAACGC 
GGCGTTCAGG TACTGCGGAT CGCAACCCAG TGCACAGAAG CGGATATCAG CGAAGAGCAC 
TTCAAAATGG CGAAAGACAT GGGGCTGGAG ACAGTCGGCT TTCTGATGAT GTCGCATATG 
AGACCTCCTG AATTCCTTGC AGAACAGGCG CGTCTGATGG AGTCGTATGG CGCCGATTGC 
GTCTACGTGG TGGACTCGGC GGGCGCCATG CTGCCGCATG ATGCGGCGGC GCGCGTCCAG 
GCGCTCAAGG CGGCGCTCAC GGTGCAGGTC GGTTTCCATG CCCACAACAA TCTGGGGTTG 
GGGATCGGCA ACACCCTGGC GGCGCTGGAA GCAGGCGCAG ACCAGATTGA TGGATGTCTG 
CGGGGGTTGG GCGCCGGTGC GGGCAACGCC GCCACCGAGG TGCTGGCGGC GGTGCTCGAC 
CGGCTGGGGA TCAACCCTGG TCTCGATGTG CTGGCGCTCA TGGACGCTGC CGAGTATGTG 
GTGGCGCCGA TCATGCCATT TCAGCCCTTC CCCGACCGCG ATGCAATCAC GATCGGGTAT 
GCCGGGGTCT ACTCGACCTT TCTGCTGCAT GCCAGGCGGA TCGGAGAACA GTTGGGCGTC 
GATCCGCGCG CCATCCTGAT TGAACTGGGA CGGCGTCAGA CGGTTGCCGG GCAGGAAGAC 
TGGATTCTTG ATGTGGCGCT CGAACTGGTG CGCCAGCAGC AGACCACGCC AGTATGA

Protein sequence

MNAPRLTDTT LRDGSHALAH TFTRQQVRDI VRALDRAGVP VIEVTHGDGL AGSSLQYGFS 
RVPDLDLIAE ARETAERARI AALLLPGIGT RRELRAAVER GVQVLRIATQ CTEADISEEH 
FKMAKDMGLE TVGFLMMSHM RPPEFLAEQA RLMESYGADC VYVVDSAGAM LPHDAAARVQ 
ALKAALTVQV GFHAHNNLGL GIGNTLAALE AGADQIDGCL RGLGAGAGNA ATEVLAAVLD 
RLGINPGLDV LALMDAAEYV VAPIMPFQPF PDRDAITIGY AGVYSTFLLH ARRIGEQLGV 
DPRAILIELG RRQTVAGQED WILDVALELV RQQQTTPV