Gene Rcas_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1559
Symbol
ID	5539035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2001446
End bp	2002507
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	62%
IMG OID	640893697
Product	homoserine dehydrogenase
Protein accession	YP_001431670
Protein GI	156741541
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACCT ATCGCCTCTT CCTCAGCGGT CTAGGCAATG TGGGCCGCAG TTTTCTTGCC 
ATCATGCAGT CACAGGCGTC GCTCCTCGCC AGGCGCTATG GCGTTGCGCT GCGCCTGGTT 
GCCGCAGCCG ACTCAGGGGG CGCGGCAATC TATGCGACTG GACTGGACCC GGCGACGATC 
CTGGCGCTCA AACAGCGTGG TCAGAGCATT GCGGCGCTGC CGGAAAGCGG CATCTTCGGA 
ATTGCTCCTG TTGAAGTCAT TCAGCGCATC GAAGCGGACA TCCTCCTCGA AGCGACGCCG 
GTCAATTTGA AAACAGGGCA ACCGGGTCTT GATACCGTGC GCGCAGCGTT GCGGCGCGGT 
ATGCACGCAG TGCTGGCAAA TAAAGGACCG CTGGCGCTCG CATATACAGA ACTGGCTGAC 
CTCAGCGATA TGGGAGAGGC CACTGAGGAA CGCGGCGATC CGCGCGACTG GCCCGCGCTG 
CGCTTCAGCG CCTGCGTCGG CGGCGCGTTG CCGACCATTG CAATTGGGCG ACGCGACCTG 
GCAGGCGCGA CGATTGTGCG CGTCGAGGCG GTGCTCAACG GCACAACGCA GGGCATCCTG 
CGCGCGATGG AACAGGGGAG TTCATATGCT GACGCACTGG CGGAGATGCA ACGACGCGGA 
CTGGCGGAGA CCGACCCTTC CCTCGATGTC GAAGGTTGGG ATGCCGCTAG TAAACTGACT 
ATTCTTGCCA ATGCGGTGTT GCGCCAACCC ACAACGCTGG CTGATGTCGC CGTGCGCGGC 
ATTACGGACC TGACCACCGG AGACCTGCGC GCCGCACTGG ATCGCGGCGA ACGTATTGTG 
CTCCTCTGCC TGGCGGAGCG TCGAGGCGGC GACTTCCACC TGAGCGTTCA ACCAACATCA 
TTGCCGCTGA TCCATCCATT GGCGCGGATG AGCGCCGATG AGATGGGCGT AGTCTACTAC 
ACCGACATCA CCGGCAGACA GACTGCGACA ACGCTGGAAA CCGATCCGAC TCCGACTGCC 
GCAGCCATGC TGCGCGACAT TCTTGATATT GCTGCGCGTT GA

Protein sequence

MRTYRLFLSG LGNVGRSFLA IMQSQASLLA RRYGVALRLV AAADSGGAAI YATGLDPATI 
LALKQRGQSI AALPESGIFG IAPVEVIQRI EADILLEATP VNLKTGQPGL DTVRAALRRG 
MHAVLANKGP LALAYTELAD LSDMGEATEE RGDPRDWPAL RFSACVGGAL PTIAIGRRDL 
AGATIVRVEA VLNGTTQGIL RAMEQGSSYA DALAEMQRRG LAETDPSLDV EGWDAASKLT 
ILANAVLRQP TTLADVAVRG ITDLTTGDLR AALDRGERIV LLCLAERRGG DFHLSVQPTS 
LPLIHPLARM SADEMGVVYY TDITGRQTAT TLETDPTPTA AAMLRDILDI AAR