Gene RoseRS_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1971
Symbol
ID	5208933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	2452253
End bp	2453314
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	64%
IMG OID	640595579
Product	homoserine dehydrogenase
Protein accession	YP_001276308
Protein GI	148656103
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0199939
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.403666
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACCT ATCGCATCGT TCTCAGCGGT CTGGGTCATG TGGGCCGCAG TTTTCTCGCC 
ATCATGCAAT CGCAGGCGTC GCTTCTCGCC ACGCGCTACG GTGTTGCGCT TCGCCTGGTT 
GCAGCCGCCG ACTCGGGAGG CGCAGCAATT GACGATTCTG GGTTGGACCC GGCATCGATC 
CTGGCGCTCA AACAGCGACA GCAGAGCGTG GCAGCGCTCC CTCTCCACGG CATCCCTGGT 
ATGACCCCCG TCGATGTCGT CCGCAGCATC GAGGCGGACA TTCTGCTCGA AGCGACACCC 
GTCAACCTGA AGCACGGTCA ACCGGGTCTT GACACAGTGC GCACGGCATT GCGACGCGGG 
ATGCACACGG TGCTGGCAAA CAAAGGACCG CTGGCGCTGG CGTATGCGGA GCTGGCTGCG 
CTCAGCGATA TGGGCGAGGT CTCTGAGGAG CGCGGCGACC CGCGCGACTG GCCCGCACTG 
CGTTTCAGCG CATGCGTTGG CGGCGCACTA CCAACCATCG CCATTGGACG ACGCGATCTC 
GCCGGTGCGC GCATCCTGCG GGTCGAGGCA GTGCTGAACG GAACCACCCA GGGCATTCTC 
CGGGCGATGG AACAGGGCGT CTCTTACGCT GACGCACTGG CGGAGATGCA GCGGCGCGGT 
CTGGCAGAAA CCGATCCGTC GCTCGATGTC GAGGGGTGGG ATGCCGCCAG CAAACTGACC 
ATCGTTGCCA ACGCGGTGCT GCACCGCCCA ACGACGCTCG CCGATGTAGC GGTGCGTGGT 
ATCACCGGAT TGACGACCGA CGACCTGCGA GCGGCGCTCG AACGCGGCGA GCGGATCGTT 
CTGCTCTGCC TGGCGGAACG GCAGGCAGAG GATTTCCATC TCAGTGTCCA ACCGACGCCG 
CTGCCCCTCT CCCATCCTCT GGCGCGTATG AGCGCCGACG AAATGGGGGT TGTCTACACG 
ACCGACATTG CTGGCAGACA AACCGCCACG ACGCTTGAAA CCGATCCGAC GCCAACCGCC 
GCAGCAATGC TGCGCGATAT CCTCGACATT GCAGCGTGTT GA

Protein sequence

MRTYRIVLSG LGHVGRSFLA IMQSQASLLA TRYGVALRLV AAADSGGAAI DDSGLDPASI 
LALKQRQQSV AALPLHGIPG MTPVDVVRSI EADILLEATP VNLKHGQPGL DTVRTALRRG 
MHTVLANKGP LALAYAELAA LSDMGEVSEE RGDPRDWPAL RFSACVGGAL PTIAIGRRDL 
AGARILRVEA VLNGTTQGIL RAMEQGVSYA DALAEMQRRG LAETDPSLDV EGWDAASKLT 
IVANAVLHRP TTLADVAVRG ITGLTTDDLR AALERGERIV LLCLAERQAE DFHLSVQPTP 
LPLSHPLARM SADEMGVVYT TDIAGRQTAT TLETDPTPTA AAMLRDILDI AAC