Gene Rcas_2086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2086
Symbol
ID	5539566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2678796
End bp	2679863
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	63%
IMG OID	640894221
Product	homoserine dehydrogenase
Protein accession	YP_001432190
Protein GI	156742061
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCTG GAGTTTCGAC CTACCGCCTT GCCCTGGTGG GATTTGGCAG CGTCGGGCGC 
GGTCTCGCCG AGATCCTGTC GTTGCACCAC CGGCGTTTCG TTGATCGCTA CGGGGCCGAT 
ATACGCATCG TCGCCGCCTG CACCCGGCGC TGGTGCGTGT ACGACCCGAA CGGAATCGAC 
GCCGCAGCGT TGTTGCGCGC TGCATCACCG GACGCAATCA GGGCATTGCC GGGTGCGTGC 
GCCTGGAAGA CGGATCAGAT GATCGCTTCA GTAGACGCCG ACGTGCTGGT GGAAGCATCG 
CCGACCGATA TGACAACCGG CGAACCGGCG ACGACATATG TCCGTTCGGC AATTGGACGA 
GGGATGCACG TCATCACCGC TAACAAGGGA CCAATTGCGC TCCACTTCGC CGAACTGCGC 
CGCCTTGCGG AAGAACGCGG CGTGATGCTC GGCTTCGAAG CTACGGTGAT GGCGGGAACG 
CCAGCGTTGC GCCTGGGATG GAGCGACCTG GCAGGGTGCG ACATCCAGGA AGTGCGCGGG 
ATTGTGAACG GCACAACCAA TTTCATTTTG ACCAGAATGG AGCGCGGCAT GGACTATGCC 
AGCGCCCTGG CGGAAGCGCA GCGTCTGGGA TATGCCGAGG CGGACCCGAC CAGTGATGTG 
GAGGGACACG ATGCTGCGTG CAAAGCCGCT ATCCTGGCGA ACGTCCTGAT GGACGCGCGC 
CTGACCCCAG CGGATGTCGA GCGTGAAGGG ATTACCGGCA TCACCCGCGA GATGGTTGCC 
GCCGCCGCCG CGACCGGCGA ACGCTGGAAA CTGATTGCGC GGGTCTGGCG CGACGGTTCG 
ACCACGCGAG CAGCGGTGCG CCCAATGCGG TTGATGGTCG AACATCCGCT GGCCGGCATC 
GATGGTGCGA CCAACGCCTT GACGCTTTCC ACCGATCTTC TCGGCAATGT AACGATTATC 
GGCCCGGGAG CAGGCGGGGT CGCCACAGGC TTTGCGATTC TCTCCGATCT GCTGGCGTTG 
CATCGGGTTC GGAGAACTGA GAACCAAGAA CCGAGAACCG AGAACTGA

Protein sequence

MTPGVSTYRL ALVGFGSVGR GLAEILSLHH RRFVDRYGAD IRIVAACTRR WCVYDPNGID 
AAALLRAASP DAIRALPGAC AWKTDQMIAS VDADVLVEAS PTDMTTGEPA TTYVRSAIGR 
GMHVITANKG PIALHFAELR RLAEERGVML GFEATVMAGT PALRLGWSDL AGCDIQEVRG 
IVNGTTNFIL TRMERGMDYA SALAEAQRLG YAEADPTSDV EGHDAACKAA ILANVLMDAR 
LTPADVEREG ITGITREMVA AAAATGERWK LIARVWRDGS TTRAAVRPMR LMVEHPLAGI 
DGATNALTLS TDLLGNVTII GPGAGGVATG FAILSDLLAL HRVRRTENQE PRTEN