Gene RoseRS_4454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4454
Symbol
ID	5211439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5584654
End bp	5585691
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	65%
IMG OID	640598033
Product	alcohol dehydrogenase
Protein accession	YP_001278736
Protein GI	148658531
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.321717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACAT CCACGATGGA CGCGCTGGTC TGGCTCGGAC CGCGCAGGAT GGAACTGCGT 
CGCGAGCCTG CGCCAACGCC GGAACCGGGT GAGGTGCTCG TGGCAGTGGA AGCGGTTGGC 
ATTTGCGGGT CGGAACTGAG CGGGTACCTT GGCCAGAATA GTTTGCGAAA ACCACCGCTG 
ATCATGGGGC ACGAAGCGGC GGGGCGAATC GCCTTCGACA GTGATGCCGC GCTGAGCGAC 
GGGTCGCCAG CGCGCGCTGG CGTGCGCGTA ACCTTCAACC CGTTGCTGAC GTGCGGCGCA 
TGTGATCGTT GCCGGGCGGG AAAGAGCAAC CTGTGCCGCA ACCGACAACT GATCAGCGCC 
CATCGCCCGG GCGCATTCGC CACCTACGTG GCAGTGCCAG CAGATCTCTG CATCCCTCTG 
CCCGATCACG TGTCGCTGAC GCTGGGATCG CTCACCGAAC CGCTGGCGTG CAGTGTCCGC 
GCTGTAGCGC ACACCGGAAC GCCGGAGCGC CTGGCTATTC TTGGCGCCGG TCCGATCGGG 
CTACTTTGCC TGGTTGCTGC GCGTGCCGCG GGGATCGAAC ACATCCTGAT GAGCGACGTC 
TCCGATCGGC GACTGGCAGT GGCGCGCGCC TGGGGTGCAA CTGTAACCAT CAATGCACGT 
CATAACGTCC TCAATGCAGT GCAGGCATTC GCTCCCGGCG GCGTCGATGC CGTCATCGAC 
GCAGTGGGTC TCACCGTCAC CCGCGATCAG GCAGTGCGCG CCGTCACCCC TGGCGGACGT 
GTTGTTTTCA TCGGGCTCCA CGAAGAAGAG TCGATGCTTC CTGCCAACTA CATTGTGCGC 
CAGGAAATCA CCGTGACCGG CAGTTTCACC TACAGCGACG CCGATTTTGC GCGCGCGCTC 
GCGCTGCTGG CAGAAGGGCG CGTTTCGCTC GACGGCGACT GGCTCGAAGA ACGACCACTG 
GCGGCAGGAC CGGCAGCGTT CGAGGAATTG CTGGCAGGCG CAACACGCGC AGCGAAGATC 
GTGCTGCGCG TCGCGTGA

Protein sequence

MMTSTMDALV WLGPRRMELR REPAPTPEPG EVLVAVEAVG ICGSELSGYL GQNSLRKPPL 
IMGHEAAGRI AFDSDAALSD GSPARAGVRV TFNPLLTCGA CDRCRAGKSN LCRNRQLISA 
HRPGAFATYV AVPADLCIPL PDHVSLTLGS LTEPLACSVR AVAHTGTPER LAILGAGPIG 
LLCLVAARAA GIEHILMSDV SDRRLAVARA WGATVTINAR HNVLNAVQAF APGGVDAVID 
AVGLTVTRDQ AVRAVTPGGR VVFIGLHEEE SMLPANYIVR QEITVTGSFT YSDADFARAL 
ALLAEGRVSL DGDWLEERPL AAGPAAFEEL LAGATRAAKI VLRVA