Gene RoseRS_4100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4100
Symbol
ID	5211083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	5139872
End bp	5140849
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	60%
IMG OID	640597688
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001278394
Protein GI	148658189
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAGC GCAGCATTCT GATCACTGGC GGCGCAGGGT TCATCGGTTC GCACCTGGCG 
GATGCCCTGA TCGAGCGCGG CGACCGGGTG GCGATCATCG ATGATCTCTC CACCGGCGCG 
GTTGCGAATA TTCGCCACCT CAAAGGACAT CCGAACTTCA GTTATACGCT CGATACCATC 
GCCAATGAAG CGGTGCTGGC GGAACTGATC GACGAGAGTG ATGCGGTGGT GCATCTGGCG 
GCGGCGGTCG GCGTGCAACT GATTGTGCAA AGCCCCGTGC GCACCATCGA AACCAATGTC 
AACGGCACTG AACTGGTGTT GCGCTGGGCG GCGAAGAAGG GAAAGACTGT GTTGATTGCC 
AGCACGTCCG AGGTGTACGG CAAAAGTGAG CGCGCCCCCT TCCGCGAAGA CGATGACCTG 
GTGCTTGGTC CTTCCACAAT AAACCGCTGG AGTTATGCCT GCTCCAAACT GCTCGATGAG 
TTTCTGGCGC TGGCGTACCA CAAAGAGCGC GACCTGCCTG TGATCATTGC GCGCCTGTTC 
AACACGGTCG GTCCGCGTCA GACGGGGCGC TACGGGATGG TCGTGCCGCG CTTTGTTCGG 
GCTGCACTCC GTAATGTGCC GTTGCGTGTG TATGGCGATG GGCAGCAAAC GCGCTGCTTC 
TGCTACGTCG GCGATACAGT GCGCGCATTG ATCGCCCTGC TCGACCATCC AGACGCGGTT 
GGGAAGGTTT TCAACGTTGG CAATCCGCAG GAAGTGAGCA TTCTCGAACT GGCGCAGCGT 
GTGGTGCGCC TGGCGCAGAG TTCATCACCG ATCGTGCTGG TGCCCTACGA GCATGCCTAC 
GAAGCCGGGT TTGAAGATAT GCGCCGGCGC GTGCCGGATA TTTCGCGTCT CACAGCGCTG 
ACCGGCTTCC GCCCGACGCT CGATCTCGAT GATATTATCC GCACGGTCAT CGAGTACGAA 
CAGGCGCACG GCGCGTGA

Protein sequence

MAQRSILITG GAGFIGSHLA DALIERGDRV AIIDDLSTGA VANIRHLKGH PNFSYTLDTI 
ANEAVLAELI DESDAVVHLA AAVGVQLIVQ SPVRTIETNV NGTELVLRWA AKKGKTVLIA 
STSEVYGKSE RAPFREDDDL VLGPSTINRW SYACSKLLDE FLALAYHKER DLPVIIARLF 
NTVGPRQTGR YGMVVPRFVR AALRNVPLRV YGDGQQTRCF CYVGDTVRAL IALLDHPDAV 
GKVFNVGNPQ EVSILELAQR VVRLAQSSSP IVLVPYEHAY EAGFEDMRRR VPDISRLTAL 
TGFRPTLDLD DIIRTVIEYE QAHGA