Gene Rcas_0045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0045
Symbol
ID	5537503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	59089
End bp	60288
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	60%
IMG OID	640892210
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001430201
Protein GI	156740072
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.55488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTC TCGTCCTTGG CGGCGACGGC TACCTGGGCT GGCCGACCGC ATTGCACCTC 
TCGCAGCGCG GCCACGAGGT GGCTGTCCTC GACAACTTCT CACGGCGACT CTGGGATCAC 
GAACTCGGCG CTGAAAGCCT GACCCCTATT GAAACGCTGC AACAGCGCGT CGCAGTCTGG 
CGTCAGATCA CCGGTAAGAT CATTACCCCG TTCATTGGCG ATCTGTGCGA TTACACGTTC 
CTGGAACCGG TGATCCGCGA TTTCCAACCG GAGGCGGTTG TCCATTTCGG TGAGCAGCGG 
AGCGCCCCCT ACTCGATGAT CGACCGCCAG CACGCTGTGT TCACCCACGT CAACAATGTC 
GTCGGCACGC TGAACCTGCT CTACGCGCTC GCCGACCATG CGCCGGATTG CCATCTGGTC 
AAACTGGGAA CAATGGGAGA GTATGGCACT CCGAATATCG ACATTGAAGA GGGGTACATC 
ACCATCACAC ACAAGGGACG CACCGATACC CTCCCCTACC CCAAACAACC CGGCAGCTGG 
TACCACGCGA CCAAAGTCCA CGATAGCACC AACATCCTGT TTGCCTGCCG CATTTGGGGA 
TTGCGCGCAA CCGACCTGAA TCAGGGGGTC GTCTACGGTG TGGAAACGCC AGAAACAACC 
ATGGACCCGC GACTGGCAAC GCGCTTCGAC TACGATGGCG TTTTCGGAAC GGCGCTCAAT 
CGCTTCCTGG TGCAGGCGGT CGTCGGCCTG CCACTGACGG TCTATGGAAA AGGCGGGCAG 
ACGCGCGGCT TCCTCGATAT TCGCGACACG CTGGCGTGTG TCGAGATTGC CATCCTCAAC 
CCGGCGCCAC GCGGTGAACT GCGCGTGTTC AATCAGTTCA CCGAGCAGTT CAACGTCGCC 
GGTCTCGCCG AAGCGGTGCG CGAAGCGGCA CAGGAGTTCG GTCTCGATGT CGCCATTCAC 
CACCTGCCCA ATCCACGCGT TGAGAAAGAA GAACATTACT ACAATGCCGC AAATACGCGC 
CTGCTTGATC TGGGGCTAAA GCCACATTAC CTGAGTGAGA CGCTGCTCGA ATCGGTGATG 
CGCGTGGTGA TGCATCACCG TGATCGGGTG CGGCCCGAAT TGATCATGCC CGCCGTCAAC 
TGGCGCCGCA CGCACAATCC GGTTCTGCCA ACCGAGGAAC CGGTCATTCA GCAGCCCTAA

Protein sequence

MRILVLGGDG YLGWPTALHL SQRGHEVAVL DNFSRRLWDH ELGAESLTPI ETLQQRVAVW 
RQITGKIITP FIGDLCDYTF LEPVIRDFQP EAVVHFGEQR SAPYSMIDRQ HAVFTHVNNV 
VGTLNLLYAL ADHAPDCHLV KLGTMGEYGT PNIDIEEGYI TITHKGRTDT LPYPKQPGSW 
YHATKVHDST NILFACRIWG LRATDLNQGV VYGVETPETT MDPRLATRFD YDGVFGTALN 
RFLVQAVVGL PLTVYGKGGQ TRGFLDIRDT LACVEIAILN PAPRGELRVF NQFTEQFNVA 
GLAEAVREAA QEFGLDVAIH HLPNPRVEKE EHYYNAANTR LLDLGLKPHY LSETLLESVM 
RVVMHHRDRV RPELIMPAVN WRRTHNPVLP TEEPVIQQP