Gene Rxyl_2038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_2038
Symbol
ID	4115848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	2063981
End bp	2065234
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	59%
IMG OID	638036825
Product	lycopene beta and epsilon cyclase
Protein accession	YP_644795
Protein GI	108804858
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCTGAGG CCAACGACAG CGGAGTAGCG GTGAAACAAC ATGCCGGGCG AGCCTCCGAG 
GGGCTCGCCC GGGTTCTATC TTCGCGCAGA GAACCGCGGA TAGCGCTCGT AGGGGCCGGG 
CTCGCCGGAA GCAGCCTGGC TCTCGCGCTT CTCTGGAGAG GTTTCCGCGG CCAGGTCACC 
CTATTCGACA GCAGGACAGA TTTTTCCCGA GAGCAGCGCT GGTGCAGCTG GGGTCCCCTG 
CCGGAGCCGC TGTCTGACCT AACAGATGCC TCATGGCCTG CGTGGAAGGT CATCTGCGGG 
AGTAAGAGGG TCTTGTGCCG GCTCCCCGAG CGTCCTTACC TCCATCTCTA CGCGCCGAGG 
TTTTTCAACT ACGCGCACCA GCAGCTGGAG AAAGCGCCGG GCTTTGCACT GAACCTCGGC 
GTCGCGGTGC ACATCATAGA GGAGAAAAGA GATCGAGTAA GGTTGCAAAC CGACGCAGGC 
GAGCTGGAAG CGGACTTTGT CTTTGACAGC AGACCAACCG GACAGGCAGG TGGTTCCCCA 
CCACACCCCT CTGACCAGGC AATCCTCTAC CAGTCATTCC GCGGCTGGGT TTTAGAGCTC 
GGTCAGAGAT GTCTTGAAAC AGGCGCCCTG ACCCTTATGG ACTTCAATAC GACTCAGGGA 
AACGGCATAT CTTTCATTTA CGTCCTACCC TTCTCGGCCG ACCGGGCGCT CGTGGAGAGC 
ACATCGCTCT CGCAGCAACC CGATAGCAAA GAAGAGCACG TTGCGAGGAT CAGGGATTAT 
TTGGAGCGGC TCGGAGTCCG CGAATACCTC GTCAGCGCCG AGGAGTGGGG CCTACTTCCG 
ATGACGACTA CGAGCTTACC GAACAGGCCG GGAAGGAAGT GGGTCAGGAT AGGGCAAGCC 
GGCGGTGCCC TGCGCCCCTC AAGCGGCTAC ACCCTCGTCA ATGCGCTGCG CCAGAGCCAG 
GCCATAGCAG ACGCTCTGAT AGAGGGCAGA GCGCCGCGGT CGCGACCCAT ATCTCGCAAG 
TACATGATCT TCGACGATAT ATTTCTGGAA GTCCTGCGCA CCTCGCCTGA GTTGGTCAGA 
GAGGGCTTGG TGAATATGTT CGAGCGCATT AGAGAGGACG CTGTCGTACG GTTTTTATCG 
AGCGAGAGCA GCTTTGCAGA CGATGCAAGG CTCGTTGCAG CGCTCCCAAA GACGCCCTTC 
GCTCGCGCTG CGCTGCGAAG GTTTAAAACT TATGTTACCC CGCTCATACG GTAA

Protein sequence

MPEANDSGVA VKQHAGRASE GLARVLSSRR EPRIALVGAG LAGSSLALAL LWRGFRGQVT 
LFDSRTDFSR EQRWCSWGPL PEPLSDLTDA SWPAWKVICG SKRVLCRLPE RPYLHLYAPR 
FFNYAHQQLE KAPGFALNLG VAVHIIEEKR DRVRLQTDAG ELEADFVFDS RPTGQAGGSP 
PHPSDQAILY QSFRGWVLEL GQRCLETGAL TLMDFNTTQG NGISFIYVLP FSADRALVES 
TSLSQQPDSK EEHVARIRDY LERLGVREYL VSAEEWGLLP MTTTSLPNRP GRKWVRIGQA 
GGALRPSSGY TLVNALRQSQ AIADALIEGR APRSRPISRK YMIFDDIFLE VLRTSPELVR 
EGLVNMFERI REDAVVRFLS SESSFADDAR LVAALPKTPF ARAALRRFKT YVTPLIR