Gene RoseRS_2643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2643
Symbol
ID	5209612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	3278938
End bp	3280179
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	64%
IMG OID	640596245
Product	lycopene cyclase family protein
Protein accession	YP_001276967
Protein GI	148656762
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATGC ATGATGTTCT CGTCGTCGGC GCCGGTCCGA CCGGCATGGC AATCGCTGCT 
GCGCTCAGCG CCACAGGACT GCGCGTGGCG GGGCTTGCGG CGGCGCCGCC GACGAAACCA 
TGGCAGAATA CCTACGGCGT GTGGCTCGAT GAATTGCCGA CGCCGGAATT GCGCGACACG 
CTGGGGCATC GCTGGTCGGA TGTTGTGGTG TGCGTCGGCG AGCGCACCAT TGCCCTTGAT 
CGTGCGTATG GGTTGTTCGA CAACCCGCGC TTGCAGCAGT ACCTCCTCGA CCAATGCGAG 
CGCCACGGTG TCACGTGGTC TGCCGGGATT GCGGCGCGCG TCGAGCATCA GGCGACGCAT 
TCCCTGGTGA CCACGCGTGA TGGGCGTGTT GTTGCGGCAC GGTTGGTGGT GGATGCCAGC 
GGTCATTCAC CGGCGCTGCT GCGTCGCCCT GCAACATCGC ACGTGGCGCG TCAGGCGGCG 
TATGGCATCG TCGGTGTCTT CTCCGCCCCG CCGATTCAGC CGAATCGAAT GGTGCTGATG 
GACTACCGCG CTGATCATCT GACCGCTGAG GAACGGCGTG AGCCGCCAAC CTTTTTGTAC 
GCCATGGATC TGGGGGACGG ACAATTTTTT GTTGAGGAAA CGTCGCTGGC GCATGTGCCC 
GGCTTACCGC TCACCACGCT CGAACAACGG TTGCAGCGCC GGTTGACCGC CAGAGGTGTG 
ACGGTGCAGC AGGTTGTGCA TATCGAGCGG TGTCTGTTCC CGATGAATAA TCCGTTACCG 
TACCTCGATC AGCCGATGAT CGGGTTTGGC GGTGCAGCGA GTATGGTGCA TCCCCCGTCG 
GGGTATATGG TCGGCAAGGC GCTGCGCCGT GCCCCTGAGG TTGCGCAGGC GATTGCTCGC 
GCATTAGGCG CAGCGGACGC TACCCCGCGC AGCGCTGCCC GTGCCGGATG GCGGGCGCTC 
TGGTCACCGG CGCGCCTGCG TCGCAGGCAG TTGTACCTGT TCGGGCTGGC GAGCCTGATG 
CGCTGCGACA GCGCAACAAT CCAGGAATTT TTCGCTCTTT TTTTCAGTCT GCCGCGTCAC 
GAATGGATGG GGTATCTATC GGACACGTTG AGCACTGTCG AGTTAGCGCG CACGATGCTG 
CGTCTGTTCA TCCGCGCGCC CGGAAATGTG CGCCGAACCC TGATGGCGGC TGCGGGCGCA 
GAACATGCGC TGCTGCGCCG TGCGGCACTT GGTCAGGCTT GA

Protein sequence

MTMHDVLVVG AGPTGMAIAA ALSATGLRVA GLAAAPPTKP WQNTYGVWLD ELPTPELRDT 
LGHRWSDVVV CVGERTIALD RAYGLFDNPR LQQYLLDQCE RHGVTWSAGI AARVEHQATH 
SLVTTRDGRV VAARLVVDAS GHSPALLRRP ATSHVARQAA YGIVGVFSAP PIQPNRMVLM 
DYRADHLTAE ERREPPTFLY AMDLGDGQFF VEETSLAHVP GLPLTTLEQR LQRRLTARGV 
TVQQVVHIER CLFPMNNPLP YLDQPMIGFG GAASMVHPPS GYMVGKALRR APEVAQAIAR 
ALGAADATPR SAARAGWRAL WSPARLRRRQ LYLFGLASLM RCDSATIQEF FALFFSLPRH 
EWMGYLSDTL STVELARTML RLFIRAPGNV RRTLMAAAGA EHALLRRAAL GQA