Gene Saro_1817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1817
Symbol
ID	3918376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1916198
End bp	1917394
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	68%
IMG OID	640444558
Product	lycopene cyclase
Protein accession	YP_497091
Protein GI	87199834
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR01789] lycopene cyclase [TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCGA GACGCTGCGA CATTGCGATC CTTGGCGGAG GGCTTGCGGG CGGCCTCGTG 
GCTCTCGCCC TGCGCCGTGC ACGTCCCGAC CTCTCGCTGC TGCTGGTCGA GCAGGGCGAG 
CGGCTCGGCG GCAATCACGT GTGGTCGTTC TTCGGCAGCG ACGTGGGCAA CGAAGGCCGC 
GCCTTGCTCG ACGGCATGTT TGTCGCCGCA TGGCCCGAAT ATACCGTCCA CTTCCCCGCT 
TTCCGCCGAC GGCTGAAGAC GAGCTATTAT TCGATCACAT CGAGACGCTT TGACGCGGTG 
CTTCGGGCCG CGCTCGGGCA GGACTCATTG ATCACCGGGG TCCGCGCGCT CGCGTGCAGC 
GCCACCAAGG TGACGCTTTC GGAAGGCACC CGCATCGAGG CGGGCGCCGT TATCGACGCG 
CGGGGCTTGC GCAACCTCCA GCACCTCACC GGCGGATGGC AGAAGTTCGT CGGCCGCCGG 
CTCCGGCTCG CGCAGCCGCA CAGTCTCGAC GCGCCGATCG TCAAGGATGC TTCCGTCGAA 
CAGATCGACG GCTACCGCTT CGTCTATTGC CTGCCCTTTG CCGCCGACGA GATCTTCGTC 
GAGGACACCT ATTACTCCGA CAGCCCCGCG CTCGACGTGG CGGTGCTGGG CGAGAGGATC 
GACGCCTATG TCGCGGCGCG CGGGTGGCAG GTGGCCGAGG TCCTTGGCGA GGAGCATGGC 
GTGCTTCCGG TGGTAGCGGG CGGAAACTTC GACGCCTTCT GGCGGTCGAG CGGAGGCGCG 
GTCGCCCGCG CCGGTGTTCG CGCCGGCCTG TTCCAGGCGG TCACCAGCTA TTCGCTGCCC 
GATGCCGTGC GCTTTGCCCT GGCCCTCGCC CGGCAACCGG ACCTCGGCGG CGAGGCTCTG 
GCCGCGTTCA GCGAAGCCTA CGCGCGCCGG CACTGGAAGC GCTCGGCGTT CCACCGCGCA 
CTTTCCGCCA TGCTGTTCGC GGCGGCCCGG CCCGAGCATC GCTACCGCGT GCTCGAACGC 
TTCTACCGCC TGGACCGCCG CCTTATCGAG CGTTTCTATG CCGGTCGGAC GACCCTTCTC 
GACAAGGCGC GCATTCTTTC GGGCAAGCCG CCGGTACCGG TAACCAAGGC CATCGGCGTG 
CTCACCGGCC TTGGCGCGCG CCCCAACCCA CTTTCATTTG CAGGAACCCG CGCATGA

Protein sequence

MTARRCDIAI LGGGLAGGLV ALALRRARPD LSLLLVEQGE RLGGNHVWSF FGSDVGNEGR 
ALLDGMFVAA WPEYTVHFPA FRRRLKTSYY SITSRRFDAV LRAALGQDSL ITGVRALACS 
ATKVTLSEGT RIEAGAVIDA RGLRNLQHLT GGWQKFVGRR LRLAQPHSLD APIVKDASVE 
QIDGYRFVYC LPFAADEIFV EDTYYSDSPA LDVAVLGERI DAYVAARGWQ VAEVLGEEHG 
VLPVVAGGNF DAFWRSSGGA VARAGVRAGL FQAVTSYSLP DAVRFALALA RQPDLGGEAL 
AAFSEAYARR HWKRSAFHRA LSAMLFAAAR PEHRYRVLER FYRLDRRLIE RFYAGRTTLL 
DKARILSGKP PVPVTKAIGV LTGLGARPNP LSFAGTRA