Gene Ndas_3568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3568
Symbol
ID	9247437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4279126
End bp	4280358
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	76%
IMG OID
Product	Lycopene beta and epsilon cyclase
Protein accession	YP_003681475
Protein GI	297562501
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.579585
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACT ACGACGTGGC GATCATCGGC GGGGGAGCCG CTGGGCTCAC CCTGACCCAC 
CAGCTTCGCG GGGTCAATGA CCGACGTGGC CGACCGCTGC GGGTCGCCCT GGTGGAACCG 
CCCCCCGGGC CGCACACCCC TCCGCCCCGC ACCTGGTGCT TCTGGGAGCC CGACGGCGGG 
CCGTGGGACC ACCTGCTGGC CGCCCGCTGG AGGGACCTGT CCGTGGTGGG GCCGGACGGG 
GCCGTCCACG ACTCCCCGGC GGCGCCCTAC GTGTACAAGA TGCTGCGGTC GGCCGACGTG 
GACGCGCATG TGCGCGCTTC GGCCGGTGAA CACGTGGACC AGCTTCCGGT GCTGGTCACC 
GAGGTCGTCG ACGGCGTCGA GCACGCCGTG GTACGGGGCA CCTGCCCCGG AGGCCCCGGG 
GGAGGGGAGC GGGAGCTGAC CGCCTCATGG GTGTTCGACT CGCGTCCGCC CCGGCCCGCC 
CCGCGCGGGC GCACGCACCT GCTCCAGCAC TTCCGCGGCT GGTTCGTGCG CACGCCCGAC 
GACGCCTTCG ACCCCGCCTC GGCCGTGCTC ATGGACCTGC GCCCTCCCCA GCCGGCCAAC 
GGCGTGGCCT TCGGCTACGT GCTGCCGCTG TCGCCGCGCG AGGCGCTGGT GGAGTACACC 
GAGTTCGGGC GCGAGGCGCT CACGACCCCC GAGTACGAGC GCGCGCTCGA GGACTACTGC 
GGCCTGCTCG GGCTGGGGGA CGTGGAGGTG ACCGCGGCCG AGCAGGGCGT CATCCCGATG 
ACCGACGCGC GGTTCCGCCC CCGCGCGGGG CGGCGCGTGT TCCGGGTGGG GACGGCGGGC 
GGCGCCACCC GGCCCTCGAC CGGGTACACG TTCAGCGGTG TGCGGCGCCA GACGGCCGCC 
GTGGCGCGGG CGCTGGCCCA GGGGCGGGCC CCGGTACCGC CGGTGCCCCA CCGCCGCCGC 
CACCTGGCGA TGGACGCGGT CATGCTGCGG GCCCTGGACA CGGGGCGGGT GCGGGGAGCG 
GAGTTCTTCG CCGGGCTGTT CGCGGCCAAC CGCCTCGGGG ACGTGCTGGC CTTCCTGGAC 
GGTGGCTCGC GCCTGCCCCG GGAACTGGCG ATGGGCCTGA GCACACCGGT CGCGGCCATG 
TCGCTGACCA GCCTGGACCA GGCGTGGTAC GCGCTGCGCG GGGTCGGTGC GAGGAGCCTC 
AGCCGGGGGC CAGGGCCCGC ACGGCGTCGG TGA

Protein sequence

MADYDVAIIG GGAAGLTLTH QLRGVNDRRG RPLRVALVEP PPGPHTPPPR TWCFWEPDGG 
PWDHLLAARW RDLSVVGPDG AVHDSPAAPY VYKMLRSADV DAHVRASAGE HVDQLPVLVT 
EVVDGVEHAV VRGTCPGGPG GGERELTASW VFDSRPPRPA PRGRTHLLQH FRGWFVRTPD 
DAFDPASAVL MDLRPPQPAN GVAFGYVLPL SPREALVEYT EFGREALTTP EYERALEDYC 
GLLGLGDVEV TAAEQGVIPM TDARFRPRAG RRVFRVGTAG GATRPSTGYT FSGVRRQTAA 
VARALAQGRA PVPPVPHRRR HLAMDAVMLR ALDTGRVRGA EFFAGLFAAN RLGDVLAFLD 
GGSRLPRELA MGLSTPVAAM SLTSLDQAWY ALRGVGARSL SRGPGPARRR