Gene Ndas_4506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4506
Symbol
ID	9248386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5342165
End bp	5343259
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID
Product	Luciferase-like, subgroup
Protein accession	YP_003682400
Protein GI	297563426
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCAG AAGGCGGGCC ACAGGCCGCC GAAACCGAGT ACGGCATCTT CCTGCCCATC 
GGCAACGGGG GGTGGATCGT CTCGGAGACC GCACCGCACC CCGAGGCGAC GTACGAGTAC 
AACAAGAAGG CCGCGGTCCT CGCCGACGCC TACGGACTCG ACTTCGTCAT GTCCATGGGC 
AAGTGGCGCG GCTACGACGG CGCGACCGAC CACTGGGGGC GCACCCTGGA GTCGATCACG 
ATGATGTCGG GACTCGCGGA GGCCACCGAG CACGTCAAGG TGTGGGCGAC CGTCCACACG 
AACCTGTTCC ACCCGGCCCT CGCCGCCAAG ATGTACACCA CCCTCCAGGA CATCAGCGGC 
GGACGCGCCG GGATGAACAT CGTGGTGGGC TCCTACGTGG ACGAGTTCGC CCAGATGGGC 
CTGTGGCGCG AGGACATCGG CCACGGTGAC CGCTACCGGT ACACCGAGGA GTGGACCAGC 
GTCCTCAAGC GGTTGTGGAC CGAGGACTCG GTCACCCACG ACGGCGAGTT CTTCAAGCTC 
GACGACTGCC GCTCGCGGCC GCACCCCGCT CCGGCGCCGA CCCTGATCAG CGCGGGCCGC 
TCCGACACGG GCCTGAACTT CCAGGCGCGC CACTGCGACG GCTCGTTCCT GACCGCGGAG 
GACCTGCCCG GCCTGCGCGA CGCCAGCCGC GACGTCAAGG AGCGCGCCCA GAAGGAGGGG 
CGCAGCATCA AGACGTACTC GATGCTGACC GTCGTCATGG ACGACACCGA CGCCGCGGCC 
GAGGAGCGGC GGCTGGAGTA CGGGCGCGGC GCGGACATCG ACGCGCTGGT CAACATGAAG 
CGGTCCTGGG GCCTGCCCCT GGACAAGGCC CTGTCGCTGA CCTCCGAGCG GCCCGAGGAC 
GAGGCGTTCC AGACGCCGTT CGTGACCGGG TCCTCCGAGA CGGTGGCCGG ACGCATCCGC 
GAGATCGTGG AGTACGCCGA GCTCGACGGT CTGATGCTGA TCTTCCCGGA CTACCACGCC 
GACCTCGCGG CGTTCGGTGA GAAGGTCATG CCGCTGCTGC GCCCCGCCGG GGGAACGGCC 
GCGGAACAGG GCTGA

Protein sequence

MAAEGGPQAA ETEYGIFLPI GNGGWIVSET APHPEATYEY NKKAAVLADA YGLDFVMSMG 
KWRGYDGATD HWGRTLESIT MMSGLAEATE HVKVWATVHT NLFHPALAAK MYTTLQDISG 
GRAGMNIVVG SYVDEFAQMG LWREDIGHGD RYRYTEEWTS VLKRLWTEDS VTHDGEFFKL 
DDCRSRPHPA PAPTLISAGR SDTGLNFQAR HCDGSFLTAE DLPGLRDASR DVKERAQKEG 
RSIKTYSMLT VVMDDTDAAA EERRLEYGRG ADIDALVNMK RSWGLPLDKA LSLTSERPED 
EAFQTPFVTG SSETVAGRIR EIVEYAELDG LMLIFPDYHA DLAAFGEKVM PLLRPAGGTA 
AEQG