Gene Ndas_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1100
Symbol
ID	9244946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1350284
End bp	1351387
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	69%
IMG OID
Product	Luciferase-like, subgroup
Protein accession	YP_003679048
Protein GI	297560074
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.43762
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTTCG GGATCTTCAC CGTCGGTGAC GTGACCACCG ACCCCACCAC CGGCCGTACG 
CCGACCGAGG CCGAGCGCGT CAAGGCGATG GTGACCATCG CGCTCAAGGC CGAGGAGGTC 
GGCCTGGACG TCTTCGCCAC CGGCGAGCAC CACAACCCGC CCTTCGTGGC CTCCTCACCG 
ACCACGATGC TCGGCTACAT CGCGGCCAAA ACGGACAGGC TCATCCTGTC CACCTCCACC 
ACGCTGATCA CCACCAACGA CCCGGTCAAG ATCGCCGAGG ACTTCGCCAT GCTCCAGCAC 
CTGGCCGACG GCCGGGTGGA CCTGATGATG GGCCGCGGCA ACACCGGCCC CGTCTACCCC 
TGGTTCGGCC AGGACATCCG CCAGGGCATC CCGCTGGCGC TGGAGAACTA CAACCTGCTG 
CACCGGCTCT GGCGCGAGGA CGTGGTGGAC TGGGAGGGCA AGTTCCGCAC CCCCCTGCAG 
GGCTTCACCT CCACCCCCCG CCCCCTGGAC GGGGTGCCCC CCTTCGTCTG GCACGGCTCC 
ATCCGCAGCC CCGAGATCGC CGAGCAGGCC GCCTTCTACG GTGACGGCTT CTTCCACAAC 
AACATCTTCT GGCCCGCCAC GCACACCAAG AAGCTCATCT CGCTCTACCG CCGCCGCTTC 
GAGCACTACG GCCACGGCAG GGCCGAACAG GCCGTCGTCG GCCTGGGCGG ACAGGTGTTC 
ATGCGCAAGA ACTCCCAGGA CGCGGTGAGG GAGTTCCGCC CCTACTTCGA CCACCACCCC 
CTGATGGGCG GCGGACCGTC GCTGGAGGAG TACATGGACC AGACCCCGCT GACCGTCGGC 
AGCCCCCAGC AGGTCATCGA CAGGACCCTC GCCTTCCGTG ACAGCTTCGG CCACTACCAG 
CGCCAGCTGT TCAACGTCGA CGGCGTCGGG ACACCCCTGA AGACGGTCCT GGAGCAGATC 
GACGTCCTCG GCGAGGAGGT CGTGCCGGTG CTGCGCGAGG AGTTCGCCGC CGGGCGGCCC 
GCGCACGTGC CCGACGCGCC CACCCACGCC TCGCTGCTCT CCGCCCGCGA CACCGGAAAC 
GCCTCCGCGA CAGCGACGGG CTGA

Protein sequence

MQFGIFTVGD VTTDPTTGRT PTEAERVKAM VTIALKAEEV GLDVFATGEH HNPPFVASSP 
TTMLGYIAAK TDRLILSTST TLITTNDPVK IAEDFAMLQH LADGRVDLMM GRGNTGPVYP 
WFGQDIRQGI PLALENYNLL HRLWREDVVD WEGKFRTPLQ GFTSTPRPLD GVPPFVWHGS 
IRSPEIAEQA AFYGDGFFHN NIFWPATHTK KLISLYRRRF EHYGHGRAEQ AVVGLGGQVF 
MRKNSQDAVR EFRPYFDHHP LMGGGPSLEE YMDQTPLTVG SPQQVIDRTL AFRDSFGHYQ 
RQLFNVDGVG TPLKTVLEQI DVLGEEVVPV LREEFAAGRP AHVPDAPTHA SLLSARDTGN 
ASATATG