Gene Ndas_2534 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2534
Symbol
ID	9246385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3022151
End bp	3023557
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	73%
IMG OID
Product	beta-galactosidase
Protein accession	YP_003680459
Protein GI	297561485
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.574019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGACC CCACCCTGCC CGCCAGCCTC CTCTTCGGCA CCGCCACCGC CGCCTACCAG 
ATCGAGGGCG GTGTCCACGA GGGCGGACGG GGTCCCTCCA TCTGGGACAC CTACTGCCGC 
ACGCCGGGGC GCGTCGCCCG CGGCGAGAGC GGCGACGTCG CCTGCGACCA CTACCACCGC 
TACGGCGAGG ACGTCGCCCT GCTCGCCGAC CTGGGCGTCG ACCTGTACCG CTTCTCCGTG 
GCCTGGCCGC GCGTCCAGCC CACGGGCAAG GGCCGCCCCA ACCCGGAGGG ACTGGCCTTC 
TACGACCGCC TGGTGGACAC CATCCTGGGC GCCGGGATCG AACCCGCCCT GACCCTCTAC 
CACTGGGACC TGCCCCAGGC GCTGGAGGAC GAGGGCGGCT GGCGGGTCCG CGACACCGCC 
TACCGCTTCG CCGAGTACTC CCGCATCGTC GCCGACCGCC TCGGCGACCG GGTCAACCGG 
TGGATCACCC TCAACGAGCC CTTCTGCTCG GCCTTCGTCG GCCACGCCGT CGGCCGCCAC 
GCGCCCGGAA CCCGGGAGGG CACTCCCGCC CTGGCCGCCG CGCACCACCT GCTGCTCGCC 
CACGGCATGG CCACCGGCGA ACTGCGCGCG GCCGCCGCCG GGGAGGTCGG CATCACCCTC 
AACCCGGACC ACTTCCTGCC CGCCACCGAC TCCGAGGCCG ACCGCGCCGC CGTGGAGCGG 
GCCCGCACCC TGCACAACCG CGTGTGGTTC GACCCCATCT TCGCCGGGGC CTACCCCGAC 
AACGAGGACG AGGTCTGGGA GGGCATGGCC GACGGCTCCT ACCGGGCCGA CGGCGACCTG 
CGCATCATCG GCCAGCCGCT GGACTTCCTG GGCGTCAACT TCTACCGGCC CATCATGCTG 
CGCGACGCCC CCCACAGCGA GGCCGACCCG GCCGCGCGCA CCGCCGTGGA CATCCGCACC 
GAGCAGGTGC GCATCGAGGG CGTGCGGCAC ACCACCATGG ACTGGCCGGT GGTCCCGGCC 
ACCTTCGCCG ACCTGCTCAT CGACCTGGAC CGGCGCTACC CGAACCTGCC GCCCATCTTC 
ATCACCGAGA ACGGCTCGGC CGAGGACGAC CAGCCCGACG AGACCGGCCG GGTCCGCGAC 
ACGGGTCGCG TCGAGTACCT GCGCGACCAC CTGGGCGCCC TGGCCACGGC CATCGACGCG 
GGGGTGGACG TGCGCGGCTA CTTCGTGTGG TCGCTGCTGG ACAACTTCGA GTGGGCCTAC 
GGCTACGACC GCCGCTTCGG GCTGGTCCGC GTCGACTACG ACCGCCTGGA GCGCCACCCC 
AAGGACAGCT ACCACTGGTA CCGCGACTTC CTGACCTCGC ACCGCGCCCG CAGGGTCCAG 
GAGCTCGCCA CACAGTGGGA GGGTTAG

Protein sequence

MEDPTLPASL LFGTATAAYQ IEGGVHEGGR GPSIWDTYCR TPGRVARGES GDVACDHYHR 
YGEDVALLAD LGVDLYRFSV AWPRVQPTGK GRPNPEGLAF YDRLVDTILG AGIEPALTLY 
HWDLPQALED EGGWRVRDTA YRFAEYSRIV ADRLGDRVNR WITLNEPFCS AFVGHAVGRH 
APGTREGTPA LAAAHHLLLA HGMATGELRA AAAGEVGITL NPDHFLPATD SEADRAAVER 
ARTLHNRVWF DPIFAGAYPD NEDEVWEGMA DGSYRADGDL RIIGQPLDFL GVNFYRPIML 
RDAPHSEADP AARTAVDIRT EQVRIEGVRH TTMDWPVVPA TFADLLIDLD RRYPNLPPIF 
ITENGSAEDD QPDETGRVRD TGRVEYLRDH LGALATAIDA GVDVRGYFVW SLLDNFEWAY 
GYDRRFGLVR VDYDRLERHP KDSYHWYRDF LTSHRARRVQ ELATQWEG