Gene Ndas_3889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3889
Symbol
ID	9247760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4661866
End bp	4662948
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	74%
IMG OID
Product	putative sigma E regulatory protein, MucB/RseB
Protein accession	YP_003681792
Protein GI	297562818
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCGG AGGAACCCTC CTCCGCGCGC TCCGCCCCGG TCACGATCCT CGTCGTGGCA 
CTGCTGTGCG CGCTGCTGCT CACGGCCGCC GCGCACCCCC ATCCCACCGC CGTCCCGGCC 
GAGGGGGAGG ACGACGGGAT GTCGGTGCTG CACCGCGCCG CCGCAGCGGA GGACGAGGTC 
GCCTACTCGG CCGTGCGCGA GGTCACCGGA CCGGAGGACA CGGAGGGCGG GCAGTCCGCC 
GAGGGCCGGA CGCTGCGCGT GCGCGTGGTG AACAGGCCCG GCGAAGGCAT CGCCCTGGCG 
CCCGTCGGAG ACGAGGAGTC CGCCCTGGTG GTGGACGCGT CCTCGGCCCT GGAGTCGTTG 
GACGACCGCC TGCTCAGCAT GCTCGGCGAC ATCTACGCCG TCTCGGACGC GGGCCCCGCC 
CGCCTGGACG GCCGGGAGGC CCGCCTGGTG GAGGCCAGGC ACGCCGACGG CACCGTCGCC 
GGGCGGTTCT GGGTGGACAC CGCCACCGGC CTGCTCCTGG GCCGGACCGT CTACGGCACC 
GGCGGCGAGC ACGCGATCGG CTTCCGCCTC ACGGGGCTCG AACTGGGGGA GGAGGACTGG 
CCGGAGGAGG CGCTCGGAGA CTCCCCCTGG AGCGACACCC TCACCCGCAC CGAGCGCGCG 
GACCTGCGCG CGGAGGAGTG GCCCCTCCCG GAGTACCTGG CCTGGAACCT GCGGCTGGTC 
GACGCCCGGT CCACCGAGCA CGGCGGGCAC CGCGTGGTGC ACGCCGTCTA CTCGGACGGT 
CTGTCCCAGG TGTCGGTTTT CACCCAACGT GGGAAGCTGG GCAGCAAGCA TTCCCCCACA 
GAACCGAACG GATACGCCGG AACCGGGACG GGGGGAAGCG GCGTCACACC ACAACACGGC 
ACGATCTTCG GCGGTGACGC GGGCCAGTAC CAGAGCATGT GGCAGGCGAA CGGCTTCGTC 
TACACGGTGC TCGCGGACGC CCCCGCGGGG CTGGCCTCGT CCGCCGTGTC CGCGCTGCCC 
GGGCCGGGTT CGGGTTTCTG GGCCCGCGTG CACCGCGGTC TGTCCCGGCT GGGGTTCCTC 
TAG

Protein sequence

MSAEEPSSAR SAPVTILVVA LLCALLLTAA AHPHPTAVPA EGEDDGMSVL HRAAAAEDEV 
AYSAVREVTG PEDTEGGQSA EGRTLRVRVV NRPGEGIALA PVGDEESALV VDASSALESL 
DDRLLSMLGD IYAVSDAGPA RLDGREARLV EARHADGTVA GRFWVDTATG LLLGRTVYGT 
GGEHAIGFRL TGLELGEEDW PEEALGDSPW SDTLTRTERA DLRAEEWPLP EYLAWNLRLV 
DARSTEHGGH RVVHAVYSDG LSQVSVFTQR GKLGSKHSPT EPNGYAGTGT GGSGVTPQHG 
TIFGGDAGQY QSMWQANGFV YTVLADAPAG LASSAVSALP GPGSGFWARV HRGLSRLGFL