Gene Ndas_0934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0934
Symbol
ID	9244779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1148831
End bp	1150273
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	70%
IMG OID
Product	cell envelope-related transcriptional attenuator
Protein accession	YP_003678884
Protein GI	297559910
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0202033
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGGAA AACGCTCCGC CCCCCGCCCT CCGTCCGCCG CCATGCACGC CGTGCGCATG 
TCCCCGGGGC AGTGGGTCGC CTGCGTGGTC ACCGCCCTGG CCATCATCGC CAGCCTCGGC 
GGCTACGGCT GGTACCAGGG CATCGTCGGC AACATCACCA CCGCGCAGGT GGACACCGAC 
GCCTGGGACC GGCCCAACAG CGTCGAGGGC GTGATGAACC TGCTCATCAT CGGCTCCGAC 
GTCCGGTCGG GGGACAACGC CAACTACGGC GAGGCCGAGG GCGAGCGCCC CGACACCATG 
CTCATCGCCA GCATCAACGT GGACAACGGC GCGGCCACGC TGGTCAACCT GCCCCGCGAC 
CTGGTCGTGG ACCTGCCCGG CTGCGAGGCC GTGGAGGGCT ACGAGGGGAT GAGCCCGCAC 
AGCGGCATGA TCAACTCGGC GATGACCTTC GGCGGGGTGG GCTGCCAGTG GCAGACCGTC 
GAGGAGGTCA CCGACGTGCA CCTGGACCAC TTCGTCATGA TGGACTTCAC CGGGTTCAAG 
GACATGGTGG ACGCCATCGG CGGCGTGGAG ATGTGCATCC CCGCGCCGGT GGACGACCCC 
AAGGCGCACC TGACGCTGGA CGCAGGGACG CAGACCCTCA GCGGTGAGGA GTCGCTGGGC 
TACGTGCGCT CCCGCTACGG CCAGGGCGAC GGCAGCGACC TGTCGCGGAT CGACCGCCAG 
CAGGAGTTCA TGGGCGCCAT GCTGCGCCAG GTGCTCAGCA GCGAGGTCAT GACCAGCCCG 
GTGACCATCA CCAACTTCCT CAGCGCCGTC ACCGACTCGG TGACCACCGA CGAGGAGCTG 
ACCGTGGAGA CGATGACCGA CATCGCCATC TCCATGCGCG AGGTGGACCT GGAGCGCATC 
CAGTTCGTCA CCGTGCCCAA CGGCCAGCAC CCCGCCGACG CCAACCGGCT GGCCATGAGC 
CAGCCCGCCG CCTCCGAGCT GTTCGCGGCG ATCAACTCCG GCGCCTACCT GGAGGACGAG 
GAGCCGGAGG ACGAGGGGGA GGAGTCGGAG GAGGGCTCCG GCGACGCGGC CCCCGCCCCC 
GCCGACGTCT CCGTGCAGGT CCTCAACAAC ACCGGTGTCA CCGGCCTGGC GAACGAGGTC 
CAGGGCGTCC TGCTGGGGGA GGGGTACGAC GTCACCGGTA TCGGCGAACC CGCGGTGCGC 
TTCCCCGAGC TGACCACCGT CTACTACGCT CCGGGTGAGG CGGCCGCCGC CGAACTGCTG 
GCGGGTTCGC TGGAGAACGC GGTCACCGAG GAGGTCGCCG ACCTCCCGCA GACGCTGGAA 
CTGGTCATCG GCCAGGACTG GAACGGCTTC GCGGGCGGAG GCGGCTCGTC CGGGCCCGAG 
GTCTCCATCA CCGAGGACCT GGGCGGCACC ACCGCGGCGG GGGCTCGGGA GAGCGCCTGC 
TGA

Protein sequence

MAGKRSAPRP PSAAMHAVRM SPGQWVACVV TALAIIASLG GYGWYQGIVG NITTAQVDTD 
AWDRPNSVEG VMNLLIIGSD VRSGDNANYG EAEGERPDTM LIASINVDNG AATLVNLPRD 
LVVDLPGCEA VEGYEGMSPH SGMINSAMTF GGVGCQWQTV EEVTDVHLDH FVMMDFTGFK 
DMVDAIGGVE MCIPAPVDDP KAHLTLDAGT QTLSGEESLG YVRSRYGQGD GSDLSRIDRQ 
QEFMGAMLRQ VLSSEVMTSP VTITNFLSAV TDSVTTDEEL TVETMTDIAI SMREVDLERI 
QFVTVPNGQH PADANRLAMS QPAASELFAA INSGAYLEDE EPEDEGEESE EGSGDAAPAP 
ADVSVQVLNN TGVTGLANEV QGVLLGEGYD VTGIGEPAVR FPELTTVYYA PGEAAAAELL 
AGSLENAVTE EVADLPQTLE LVIGQDWNGF AGGGGSSGPE VSITEDLGGT TAAGARESAC