Gene Ndas_2939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2939
Symbol
ID	9246791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3511429
End bp	3512511
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	77%
IMG OID
Product	transcriptional regulator, TetR family
Protein accession	YP_003680855
Protein GI	297561881
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0355871
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCGGC TCACCAGGGC GCAGCGCCAG GCCCGCAACC GGGCGCGCGT GCTGTCCGCG 
GCCGGGGACG AGTTCGCCGA GCACGGTTTC CGCGACGCCA AGGTCGACCG TATCGCCGAA 
CGGGTCGACC TCACCCGGGG CGCCGTCTAC TCCAACTTCC CCGGCAAGCG CGCCCTGTAC 
CTGTCGGTGC TGGCCGACGC CGCCGAGCGT TCCGCCGACG CCGCCCGGCC CGAACCCGGG 
CACAGCGCCC GCACGGCGCT GGGCGCGCTC GCCCGCGCCT GGGCCTCCCG GCTCCCCACC 
ATCGGCGAGT CCTCGCTGAC CGGGACCGCG CTTCCGCCCG AGGTCCTCTC CGACGAGCCC 
GTCCGGAGCG CCTTCGCCCA GCTCATGCGG TTGAACGCGC TCCTGCTCGG CCTGTCCTTG 
GAGGCGTTGG CGCCCCCGTC CGTCCCCGGC GGACGCCGGG TGCGCGTGGC CGGGACCGTG 
CTCACTACCC TGTACGGGAC CGGCCAGCTG GTCGGTGTCG CGCCCGGCTT CGCGGACCCC 
TTCGCGGTGG TGCGCGCCTG CGAGCGCCTG GCCGACCTGG ACCTGGAGGA CTCCTGGCCG 
CCGCCCCACC TGGAGCACGT GCGCCAGGCA GTGCCCGCCG ACGAGGAGTG GTCACCGCCG 
GAGGCCTTCG ACGCGGTCCG CAGGCGCGCC GTGTCCCTGG CCGGGGACGG GATCGTGGCG 
ATCCTGGGCA CGCACCGCCT CGAAGCGGCG GAGGAGGCGC TGCGCTCCGC GCCCGCGGGC 
TCCCCCGTGA CCGCCGTGGT GGTCACGGGG GACCCCGACG AGCTGACCCC GCTCGCGCGG 
CTGGCCGTGG CCGACCTGTG CGGCTGCCTG CGCCAGGCCT TCCCCGAGAG GGCCTGGCCG 
CGCCTGCGCG TGGTGTTCGA CCCCTCCGGT GAGATCGCCG CGGCCGCGGG CGTGCCCGTG 
GTCAGCGACG CCACCGAGAG CGCCGTCCGC GTCGTCGGCG GTCGGATCAC GGCCCGCTCC 
GACGCCCGCG GCGCGGGCCA CGCCGTCGCC GCGCTCCTCG GCGCGCGGGC GGACCGCCGG 
TAG

Protein sequence

MVRLTRAQRQ ARNRARVLSA AGDEFAEHGF RDAKVDRIAE RVDLTRGAVY SNFPGKRALY 
LSVLADAAER SADAARPEPG HSARTALGAL ARAWASRLPT IGESSLTGTA LPPEVLSDEP 
VRSAFAQLMR LNALLLGLSL EALAPPSVPG GRRVRVAGTV LTTLYGTGQL VGVAPGFADP 
FAVVRACERL ADLDLEDSWP PPHLEHVRQA VPADEEWSPP EAFDAVRRRA VSLAGDGIVA 
ILGTHRLEAA EEALRSAPAG SPVTAVVVTG DPDELTPLAR LAVADLCGCL RQAFPERAWP 
RLRVVFDPSG EIAAAAGVPV VSDATESAVR VVGGRITARS DARGAGHAVA ALLGARADRR