Gene Ndas_4109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4109
Symbol
ID	9247983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4905581
End bp	4906669
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	81%
IMG OID
Product	MoeA domain protein domain I and II
Protein accession	YP_003682011
Protein GI	297563037
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGG AGCCGCTCGA CGGCGCCCTC GGTGCCACCC TCGGCGCCGA CCTCGTCTCG 
GTGGTCGACG TCCCGGTGCT GGACAGCGCG GCCATGGACG GGTACGCGGT GGCCGGTGAG 
GGCCCCTGGA CCGTCCTCGG CCGCTCGCTC GCCGGGCGGC GGGGGCCCGT CGTCCGCCTG 
AACCCGGGGG AGGCGGTGGA GGTCGCCACG GGCGCCGTCG TGCCGGAGGG CACCACCGCC 
GTCCTCCCCT GGGAGCGGGC GGCGGCCTCC TCCGGGCGCG TGCGCGGCGC GGCCGAGGCC 
GGCAGGCACA TCCGCCGCAA GGGCGAGACC ACCCCCGCCG GGGCGCTGGC CGCGCGCCGG 
GGCAGCCCCG TCACCCCCGC CCTCCTGGGG CTGGCCGCGA GCCTGGGCCT GGACACGCTG 
CCCGTGGTCC GCCCCGCGGT GCGCGTCCTG GTCACCGGGG ACGAGGTCGT GCGCGAGGGG 
AGACCGCGCC CGGGCACCGT GCGCGACGCG ATCGGCCCGC TGCTCCCCGG CCTGGTCGCC 
TGGGCCGGAG GGCGCTGCCT GCCCCCGCTG GCGGTCGCCG ACCGGGGCCG GGACACGGCC 
CGCGCCCTGG AGGCGTCCGG GCCCTCCGAG GTCGTCGCGG TCTGCGGCTC CTCCTCGGCC 
GGGCCCGCCG ACCACCTGCG CCCGGTGCTC ACCGCGCTCG GCGCGCGGAT GGTCGTCGAC 
GGGGTGGCCT GCCGCCCGGG GCACCCGCAG GTGCTGGCCG TGCTGCCCTC GGGAACCGTG 
GTCGTGGGAC TGCCGGGCAA CCCCGGCGCC GCGCTGGCCG CCGCGCTCAC CCTGCTCGTC 
CCGGTGCTCG CCGGTCGCGC GGACCGGCGC GACCCCGCCC ACCTCGGCCG ACGGGTCCGG 
CTCATCGGGC CGACCCGGCC GCACCCGACC GACACCCGCC TGGTGCCGGT GCGCGTCAGC 
CGCGACCTGG CGGTGGAACT GCCCGGCACC GGCTCGGCCG ACCTGCGCGC CGCCGCCGTC 
GCCGACGCCC TCGCGGTCGT GCCGCCCGGC CGCCGGACGG GGCGCGTCGA ACTCGTGGAG 
CTGCCGTGA

Protein sequence

MAEEPLDGAL GATLGADLVS VVDVPVLDSA AMDGYAVAGE GPWTVLGRSL AGRRGPVVRL 
NPGEAVEVAT GAVVPEGTTA VLPWERAAAS SGRVRGAAEA GRHIRRKGET TPAGALAARR 
GSPVTPALLG LAASLGLDTL PVVRPAVRVL VTGDEVVREG RPRPGTVRDA IGPLLPGLVA 
WAGGRCLPPL AVADRGRDTA RALEASGPSE VVAVCGSSSA GPADHLRPVL TALGARMVVD 
GVACRPGHPQ VLAVLPSGTV VVGLPGNPGA ALAAALTLLV PVLAGRADRR DPAHLGRRVR 
LIGPTRPHPT DTRLVPVRVS RDLAVELPGT GSADLRAAAV ADALAVVPPG RRTGRVELVE 
LP