Gene Ndas_0091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0091
Symbol
ID	9243922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	115642
End bp	116793
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	72%
IMG OID
Product	domain of unknown function DUF1745
Protein accession	YP_003678048
Protein GI	297559074
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.189874
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACGGT TCGGCGATGC ACTGACGACG GGGGCCGACC TCGTGAACGC GGCCGAGCGC 
GCCGTACTGA GTGCCCTGGA ACAGGTGGAC GGCCCTACCG ACCTGGTGTG CTTCTTCGTC 
TGCGGCGCCG ACCCCGAGGA GGTCACCCTC GCGGGCAAGC GCGTCATGGA GCTGGCGGGC 
GACGCGGCCA CCCTCGGATG CAGTTCCACC GGGGTCATCG GCGGCGGCCG CAGCGTCGAG 
GGCCAGGGCT CGGTCAGCGT GTGGTGCGCC GGTCTGCCCG GCGTGGAGAT CACACCGTTC 
CGACTGGACA CCGTGGTCGA GGACGACCAC CTGGCCGTCA TCGGCATGCA GGAGCCCGGC 
CCCCGCGACA GCGTGGCCAT CCTGCTCACC AACCCCTACG AGTTCCCCAC CCAGGCCTTC 
GTCCGCGAGT CCACCGAGGC CCTCGGCGGC CTGCCCCTCG TCGGCGGCAT GGCCGACGGC 
ATGCGCGGTG AGGAGTCGGT GCGGCTCTTC TGCGACGGCG AGGTGGCCGA GCACGGCGCC 
ATCGGCGTCC TCGTCGGCGG CGAGAACGTC CTCGGCACCG TCGTGAGCCA GGGCTGCCGC 
CCCATCGGCT CGCCCATGAC CGTCACCAAG GCCGAGGGCA ACCTCCTGCT CGAACTCGCG 
GGCACCAACG CCTACGAGAA GCTGGAGGAG CTGGTCGAGT CCCTCTCCGA GGAGGACCGC 
GAACTCGCCG AGCACGGCCT GCACATCGGC ATCGCCATGG ACGAGTACGT CGACCGCCAC 
GAGCAGGGCG ACTTCCTCAT CCGCACCCTG GCCGGAGCCG ACCCCGAACT CGGCGCCCTC 
ACCATCGACG ACATGGTCGA GGTCGGCCAG ACCGTCCGCT TCCAGGTCCG CGACGCCGGT 
ACCGCGGACG AGGACCTGGC CCGCCGCCTC AGCGACTTCG GCGCCGAACA CCCCGTCGGC 
GCCGGTCTGC TCTTCTCCTG CAACGGCCGC GGGTCCTCCC TCTTCCCGCA GTCCGACCAC 
GACGTCCTGG CCGTCCACCG CGTCCTCGGC GTCGACGCCG TCGCCGGGTT CTTCGCCGCT 
GGCGAGATCG GCCCGGTCGG CGGGGTCAAC CACGTGCACG GGTTCACCGC CTGCCTGCTG 
GCCTTCGCCT AG

Protein sequence

MARFGDALTT GADLVNAAER AVLSALEQVD GPTDLVCFFV CGADPEEVTL AGKRVMELAG 
DAATLGCSST GVIGGGRSVE GQGSVSVWCA GLPGVEITPF RLDTVVEDDH LAVIGMQEPG 
PRDSVAILLT NPYEFPTQAF VRESTEALGG LPLVGGMADG MRGEESVRLF CDGEVAEHGA 
IGVLVGGENV LGTVVSQGCR PIGSPMTVTK AEGNLLLELA GTNAYEKLEE LVESLSEEDR 
ELAEHGLHIG IAMDEYVDRH EQGDFLIRTL AGADPELGAL TIDDMVEVGQ TVRFQVRDAG 
TADEDLARRL SDFGAEHPVG AGLLFSCNGR GSSLFPQSDH DVLAVHRVLG VDAVAGFFAA 
GEIGPVGGVN HVHGFTACLL AFA