Gene Ndas_2693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2693
Symbol
ID	9246544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3209058
End bp	3210707
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003680614
Protein GI	297561640
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.613106
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.221929
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCCCC AACCTCCCGG CCCCCTGGAG CAGGGCGAGG TCCTCCAGGA CCTCGCCGGG 
CGACTGGTCG CGGTCGTCCC GGAGGGCTGG CAGCAGCTCA CCTACCTGGC CAGGGTGATC 
GGCGCCCACC GCAGCGACAT GCTCGCCGTC CAGGAGGCGG ACGGCCGGGT CCGGCAGCTG 
GTGGTGCCCG GCGGTGTCGG CGACCTGGTC GACGCGCTCA AGCGGTCCGG GTTCCGGGAG 
GGCGGGGGCA CCTGGCTCTC CATGGTCCTC TCGGTCCACC ACACGCACCA GTTCAACGTC 
GAGTACAACC ACGACACCGA GCCCGACCTG CCGCCCGGGA CGAGCCCGCT CGTCTACGCC 
CAGGAACTGG AGCGCTTTCC GCGCGCGCAC GACCGGATCC CCGACTGGCT CGGCGCCCGG 
CTGGAGCAGG CGCGTGAACT GGATCCCGAG CGGATGCGCG AGGAGGTCGG CGCGGCCCTG 
GTGCGGGCCT GCGAGCGGGA GGGGCTGCGC GCCGACTTCC TGCCGCCGAC CCGCCTGCGC 
GTGTTCGACT TCGGGGGCGC GGTCCTCATG GAGGCCGACA TGAGGGAGAC CTTCGACCAG 
GCGGTCATCG CCGCGGAGGA GCAGCGGACC GACCTGGCCG CCCGCTTCGC GGACTTCATG 
GCCGATGCCG CTCGGGAGCG GGAGCAGGCC GCCGACGGGT CCTCCGCCGA GGCGTCCTCC 
ACCGGTACGC GGGACGCCGA CCCGGCCGGC GCTCCCTCAC CGCCGGACCC CGACGACACG 
GTGGCCGTCT CCCTGGCGGC GGCCTTCGCC GAGGCCGGGG TGGGCGCCGC CTTCCAGGGC 
GCCGACACGC TCGTCGTGAC GCTGCCCGAC GGCAACCACG CCAGCGCCGA CATCAGCGGA 
CTGCGCGCCG CACTGGGCGA GGCCACCCCC GAGCAGATCG CGCACAACAC CGCCCAGTTC 
GCGCGCACGT CCGTCGAACA GCTGAGCCAG GCCACCGGAC AGGGAGGCGG CGACACCGAC 
GGACGGCTCC GGGTACGCCT GTACCCCGCC TCCGCCTTCC CCGAGGGCGT ACTGGACTCC 
CTCCTGACCC GCGAGATCGC CCCCGGGCTG TGGCAGACCG TGGTCGTGGA CGCCTCCGAC 
TCGCTGAGGC CGCTGCCCCG CCAGGTGCAC GAACGCTCCG GCCGCCCCGA CGGCGAGGTC 
TTCGCCGAGG CGGTGGCCGC CTCCGTGGCC GAGGCCGTCG AGGTCAGCGA GCACGAGGTC 
GACGGGGCGC GCATCGTGCA CATCGGCGGC CAGCACCCCT ACGTGGCGGC GCACGCGCAC 
GACCTCGACC GCCACCTCGG CGACCTGCCG CACGGCGCGC TCGTGGCCTT CCCCGTTCCC 
GAGGTGCTCC TGGCCCACCC CCTGGGGAAG GGCCACCCGA TCGCCGCCCT GGACCACATG 
CAGCAGGTCG CCGAGCGGTT CACCGCCGAC GGCGACAAGC CCGTCAGCGC CCAGCTCTAC 
TGGTGGCACC CCGGTTCGCG CTCGCGCGAT CGGGGCACGC CGCCCGACCT GCGTCCCGTG 
GGGGCCAGGA TCGACCACGA GAACAGGTCG GTGGAGCTGC TGACCTCCGA CGAGGAGTTC 
GGGCCCATGC TCGCCTCCCT GGTCGGGTAG

Protein sequence

MTPQPPGPLE QGEVLQDLAG RLVAVVPEGW QQLTYLARVI GAHRSDMLAV QEADGRVRQL 
VVPGGVGDLV DALKRSGFRE GGGTWLSMVL SVHHTHQFNV EYNHDTEPDL PPGTSPLVYA 
QELERFPRAH DRIPDWLGAR LEQARELDPE RMREEVGAAL VRACEREGLR ADFLPPTRLR 
VFDFGGAVLM EADMRETFDQ AVIAAEEQRT DLAARFADFM ADAAREREQA ADGSSAEASS 
TGTRDADPAG APSPPDPDDT VAVSLAAAFA EAGVGAAFQG ADTLVVTLPD GNHASADISG 
LRAALGEATP EQIAHNTAQF ARTSVEQLSQ ATGQGGGDTD GRLRVRLYPA SAFPEGVLDS 
LLTREIAPGL WQTVVVDASD SLRPLPRQVH ERSGRPDGEV FAEAVAASVA EAVEVSEHEV 
DGARIVHIGG QHPYVAAHAH DLDRHLGDLP HGALVAFPVP EVLLAHPLGK GHPIAALDHM 
QQVAERFTAD GDKPVSAQLY WWHPGSRSRD RGTPPDLRPV GARIDHENRS VELLTSDEEF 
GPMLASLVG