Gene Ndas_2975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2975
Symbol
ID	9246828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3551816
End bp	3552922
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	70%
IMG OID
Product	transaldolase
Protein accession	YP_003680891
Protein GI	297561917
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG CACTCCGCGA CCTCTCCCAG GCGGGCGTGT CCGTCTGGAT CGACGACATC 
AGCCGTGAGC GGCTGCGCTC CGGCAACCTG GCCGAGCTGA TGTCGACCCG CCACGTGGTC 
GGCGTCACCT CCAACCCCAC CATCTTCGAC AAGGCGCTCG CCGAGGGCGA CGCCTACGAC 
CAGCAGGTCC ACGAGCTGGC CGTGCGGGGC GTGACGGTGG AGGAGGCGGT GCGCATGATC 
ACCACCTACG ACATCCGCTG GGCCGCGGAC ACCCTGCGCC CGGTCTACGA CTCCACCGAC 
CGCGTGGACG GGCGCGTCTC CCTGGAGGTG GACCCGCGCC TGGCCAACGA CACCGAGCGC 
ACGGCCGCCG AGGCCAAGGC GCTGTGGTGG ATGGTGGACC GGCCCAACCT GATGGTCAAG 
ATCCCGGCCA CGGCCGCGGG CCTGCCCGCG ATCACGCGGG TGCTGGGCGA GGGCATCAGC 
GTCAACGTCA CGCTGATCTT CTCCCTGGAG CGCTACCGCC AGGTGATGGA CGCCTTCCTG 
GAGGGGATGG AGCTGGCCCG CGCCAACGGC CACGACCTGT CCCGCATCCA GTCGGTGGCC 
TCGTTCTTCG TCAGCCGCGT GGACACCGAG GTGGACAAGC GCCTGAAGGA GATCGGCACC 
GACGAGGCGC TGTCCCTGCT GGGCCGCGCC GCCCTGGCCA ACGCCCGCCT GGCCTACGAG 
GCCCACCAGG AGGTCTTCGC CTCCCCCGAG TGGAAGGCCC TGGAGGAGCA CGGCGCCACG 
CCGCAGCGGC CGCTGTGGGC CTCCACCGGC GTGAAGGACC CCTCCTACGA GGACACCCTC 
TACGTCGCGC AGCTGGTGGC GCGCGACACC GTCAACACGA TGCCGGAGGC CACGCTGGAG 
GCCACCGCCG ACCACGGCGA GATCACCGGC AACACCGTGC TGGGCACCTA CGAGCAGGCC 
CGCGCCGACT TCGCCGCGCT GGAGAACGCC GGGATCAACC TGACCGACGT GTTCGCCGTG 
CTGGAGGACG AGGGCGTGGA CAAGTTCGTC AAGTCCTGGG AGAGCCTGCT GAGCGCGCTC 
TCGGCCAAGC TCGACAAGCT GTCCTGA

Protein sequence

MSNALRDLSQ AGVSVWIDDI SRERLRSGNL AELMSTRHVV GVTSNPTIFD KALAEGDAYD 
QQVHELAVRG VTVEEAVRMI TTYDIRWAAD TLRPVYDSTD RVDGRVSLEV DPRLANDTER 
TAAEAKALWW MVDRPNLMVK IPATAAGLPA ITRVLGEGIS VNVTLIFSLE RYRQVMDAFL 
EGMELARANG HDLSRIQSVA SFFVSRVDTE VDKRLKEIGT DEALSLLGRA ALANARLAYE 
AHQEVFASPE WKALEEHGAT PQRPLWASTG VKDPSYEDTL YVAQLVARDT VNTMPEATLE 
ATADHGEITG NTVLGTYEQA RADFAALENA GINLTDVFAV LEDEGVDKFV KSWESLLSAL 
SAKLDKLS