Gene Ndas_2974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2974
Symbol
ID	9246827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3549623
End bp	3551716
Gene Length	2094 bp
Protein Length	697 aa
Translation table	11
GC content	72%
IMG OID
Product	transketolase
Protein accession	YP_003680890
Protein GI	297561916
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGCCC ACACCCCGCA AACCCTGGAG TGGTCGGACC TCGACCTCCG CGCCGTCAAC 
ACGGTCCGGG CCCTGGCGAT GGACGCGGTC GAGAAGTCGG GTAACGGACA CCCCGGCACC 
GCGATGAGCC TGGCGCCAGC CGCCTACCTG CTCTTCCAGA AGATCATGCG CCACGACCCC 
TCGGACCCCG AGTGGACGGG CCGGGACCGC TTCGTGCTGT CGATCGGCCA CTCCAGCCTC 
ACCCTGTACA TCCAGCTCTA CCTCGCCGGG TACGGGCTCG AACTGGACGA CCTCAAGAAC 
CTGCGCCAGT GGGGCAGCCG CACGCCCGGC CACCCCGAGT TCAGCCACAC GCCGGGGGTG 
GAGACCACCA CCGGTCCGCT GGGCCAGGGC GTGGGCAACG CGGTCGGCAT GGCCATGGCC 
GCCCGCCGCG AGCGCGGCCT GTTCAACCCC GAGGCCGGCC CGGGCGCCAG CCCCTTCGAC 
CACCACATCT ACGCGTTCTG CTCCGACGGC GACGTCCAGG AGGGCGTGAG CCACGAGGCC 
AGCGCCCTGG CCGGGACCCA GCAACTGGGC AACCTCATCA TGATCTGGGA CGACAACCGG 
ATCTCCATCG AGGACGACAC CCGCATCGCG CACTCCGAGG ACGTGGCCGA GCGCTACCGC 
GCCTACGGCT GGCACGTGGA GGAGGTCGAC TGGAGCGCCA CCGGCGAGTA CGTCGAGGAC 
GTCGAGGCCC TGTTCCAGGC GATCGTGCGC GGCAAGGCCG AGACCCAGCG CCCGACCTTC 
ATCCGCCTGC GCACCGTCAT CGGCTGGCCC GCGCCCAACA AGCAGAACAC CGGCGCCATC 
CACGGCGCGG CCATCGGCGC CGACGAGATC TCCGCCACCA AGGCGATCCT CGGCCTGCCC 
GACGAGCCCT TCGCCGTCGA GGACGCGGTG ATCGAGCACA CCCGCCGCGC CGTGGACCGG 
GGCCGCGAGG CCCGCGCCGC CTGGGAGGTG GAGTTCAGGG CCTGGCACGA GAGCGCCGGG 
GAGCACGCCG AACTGTTCGA CCGCCTGGTC GAGAAGCGGC TGCCCGAGGG CTGGGAGAAG 
GCCCTGCCGA CCTTCGAGGC CAGCGAGAAG GGGATGGCCA CCCGCAAGGC CAGCGGCGAG 
GTGCTCTCGG CCCTGGCGCC GCTGCTGCCC GAGCTGTGGG GCGGCTCGGC CGACCTGGCC 
GGGTCCAACA ACACCACGCC CAAGGGCGAG CCGTCCTTCC TGCCCTTCGA CCGCGCCAGC 
GAGATGTTCC CGGGCAGCCC CTACGGGCGC GTCCTGCACT TCGGCGTGCG CGAGCACGGC 
ATGGGCTCCA TCCTCAACGG CATGGCCCTG CACGGCCCGA CCCGGCCCTA CGGCGGCACC 
TTCCTCGTCT TCAGCGACTA CATGCGCCCC GCGGTCCGGC TGGCCGCGAT CATGCAGCTG 
CCGGTCACCT ACGTGTGGAC GCACGACTCC ATCGGCCTGG GCGAGGACGG CCCCACCCAC 
CAGCCGGTCG AGCACCTGTG GGCGCTGCGC GCCATCTACG GCCTGGACGT GATCCGCCCC 
GCCGACGCCA ACGAGACCGC CGTGGTGTGG CGCGAGGTGA TCGAGCGGGG CGACCGCCCG 
TCCGCGCTGG CGCTGACCCG CCAGAACCTG CCCGTCCTGG ACCGCGAGGA GTACGCCTCG 
GCCGAGGGCG CGGTCAAGGG CGGCTACGTG CTGGCCGAGG CCGACGGGGG CTCCCCCGAG 
GTCATCATCA TGGCCACCGG CAGCGAGGTG CAGATCGCCC TGGACGCCCG CAAGGCGCTC 
CAGGAGGCGG GCACGCCCAC CCGCGTGGTG TCCATGACGT GCGTGGAGTG GTTCGAGCGC 
CAGAGCGAGG AGTACCGCGA GCAGGTGCTG CCCTCCTCCG TGCGCGCCCG CGTGTCGGTG 
GAGGCCGGGA TCGCCCTGGG CTGGCGCGAG TACGTCGGCG ACGCCGGCGA GTCGGTGAGC 
CTGGAGCACT ACGGCGCCTC CGCCCCCTAC CAGGTCCTGT ACGAGAAGTT CGGCTTCACG 
ACCGAGGCGG TCGTCGAGGC GGCCCGCAAG AGCATCGCCA GGGCCGGCAG CTGA

Protein sequence

MNAHTPQTLE WSDLDLRAVN TVRALAMDAV EKSGNGHPGT AMSLAPAAYL LFQKIMRHDP 
SDPEWTGRDR FVLSIGHSSL TLYIQLYLAG YGLELDDLKN LRQWGSRTPG HPEFSHTPGV 
ETTTGPLGQG VGNAVGMAMA ARRERGLFNP EAGPGASPFD HHIYAFCSDG DVQEGVSHEA 
SALAGTQQLG NLIMIWDDNR ISIEDDTRIA HSEDVAERYR AYGWHVEEVD WSATGEYVED 
VEALFQAIVR GKAETQRPTF IRLRTVIGWP APNKQNTGAI HGAAIGADEI SATKAILGLP 
DEPFAVEDAV IEHTRRAVDR GREARAAWEV EFRAWHESAG EHAELFDRLV EKRLPEGWEK 
ALPTFEASEK GMATRKASGE VLSALAPLLP ELWGGSADLA GSNNTTPKGE PSFLPFDRAS 
EMFPGSPYGR VLHFGVREHG MGSILNGMAL HGPTRPYGGT FLVFSDYMRP AVRLAAIMQL 
PVTYVWTHDS IGLGEDGPTH QPVEHLWALR AIYGLDVIRP ADANETAVVW REVIERGDRP 
SALALTRQNL PVLDREEYAS AEGAVKGGYV LAEADGGSPE VIIMATGSEV QIALDARKAL 
QEAGTPTRVV SMTCVEWFER QSEEYREQVL PSSVRARVSV EAGIALGWRE YVGDAGESVS 
LEHYGASAPY QVLYEKFGFT TEAVVEAARK SIARAGS