Gene Ndas_0025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0025
Symbol
ID	9243852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	32374
End bp	33459
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	74%
IMG OID
Product	pyruvate dehydrogenase (acetyl-transferring) E1 component, alpha subunit
Protein accession	YP_003677983
Protein GI	297559009
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.246697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATG ACCGGGACCT TCTCCCCTCC GAGCAGCCGG TCCGGCTGCT CGACGAGACC 
GGAAGCCCGG TGGACGGGGC CGCCCTGCCG TTCCCGGACC GGGAGCGGCT GCTCGCCGCG 
TACACCTCCC TGGTGATCGG CCGCCGCGTC AACGACCAGG CCAGCGCCCT CGTGCGGCAG 
GGCCGCCTGG CCGTGTACCC CTCCTCGCAC GGGCAGGAGG CCTGCCAGAC GGGCGCGGCC 
CTGGCCCTGG CGGAGGGCGA CTGGCTCTTC CCGACCTACC GCGACACCGC CGCCGTGGTC 
GCGCGCGGGG TGGACCCGGT GCAGGTGCTC ACCCTGCTCA AGGGCGACTG GCACTCGGGC 
TACGACCCCT ACGCGCACCG CGTGGCCCCG CAGGCCACGC CGCTGGCCAC CCAGCTCCTG 
CACGCGGTGG GCGTCGCGCA CGCCGCCCGC CTGCGCGGTG AGGACACCGT GGTCATGGCG 
ATGTGCGGCG ACGGCGCCAC CAGCGAGGGC GACTTCCACG AGGCGCTGAA CTTCGCGGCG 
GTGTTCCGGG CCCCGGTGGT CTTCTTCGTG CAGAACAACG AGTACGCCAT CTCCGTCCCC 
CTGGCCCGCC AGACCGCCGC CCCCTCGCTC GCCCACAAGG GCGTCGGCTA CGGGGTGAAC 
GCGGAACGGG TGGACGGCAA CGACACCCCC GCGGTGCTCG CCGTGCTGGA CCGGGCCGTG 
GCCGCCGCGC GGGCGGGCGA GGGCCCCCAG CTCGTGGAGG CGCACACCTA CCGCATGCAG 
GCGCACACCA ACGCCGACGA CGCCACCCGG TACCGCACCC AGGAGGAGGT CGACCCCTGG 
GAGGCCCGCG ACCCCCTGCT GCGCATGGAG GCCTACCTCA CCAGGAAGCG CGTCCTCACC 
AAGGCCCGCA AGGCGCGCAT CGCCGAGGAC GCGGAGGCCG TGGCCGCCGC CATGCGCGAG 
GGCGTCACCA GGGACACCGA CCCCGAGCCC GCCGAACTGT TCGCGCACGT GTTCGCGACC 
CCCACGCCGC AGCTGGACGA GCAGGCCGCC TTCCTGGCCG ACGAACTGAG CAGAGAGGGC 
AACTGA

Protein sequence

MADDRDLLPS EQPVRLLDET GSPVDGAALP FPDRERLLAA YTSLVIGRRV NDQASALVRQ 
GRLAVYPSSH GQEACQTGAA LALAEGDWLF PTYRDTAAVV ARGVDPVQVL TLLKGDWHSG 
YDPYAHRVAP QATPLATQLL HAVGVAHAAR LRGEDTVVMA MCGDGATSEG DFHEALNFAA 
VFRAPVVFFV QNNEYAISVP LARQTAAPSL AHKGVGYGVN AERVDGNDTP AVLAVLDRAV 
AAARAGEGPQ LVEAHTYRMQ AHTNADDATR YRTQEEVDPW EARDPLLRME AYLTRKRVLT 
KARKARIAED AEAVAAAMRE GVTRDTDPEP AELFAHVFAT PTPQLDEQAA FLADELSREG 
N