Gene Ndas_3462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3462
Symbol
ID	9247331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4150881
End bp	4152029
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	69%
IMG OID
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_003681370
Protein GI	297562396
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCCC TTGTGTACAA CGGATCCCGC GATGTCTCCG TCAAGGAGGT CCCTGACGCC 
CGGATCGAGC GTCCCACCGA CGTGCTCGTG CGCATCACCG CCACCAACAT CTGCGGTTCC 
GACCTGCACA TGTACGAAGG ACGCACCGAC CTGGAGCCCG GCAAGGTGCT CGGGCACGAG 
AACCTCGGCG TGGTCGCCGA GGTCGGCGAC GGCGTGGAGC GCGTCAAGGT CGGCGACCAC 
GTGTGTCTGC CGTTCAACAT CGGCTGCGGG TTCTGTCGCA ACTGCGAGAC CGGCATGCCC 
TCCTACTGCC TGACGGCCAA CCCCGACCCG GAGATGGCCG GGGCCGCCTA CGGCTTCGCC 
GGGATGGGCC CCTACTCCGG CGGGCAGGCC GAGTACCTGC GCGTGCCGTT CGGGGACTTC 
AACTGCCTGC GGCTGCCCGA GGACGCGGAG GAGAAGGAGG ACGACTACGT GATGGTCGCC 
GACATCTTCC CCACCGGCTG GCACGCCACC CGCCTGGCCG GGCTCAAGCC GGGGGAGTCC 
TGCGTCGTCT ACGGCGCGGG TCCGGTCGGC CTGATGGCGG CCTACTCCGC GCTGCTCCAA 
GGGGCGTCCC AGGTGATGGT GGTCGACCGC CACCCCGACC GGCTGCGCCT CGTGGAGAGG 
ATGGGGGCGA TCGCCGTGGA CGACTCCAAG GGCGACCCGG TCGAGCAGAT CCTCAACCTC 
ACCGACGGCC GCCGCGCGGA CTGCGGCTGC GAGTGCGTCG GCTACCAGGC CCACGACCAT 
CTCGGTGTCG AGCACCCCGA GATGACCATG AACAACCTGG TCAAGTCGGT GAAGTTCACC 
GGCGGCATCG GCGTCGTGGG CATCTTCCTG CCCTCCGACC CCGGAGCGTC GGACGAGATG 
GCCCGCAACG GTCGGCTCAC CTTCGACATG GGGACGTTCT GGTTCCAGGG CCAGAAGATC 
GGTACCGGCC AGGCGCCGGT GAAGGCCTAC AACCGGCAAC TGCGGGACAT GATCCACCGG 
GACCGCGCGA AGCCGTCCTT CATCGTGTCC CACGACCTGC CTCTGCAGCG GGCACCGGAG 
GCCTACGAGC ACTTCGACAA CCGCGAGGAC GGCTGGACCA AGGTGGTGCT CAAGCCCGCG 
CTGGCGTGA

Protein sequence

MKALVYNGSR DVSVKEVPDA RIERPTDVLV RITATNICGS DLHMYEGRTD LEPGKVLGHE 
NLGVVAEVGD GVERVKVGDH VCLPFNIGCG FCRNCETGMP SYCLTANPDP EMAGAAYGFA 
GMGPYSGGQA EYLRVPFGDF NCLRLPEDAE EKEDDYVMVA DIFPTGWHAT RLAGLKPGES 
CVVYGAGPVG LMAAYSALLQ GASQVMVVDR HPDRLRLVER MGAIAVDDSK GDPVEQILNL 
TDGRRADCGC ECVGYQAHDH LGVEHPEMTM NNLVKSVKFT GGIGVVGIFL PSDPGASDEM 
ARNGRLTFDM GTFWFQGQKI GTGQAPVKAY NRQLRDMIHR DRAKPSFIVS HDLPLQRAPE 
AYEHFDNRED GWTKVVLKPA LA