Gene Ndas_4871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4871
Symbol
ID	9248758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	1876
End bp	3363
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	74%
IMG OID
Product	putative short chain dehydrogenase
Protein accession	YP_003682760
Protein GI	297563787
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00534901
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.736841
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACA CGGGTACCCG GACGCTGCCG GAGGAGTCGG AGCACCCGGC GGAGCGGATC 
GACCCCGACC GGTTGGCCGC GTGCCTGGAC GTGATCGCCC GCGCCGGTGA GCTGCCCAGC 
GACCACCCGG ACTCGGTCGC CCTCCAGCGC GCGACCGCCC GCCTGTTCAA GAACGTCAAG 
GAGCGGCGCC GCAAGGAGCG CCAGGCCGCC CGCCAGGCCC ACGACAGGGC CGTGTTCGCG 
GCCACCGCCA CCGCGGCGCC GGACCGGATC GACGACGAGA CCAACGGCCG CGCCCTCACC 
AGCGGCAGCG GCGGCGCCCT CGCGGGCGTG CTGAGCAGGC CCCGGCCCTG CTACATCTGC 
AAGGAGAGGT ACCGGGAGGT CGACTCCTTC TACCACCAGC TGTGCCCCGC GTGCGCCGCG 
TTCAACAGGG AGCGCCGCAA CGCCCGCACC GACCTGACCG GGCGCCGGGC CCTGCTCACC 
GGCGGCCGGG CCAAGATCGG CATGTACATC GCACTCCGGC TGCTCAGGGA CGGCGCGCAC 
ACGACCGTCA CCACACGTTT TCCCAACGAC GCGGTGCGCC GGTTCGCCGC GATGCCCGAC 
AGCGGCGAGT GGCTGCACCG GCTGCGGGTG GTGGGCGTCG ACCTGCGCGA CCCCGCCCAG 
GTGCTGCGGC TGGCCGACGC GGTGGCCGAA CAGGGGCCGC TGGACATCCT CATCAACAAC 
GCGGCCCAGA CGGTGCGCCG TTCGCCCGGC TCCTACGGGC CGCTGGTCGA GGCCGAGGCC 
GAACCGCTCA CGGGCGAGGG CCTCCCCGAG CCGCTGGTGC TGGGCGGCGT GCGCCCGCGC 
GCCCTGGAGG ACCGCGCCGA CCCTGGGCGG GACGCCCCGG CGACCCACGC GCTCACTCCG 
GCCATGCTCA CCTCCCTGGC GCTGACCACG GGCTCCGCGT CGATGGAGAG GGTGCGCACC 
GGGACGGCGA TCGACGCCGG AGGGCTGGTG CCCGACCTGG CCCCGGTGAA CAGCTGGACG 
CGGCGGATCG GCGAGGTCGA CCCCGTCGAG ATGCTGGAGG TGCAGCTGTG CAACGTGAGC 
GCGCCGTTCC TGCTGGTGGA CCGGTTGCGC CCGGCCCTGG CCGCGTCCCC GGCGCGCCGC 
ACCTACATCG TCAACGTGTC GGCGATGGAG GGGGTGTTCG GCCGCGGCTA CAAGGGGCCG 
GGGCACCCCC ACACCAACAT GGCCAAGGCC GCGCTCAACA TGCTCACCCG CACCAGCGCC 
CAGGAGATGC TGGAGTCCGA CGGAATCCTG ATGACCAGCG TGGACACCGG GTGGATCACG 
GACGAGCGCC CGCACCCGGA GAAGGAGCGG CTGGTCGAGG CCGGGTTCCA CGCGCCCCTG 
GACCTGGAGG ACGGGGCCGC GCGCGTGTAC GACCCCATCG TGCGGGGCGA GCTGGGAGAG 
GACCTGCACG GGTGCTTCCT GAAGGACTAC GCCCCCGCCA ACTGGTAG

Protein sequence

MTDTGTRTLP EESEHPAERI DPDRLAACLD VIARAGELPS DHPDSVALQR ATARLFKNVK 
ERRRKERQAA RQAHDRAVFA ATATAAPDRI DDETNGRALT SGSGGALAGV LSRPRPCYIC 
KERYREVDSF YHQLCPACAA FNRERRNART DLTGRRALLT GGRAKIGMYI ALRLLRDGAH 
TTVTTRFPND AVRRFAAMPD SGEWLHRLRV VGVDLRDPAQ VLRLADAVAE QGPLDILINN 
AAQTVRRSPG SYGPLVEAEA EPLTGEGLPE PLVLGGVRPR ALEDRADPGR DAPATHALTP 
AMLTSLALTT GSASMERVRT GTAIDAGGLV PDLAPVNSWT RRIGEVDPVE MLEVQLCNVS 
APFLLVDRLR PALAASPARR TYIVNVSAME GVFGRGYKGP GHPHTNMAKA ALNMLTRTSA 
QEMLESDGIL MTSVDTGWIT DERPHPEKER LVEAGFHAPL DLEDGAARVY DPIVRGELGE 
DLHGCFLKDY APANW