Gene Ndas_1011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1011
Symbol
ID	9244857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1235995
End bp	1237152
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	74%
IMG OID
Product	oxidoreductase domain protein
Protein accession	YP_003678960
Protein GI	297559986
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00895095
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.937142
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGAGTC CCAGACCACC GATTCGCGTA GCCGTCGTCG GAAGCGGCGG TATCGCCCGG 
GGCAGGCACC TGCCCGCGCT CGCCGCCCTG GGGGACAGGG TCGAGGTGGT CGCGCTGGCC 
GACCCCGACG CCTCCCGCGT GGCCGCGACC GCCGACGAGT GGGGCGTTCC CGGACGCCAC 
ACCGGCCTCG ACGCCCTGCT GCGCGCCGAG TCCCCCGACC TGGTGATCGT GTGCACGCCG 
CCCGTCGCGC ACAAGGACGC GGTGATCACG GCCCTGGACG CCGGGTGCTG GGTGTGGTGC 
GAGAAGCCGC CGGCGCTGTC CCTGGCAGAG TACGACGAGG TCAGCACCCA CGAGGGAGGC 
GAATCCGGTC CCGGCGGCGG AGGCGGTCCC TTCGTCAGCT ACGTGTTCCA GCACCGGTTC 
GGCTCCGGCG CCGAGCGCCT GCGCCGCCAC CTGGCCGAGG GCACGCTCGG CCGTCCGCTC 
GTCGGCGTGT GCAACACCCT GTGGTTCCGC GCCCCGGACT ACTTCGAGGT CCCCTGGCGC 
GGACGCTGGG CGACCGAGGG CGGCGGCCCG AGCATGGGCC ACGGCATCCA CCAGATGGAC 
CTCATGCTCT CCCTGCTCGG CGACTGGTCC GAGGTCACGG CCGTGATGTC CACGACCGCC 
CGGTCCACCG AGACCGAGGA CGTGTCGATG GCGATCGTGC GCCTGGAGTC GGGCGCGACC 
GTCTCCGTGG CCAACAGCCT GCTCTCCCCC CGCGAGACCA GTTACCTGCG CTTCGACTTC 
GAGCACGCCA CGGTCGAGCT GGAGCACCTC TACGGCTACG ACAACGCGCA CTGGCGCTGG 
ACCCCCGCGC CGCACGTGCG CGACGCCGAC GCGGTCGCGT CCTGGCCGCC GGTGGAGGAC 
GAGCCGAGTT CGCACCGGGC CCAGCTCGCC GCGCTGCTCG ACGCGATGGA ACGCGGGGAG 
CGGCCCCGCG CCAGCGGCCC CGACGGGCGG CGCGCCCTCG AACTCGTCAC GGGCATGTAC 
CGGTCGGCCC TGACCGGCAC GACGGTGCGG CGCCGGGACC TGACCCCCGA CGACGGCTTC 
TACCACGCGA TGCACGGGGG CGACGCGGAC ACCGCCGCGG CCGTCCTCAC CAGGACGGAG 
GAGACCACAG GTGTCTGA

Protein sequence

MPSPRPPIRV AVVGSGGIAR GRHLPALAAL GDRVEVVALA DPDASRVAAT ADEWGVPGRH 
TGLDALLRAE SPDLVIVCTP PVAHKDAVIT ALDAGCWVWC EKPPALSLAE YDEVSTHEGG 
ESGPGGGGGP FVSYVFQHRF GSGAERLRRH LAEGTLGRPL VGVCNTLWFR APDYFEVPWR 
GRWATEGGGP SMGHGIHQMD LMLSLLGDWS EVTAVMSTTA RSTETEDVSM AIVRLESGAT 
VSVANSLLSP RETSYLRFDF EHATVELEHL YGYDNAHWRW TPAPHVRDAD AVASWPPVED 
EPSSHRAQLA ALLDAMERGE RPRASGPDGR RALELVTGMY RSALTGTTVR RRDLTPDDGF 
YHAMHGGDAD TAAAVLTRTE ETTGV