Gene Ndas_1731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1731
Symbol
ID	9245581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2103337
End bp	2104854
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	72%
IMG OID
Product	NADH/Ubiquinone/plastoquinone (complex I)
Protein accession	YP_003679665
Protein GI	297560691
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.494392
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCCG TTCTCCTGCC CGTGCTGGTC GCGGTTCCCC TCCTGACCGC CGCGCTGCTG 
GTGCTGCCCC TCGCACGCGG GGTGGCCCGC GCCCTGTTCC TGGGGACCAG CGCCTTCGCG 
CTCGCCGCCG GTGCCGTACT GGTCTGGTGC ACGCGGGAGG GACAGGTACA CGCCCACCAG 
GTGGGTCTGT GGCCCGCCGG GGTGTCCATC CCCTTCGTCG CCGACACCTT CAGCGCGCTG 
ATGGTCACCA CCACCGCCCT GTTGGTGCTG GTGTGCTCGG CCTTCGCCGT GGCCACCGGC 
GAGGCCGGTC GGCGCTTCTT CCCGTCCCTG GTGCTGGTGC TGTCCGCCGG GGTGTACGGA 
GCGCTGCTCA CGGGCGACCT GTTCAACCTC TTCGTGTTCG TCGAGGTGAT GCTGCTGCCC 
TCCTACGGGC TGATGGCCAT CGCCGGGACC CTGCGCGGCC TGCGGGGCGG ACGGACCTAC 
GTCGCGGTCA ACCTGCTCAC CTCGACCGTG TTCCTGGCCG GTGTCGCCCT GGTCTACGGC 
ACCGCCGGAA CCGTGCAGCT CGGCGAACTC GCGGGCGCCG CCCAGGAGTC GCCCGTGGTC 
GCGGCCGCCA TGGGCGTGGT GCTGCTGGCG ATGTCGGTCA AGGCCGCCGT CGTGCCGGTG 
CACGGCTGGC TGGCGCGCAC CTACACCGCG CCCTCCCCGG CGGTGACCGC CCTGTTCTCC 
GGTCTGCACA CCAAGGTCGC CATCTACGCG ATCTACCGCC TCTACGCGGT GGTCTTCGGC 
GGCGAGTCCT CGCTGCTGTG GGTGGGCCTG GTGCTGTTCG GCGCGACCAT GCTGATCGGG 
GTCCTGGGCG CGGTGGGGGA GGACACCACC CGCTCGATCC TGGTCTTCCA CATGGTCAGC 
CAGATCGGCT ACATCCTCCT CGGCGTCGCC CTGTTCACCG AACTGGGACT GATGGCGGGC 
ATCTTCTACC TCATCCACCA CATGGTGGTG AAGGCGTCCC TGTTCCTGTC CACCGGCGCG 
ATCGAGCACG TCCACGGCAC CGGCAGACTC GACCGGCTGG GAGGCGTGGC CCGCCGGGAA 
CCGCTGCTGG CCCTGGCCTT CCTGGGCGCG GCCCTGTCCC TGGCCGGACT GCCGCCCTTC 
TCCGGGTTCG TCGCCAAGCT CACCCTGGTC GCCGCCGCCT TCGCCGACGG CCAGTGGGCG 
GTCGCCGCCG TCGCCGTCGC CGTCAGCCTC ATCACCCTGA TGTCGATGCT CAAGATCTGG 
GGCTCGGTGT TCTGGGGCCC CGACCCGGGC TCCGGTCCCG AACCCGGGGG CGGACGGTCG 
GCGCAGGGGA GCGGGACGGT CACCGCGCCC CCGGCCGCCA CGAGGATCCG CGCGGGCCTG 
GTGCTGCCCG CGGCGGCGCT GACCGGCGTC ACCCTGTGCG TCGGCCTGGG CGCCCAGGTC 
CTGCTCGGCC TGAGCGCCCA GGCCGCGGCC CATCTGCTGG ACACCTCCAC CTACGTCGAG 
GCGGTGACGA ACCGATGA

Protein sequence

MIPVLLPVLV AVPLLTAALL VLPLARGVAR ALFLGTSAFA LAAGAVLVWC TREGQVHAHQ 
VGLWPAGVSI PFVADTFSAL MVTTTALLVL VCSAFAVATG EAGRRFFPSL VLVLSAGVYG 
ALLTGDLFNL FVFVEVMLLP SYGLMAIAGT LRGLRGGRTY VAVNLLTSTV FLAGVALVYG 
TAGTVQLGEL AGAAQESPVV AAAMGVVLLA MSVKAAVVPV HGWLARTYTA PSPAVTALFS 
GLHTKVAIYA IYRLYAVVFG GESSLLWVGL VLFGATMLIG VLGAVGEDTT RSILVFHMVS 
QIGYILLGVA LFTELGLMAG IFYLIHHMVV KASLFLSTGA IEHVHGTGRL DRLGGVARRE 
PLLALAFLGA ALSLAGLPPF SGFVAKLTLV AAAFADGQWA VAAVAVAVSL ITLMSMLKIW 
GSVFWGPDPG SGPEPGGGRS AQGSGTVTAP PAATRIRAGL VLPAAALTGV TLCVGLGAQV 
LLGLSAQAAA HLLDTSTYVE AVTNR