Gene Noca_0523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0523
Symbol
ID	4596443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	552835
End bp	554175
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	639775137
Product	NADH dehydrogenase subunit D
Protein accession	YP_921752
Protein GI	119714787
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGACC AGGATCTCTA CTCCGGCTCC AGCGAGACGA CCGAGGGCCG GGTCTTCACC 
GTCACCGGGC AGGACTGGGA CTCGATCGCC GAGGGCCTGG CCGAGGACGA GGCGCAGGAG 
CGCATCGTCG TCAACATGGG CCCCCAGCAC CCTTCGACCC ACGGGGTGCT CCGGCTGATC 
CTCGAGCTCG AGGGCGAGAC GGTGACCGAG GCGCGGGCCG GCATCGGCTA CCTGCACACC 
GGCATCGAGA AGAACATGGA GTACCGCACC TGGACGCAGG GCGTGACGTT CTGCACCCGG 
ATGGACTACC TCAGCCCGTT CTTCAACGAG ATGACCTACG TGCTCGGGAT CGAGCGGCTC 
CTCGACATCG AGGACCGGGT GCCCGAGAAG GCCCAGGTCA TGCGGGTCCT GCTCATGGAG 
CTCAACCGGA TCTCCTCCCA CCTGGTCGCC ATCGCGACCG GTGGCATGGA GCTCGGTGCG 
CTGACCGTGA TGACGATCGG CTTCCGCGAG CGCGAGCTGG TGCTCGACCT GTTCGAGCTG 
ATCACCGGCC TGCGGATGAA CCACGCGTTC ATCCGTCCCG GTGGCGTCGC CCAGGACATG 
CCGCCGGGCG CGCTCGACGA GATCCGCGGC TTCGTGGCGC TGATGAAGAA GCGGTTGCCG 
GAGTACGCCG ACCTCTGCAA CGCGAACCCG ATCTTCAAGG GGCGCCTCGA GGGCATCGGC 
CACCTCGACC TCGCCGGCTG CCTGGCGCTC GGCCTCACCG GCCCGGTGCT GCGCAGCACC 
GGCTACCCGT GGGACCTGCG CAAGACCCAG CCGTACTGCG GCTACGAGAC CTACGACTTC 
GACGTCCAGA CGTGGGACAC CTCCGACTCC TACGGCCGGT TCCGCATCCG CTTGAACGAG 
ATGTGGGAGT CGCTGCGGAT CATCGAGCAG GCCGCCGACC GGCTGGCCGG TCTCGACGGC 
GCCCCGGTGA TGATCGAGGA CAAGAAGATC GGCTGGCCCA GCCAGCTTGC GATCGGCAGC 
GACGGCATGG GCAACAGCCT CGACCACATC CGCCACATCA TGGGTGAGTC GATGGAGGCG 
CTGATCCACC ACTTCAAGCT GGTCACCGAG GGCTTCCGGG TGCCGCCCGG CCAGGCCTAC 
GTGCCGGTGG AGTCCCCGCG TGGCGAGCTC GGCGCCCACG TCGTGTCCGA CGGCGGCACC 
CGCCCGTTCC GCGCGCACTT CCGCGACCCG TCGTTCACCA ACCTGCAGGC GACCAGCGTG 
ATGGCCGAGG GCGGCATGGT CGCCGACGTC ATCGTCGCGA TCGCGTCCAT CGATCCGGTC 
ATGGGAGGCG TCGACCGATG A

Protein sequence

MADQDLYSGS SETTEGRVFT VTGQDWDSIA EGLAEDEAQE RIVVNMGPQH PSTHGVLRLI 
LELEGETVTE ARAGIGYLHT GIEKNMEYRT WTQGVTFCTR MDYLSPFFNE MTYVLGIERL 
LDIEDRVPEK AQVMRVLLME LNRISSHLVA IATGGMELGA LTVMTIGFRE RELVLDLFEL 
ITGLRMNHAF IRPGGVAQDM PPGALDEIRG FVALMKKRLP EYADLCNANP IFKGRLEGIG 
HLDLAGCLAL GLTGPVLRST GYPWDLRKTQ PYCGYETYDF DVQTWDTSDS YGRFRIRLNE 
MWESLRIIEQ AADRLAGLDG APVMIEDKKI GWPSQLAIGS DGMGNSLDHI RHIMGESMEA 
LIHHFKLVTE GFRVPPGQAY VPVESPRGEL GAHVVSDGGT RPFRAHFRDP SFTNLQATSV 
MAEGGMVADV IVAIASIDPV MGGVDR