Gene Noca_4289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4289
Symbol
ID	4596804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4530345
End bp	4531850
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	72%
IMG OID	639778896
Product	NADH dehydrogenase
Protein accession	YP_925473
Protein GI	119718508
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.179373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGGCA CCGAGGCCCG GCCGGTCGAA GCCGCGGCGG CGCAGCACCG GCACCGGGTG 
GTCGTCATCG GATCCGGGTT CGGAGGGCTG TTCGGGACCA AGGCACTGCG CCGGGTCGAC 
GTGGACGTGA CGATGGTCGC GAAGACCACG CACCACCTGT TCCAGCCGCT GCTCTACCAG 
GTCGCGACCG GGATCCTCAG CCAGGGCGAG ATCGCGCCGC CCACCCGCGA GGTCCTCAGC 
AGTCAGCGGA ACGTCACCGT GCTGCTGGGC GAGGTCAGCG GGATCGACCT CGCCGCGCGG 
ACCGTCACCT CCCAGGTCCT GGGCCGTCCG ACGGTGACGC CGTACGACTC CCTGATCGTG 
GCCGCGGGCG CCGGCCAGTC CTACTTCGGC AACGACCAGT TCGCCGAGTA CGCGCCCGGG 
ATGAAGAGCA TCGACGACGC GCTCGAGCTG CGCGGCCGGA TCTTCGGCGC CTTCGAGCTG 
GCCGAGCTCG GGGCCGCGCG CGGCGACCAC ATCGACCACC TGCTCACGTT CGTGGTGGTC 
GGCGCCGGCC CGACGGGCGT GGAGATGGCC GGGCAGATCG CCGAGCTCGC GCACCGCACC 
CTGCGCAAGG ACTTCCACCA CATCAACACC CGCACCGCCC GGGTGATCCT CGTCGACGCC 
GCCCCGCAGG TGCTGCCGCC GTTCGGGGCG AAGCTCGGGG CGAAGACCAA GACCGAGCTG 
GAGAAGCTCG GCGTCGAGGT GGTGCTCGGC GCGATGGTGA CCGACGTCGA CGAGCGCGGC 
ATCGAGATGA AGTTCAAGGA CGGCCGGGTC GAGCGGGTCG ACACCGTCAC CAAGATCTGG 
GCCGCGGGGG TCCAGGCCAG CCCGCTGGGC CGCACCCTCT CCGAGCAGAC CGGCGCGCCC 
CTCGACCGGG CCGGCCGGAT CGCCGTCAAC CCCGACCTGA CCCTGCCCGG GCACCCCGAG 
GTGTTCGTGG TCGGCGACAT GATCGCCCTG GACAACCTCC CCGGCGTCGC GCAGGTCGCG 
ATCCAGGGAG CGAGGTACGC CGCCGAGGAG ATCGAGCGGC GGCTGCGGTC CAAGCCCTCG 
CAGGGGCCGT TCAAGTACTT CGACAAGGGT TCGATGGCGA TCATCAGCCG GTTCCGCGCG 
GTCGCGATGA TCGGCCGGGT CCGGGTCACC GGGGTGCTCG CCTGGCTGAT GTGGCTGGGC 
CTGCACCTGG TGTACATCAC CGGCTTCAAG AGCCGGGTCA CGGCGCTGCT GCACTGGGCG 
GTCTCGTTCG TCGGCCGCGG CCGGGCCGAG CGGACGACCA CCGAGCAGCA GATCTTCGCG 
CGCAGCGCGC TCGGCCGGCT CGAGCACGGC GCCGCCGACC TGGTCTCCGA CCCCGGGGCG 
TACGACGCCA CCCGGGAGCT GCTCGAGACC ACGCGCCGGG CCGAGCTCGA GGCGCAGGCC 
CTCGAGGAGG CGCGGCTCAC CGATGCCGGC GAACGGGGCG TGAGGACCGG CGACCGCGCC 
GGCTGA

Protein sequence

MAGTEARPVE AAAAQHRHRV VVIGSGFGGL FGTKALRRVD VDVTMVAKTT HHLFQPLLYQ 
VATGILSQGE IAPPTREVLS SQRNVTVLLG EVSGIDLAAR TVTSQVLGRP TVTPYDSLIV 
AAGAGQSYFG NDQFAEYAPG MKSIDDALEL RGRIFGAFEL AELGAARGDH IDHLLTFVVV 
GAGPTGVEMA GQIAELAHRT LRKDFHHINT RTARVILVDA APQVLPPFGA KLGAKTKTEL 
EKLGVEVVLG AMVTDVDERG IEMKFKDGRV ERVDTVTKIW AAGVQASPLG RTLSEQTGAP 
LDRAGRIAVN PDLTLPGHPE VFVVGDMIAL DNLPGVAQVA IQGARYAAEE IERRLRSKPS 
QGPFKYFDKG SMAIISRFRA VAMIGRVRVT GVLAWLMWLG LHLVYITGFK SRVTALLHWA 
VSFVGRGRAE RTTTEQQIFA RSALGRLEHG AADLVSDPGA YDATRELLET TRRAELEAQA 
LEEARLTDAG ERGVRTGDRA G