Gene Noca_0086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0086
Symbol
ID	4600059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	96812
End bp	98341
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	73%
IMG OID	639774697
Product	aldehyde dehydrogenase
Protein accession	YP_921319
Protein GI	119714354
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.932272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGGAT CCGAGACCCC GGACGACCGC CAGCCGCCCG CGACGGTGGA GCTGATGGCA 
CGAGCCGCGG CCGACGCATT CCCCGCCTGG TCGGCGACGC CTCCCCGGCA GCGTGCCTCC 
GCGCTGTCGG CGGTGGCGGA CGCCGTCGCG ACCGCAGGCC CGGAGCTGAT CGCCACCGCC 
ATGTCCGAGA CCGGTCTGCC GGAGGCGCGG CTCACCGGTG AGCTGAACCG CACGGTCGTC 
CAGATCCGCC TGTTCGCCGA CATCGTCGTC GACGGCGCCT ACCTCGACGT GCGCATCGAC 
GAGGCGGACG ACGACTTCGT CCTGGACAGC CGACCGGACC TGCGCCGCTA CCACGTGCCG 
GTCGGACCCG TGCTGAACTT CGCCGCGAGC AACTTCCCCT TCGCGTTCTC GGTCATCGGA 
GGCGACACCG TCTCGGCGCT GGCTGCCGGG TGCCCGGTCG TCGTCAAGGC GCACCCGGGA 
CACCTGGAGC TGTCGAGGCA GACCGCCGCC GTCGTCCGCG CTGCCCTCAC CGGAAGCGGT 
GCGCCCGACG CGACACTCCA GCTGCTGGTC GGGCAGGAGC AGGGCGTGGC GATGCTGCTC 
GACCCGCGCA TCCGTGCCGC CAGCTTCACG GGCTCGACCC GGGCCGGCCG CATGCTGGCC 
GATCTCGCCC TGGGCCGGCC GGCACCGATC CCCTTCTACG GCGAGCTCGG GAGCGTGAAC 
CCGGCGTTCG TCACGTCCGA GGCAGCGGCC CAGCACGGTG CGGCGATCGC GCAGGGATTC 
CTCACGAGCG TGTGCGGGTC CGCCGGCCAG CTGTGCACCA AGCCGGGCTT CCTCTTCGTG 
CCCCGCGGGA GCGGCGTCAC GGCCGATGTC GCGCAAGCGG CTGGTGCGGT GGTCGAACAG 
CGTCTTCTCA ACCCGTCCAT CACCGCTGGC TACACCGCGC GGCGGGACGC CATCCTCGGG 
ACGCCCGGGG TTCGCGCTCT CGCCGTGGGG GACGTACGTG TCGACGGCGA CGGACAGGGC 
TGGGCGACAC CGACGTTGGT GGCGACCGAT GTCGCGACGC TCCACCACCA CCGTGAGTCG 
CTGCTCGACG AGGCGTTCGG CCCACTGTCG GTCGTCGTGG AGTACGACGA CGAGGCAGGG 
CTGCCCGGAG TCGCCGACGA GCTGTTCGAG GGCAACCTCA CCAGCACCAT CCATGCGGGT 
GACGGTGAGG ACACGCCCAC GTTGCGCGCT CTCGTCGACT GGGCCGCGCG GACCACCGGC 
CGCATCGTCT TCGGGGGTTG GCCGACCGGC GTGTCCGTGA CTCATGCGAC CCAGCACGGG 
GGGCCCTGGC CGGCGACGAC GAACGACGCC GGGACGTCGG TTGGGAGCGC GGCCATCGGG 
AGGTTTCTGC GCGCCGTCGC CTACCAGGAC ACGCCGCAAG CACTGCTTCC GGCGCCGTTG 
CGCGACGACA ACCCGTGGGG TGTGCCGCAG CTGCGCTCGC CCGCCGGTCG GTCGCGGAGC 
TGGGGCGAGG CGTTCCGCGT CGACGGGTGA

Protein sequence

MDGSETPDDR QPPATVELMA RAAADAFPAW SATPPRQRAS ALSAVADAVA TAGPELIATA 
MSETGLPEAR LTGELNRTVV QIRLFADIVV DGAYLDVRID EADDDFVLDS RPDLRRYHVP 
VGPVLNFAAS NFPFAFSVIG GDTVSALAAG CPVVVKAHPG HLELSRQTAA VVRAALTGSG 
APDATLQLLV GQEQGVAMLL DPRIRAASFT GSTRAGRMLA DLALGRPAPI PFYGELGSVN 
PAFVTSEAAA QHGAAIAQGF LTSVCGSAGQ LCTKPGFLFV PRGSGVTADV AQAAGAVVEQ 
RLLNPSITAG YTARRDAILG TPGVRALAVG DVRVDGDGQG WATPTLVATD VATLHHHRES 
LLDEAFGPLS VVVEYDDEAG LPGVADELFE GNLTSTIHAG DGEDTPTLRA LVDWAARTTG 
RIVFGGWPTG VSVTHATQHG GPWPATTNDA GTSVGSAAIG RFLRAVAYQD TPQALLPAPL 
RDDNPWGVPQ LRSPAGRSRS WGEAFRVDG