Gene Noca_2586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2586
Symbol
ID	4597134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2750524
End bp	2751903
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	72%
IMG OID	639777192
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_923777
Protein GI	119716812
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGAGA CCCGCACCGA CCGGCATGTC GTCCTCAACC CCGCGACCGC CGCGCCGGTC 
ACCGAGGTCC CGCTGGCGTC CCTGGCGGAT GCGGACGCCG CGATCGAGAG CGCGCATGCC 
GCGTTCCCGG CGTGGAGGGC GCTGCCCCCC GGTGAGCGCG CCGGCCTGCT CCGCCGCTTC 
GCGGCCGTCG TCGACGCACA CGTCGACGAG CTCGCCGAGC TGGAGGTCCG CAACGCCGGG 
CACACCTGGG GCAACGCCCG GTGGGAGGCC GGCAACGTCC GTGACTGCCT CAACTACTAC 
GCCGGCGCCC CGGAACGGCT CTTCGGCCGC CAGATCCCGG TGCCGGGCGG GGTCGACGTC 
ACGTTCCACG AGCCGCTCGG CGTCGTCGGG ATCATCGTGC CGTGGAACTT CCCGATGCCG 
ATCGCCGGCT GGGGCTTCGC TCCGGCCTTG GCGGCCGGAA ACACCGTCGT CCTGAAGCCG 
GCCGAGCTCA CACCGCTCAC CGCGCTCCGG ATCGGCGAGC TCGCCCTGGA GGCCGGACTG 
CCCGAGCACG TGCTGTCCGT GGTGGCCGGC AAGGGCTCGG TGGTGGGCGA GCGGTTCGTG 
ACCCATCCCC TGGTCCGCAA GGTGTGCTTC ACGGGCTCGA CCGAGGTCGG CAAGCGGATC 
ATGGCCGGCT GCGCCGAGCA GGTGAAGCGG GTGACGCTCG AGCTCGGCGG CAAGAGCGCC 
AACATCGTCT TCGCCGACGC CGACATCGAC GCGGCGGCCG CGAGCGCGCC GTACGCCGTC 
TTCGACAACG CCGGCCAGGA CTGCTGCGCC CGCTCGCGGA TCCTCGTGGA GCGCTCGGCC 
TATGACGAGT TCCTGAGCAA GCTCCAGCCG GCCGTGGAGG GCCTGCGGGT CCTCGATCCC 
GGTGACGAGG CCAGCGAGAT GGGCCCGCTC ATCTCGGCGC AGCAGAAGGC CGCGGTCACC 
GGCTACCTCG ACGAGGTCGA GGTCGCCTTC GCCGGGTCGG TCCCCGGCGG CCCTGTGGCC 
GAGGGCTTCT GGGTGCCGCC CTCGGTGGTC ACCGTCGACG ACCCCGCCAC CCGGATCTGG 
CGCGAGGAGG TCTTCGGGCC GGTCGTCGCG GTGATGCCCT TCGACGACGA CGCGGACGCC 
GTCGCGAAGG CGAACGACAC CGAGTACGGG CTGTCCGGCT CGATCTTCAC CAGCGACCTC 
GGCCGGGGTC TGCGGGTCGC CCGCGCCGTC GAGGCCGGCA ACCTCAGCGT GAACTCCCAC 
TCCTCCGTGC GGTACTGGAC CCCGTTCGGC GGCTACAAGC AGTCCGGGCT CGGGCGTGAG 
CTCGGCCCGG ACGCGCCGAT GGCGTTCACC GAGGAGAAGA ACGTCTTCAT TGCACACTAG

Protein sequence

MTETRTDRHV VLNPATAAPV TEVPLASLAD ADAAIESAHA AFPAWRALPP GERAGLLRRF 
AAVVDAHVDE LAELEVRNAG HTWGNARWEA GNVRDCLNYY AGAPERLFGR QIPVPGGVDV 
TFHEPLGVVG IIVPWNFPMP IAGWGFAPAL AAGNTVVLKP AELTPLTALR IGELALEAGL 
PEHVLSVVAG KGSVVGERFV THPLVRKVCF TGSTEVGKRI MAGCAEQVKR VTLELGGKSA 
NIVFADADID AAAASAPYAV FDNAGQDCCA RSRILVERSA YDEFLSKLQP AVEGLRVLDP 
GDEASEMGPL ISAQQKAAVT GYLDEVEVAF AGSVPGGPVA EGFWVPPSVV TVDDPATRIW 
REEVFGPVVA VMPFDDDADA VAKANDTEYG LSGSIFTSDL GRGLRVARAV EAGNLSVNSH 
SSVRYWTPFG GYKQSGLGRE LGPDAPMAFT EEKNVFIAH