Gene Noca_4626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4626
Symbol
ID	4596082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4904236
End bp	4905732
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	72%
IMG OID	639779235
Product	methylmalonate-semialdehyde dehydrogenase [acylating]
Protein accession	YP_925808
Protein GI	119718843
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.228991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACGA CAATCCCGCA CTGGATCGAC GGCCTCCCGC AGCCGGGCGC GGCCACCCGC 
CTCGGCGACG TCACCAACCC CGCCACCGGA CAGGTGACCG GCCAGGTGGT CCTCGCGGAC 
GGCGCCGACG TCGACGCCGC GGTCGCCTCG GCGAAGACGG CGTCGACCGC CTGGGCGCGG 
ACCTCGATCA GCGCCCGCAC CCAGGTGGTG TTCCGGTTCC GCGAGCTGCT CAACGAGCGG 
AAGGCCGAGC TGGCCGCGAT CATCACCGCC GAGCACGGCA AGGTGCTCTC GGACGCACTG 
GGCGAGGTGT CCCGCGGCCA GGAGGTGGTC GAGTTCGCCT GCGGCATCCC GCACCTGCTC 
AAGGGCGGCA ACAGCCCCCA GGTCTCGACC GGCGTCGACG TGCACAGCAT CCGCCAGCCC 
CTCGGCGTGG TCGGCATCAT CAGCCCGTTC AACTTCCCCG CGATGGTCCC GATGTGGTTC 
TTCCCGATCG CGATCGCGGC CGGCAACGCG GTCGTGCTCA AGCCCAGCGA GAAGGACCCC 
TCCGCCGCGA TCTGGATGGC CCGGCTCTGG CAGGAGGCCG GCCTGCCCGA CGGCGTCTTC 
ACGGTGCTGC AGGGCGACAA GGTCGCCGTG GACGGGCTGC TCGACCACCC GGACGTCGCG 
GCGATCAGCT TCGTCGGCTC CACCCCGATC GCGGAGTACG TCTACGAGCG GGCGAGCCGC 
ACCGGCAAGC GGGTGCAGGC CCTGGGCGGG GCGAAGAACC ACATGGTGGT GCTGCCCGAC 
GCCGACCTCG ACCTGGCCGC CGATGCCGCG GTCAGCGCCG GCTACGGATC GGCCGGCGAG 
CGGTGCATGG CGATCAGCGT GGTCGTCGCG GTCGGCGGCA CCGGCGACGA CCTGGTCGAG 
CGGATCGCTG CACGCACCAC CGGGCTCCGC GTCGGCGACG GCACCCGCGA GTCGGACATG 
GGGCCGCTGG TGACCGCGGC GCACCGCGAC AAGGTGGCGT CGTACGTCGA CGCCGGCGAG 
GCCGAGGGCG CCGCCCTCGT CGTCGACGGG CGCAAGGTCG ACGCGGACGG CGAGCAGGAC 
GGGCACTGGC TCGGACCGAC GCTGTTCGAC CACGTCACCC CGCAGATGAG CATCTACACC 
GACGAGATCT TCGGCCCGGT GCTGAGCGTG GTCCGCGCCG AGACCTACGC GGAGGCGATC 
GAGCTGGTCA ACGCGAACCG CTACGGCAAC GGCACCGCGA TCTTCACCGG CAACGGCGGC 
GCCGCCCGCG CCTTCGAGCA GGACGTCGAG GTCGGCATGA TCGGCGTGAA CGTCCCGATC 
CCGGTCCCGA TGGCGTACTA CTCCTTCGGC GGCTGGAAGG CCTCGCTGTT CGGCGACACC 
CACGCCCACG GCATCGAGGG CGTGCACTTC TTCACCCGGG GCAAGGTCGT CACCACCCGC 
TGGCCCGACC CCGGCAGCGC CGGCGGCCTC GAGCTGGCCT TCCCGAAGAA CCACTGA

Protein sequence

MTTTIPHWID GLPQPGAATR LGDVTNPATG QVTGQVVLAD GADVDAAVAS AKTASTAWAR 
TSISARTQVV FRFRELLNER KAELAAIITA EHGKVLSDAL GEVSRGQEVV EFACGIPHLL 
KGGNSPQVST GVDVHSIRQP LGVVGIISPF NFPAMVPMWF FPIAIAAGNA VVLKPSEKDP 
SAAIWMARLW QEAGLPDGVF TVLQGDKVAV DGLLDHPDVA AISFVGSTPI AEYVYERASR 
TGKRVQALGG AKNHMVVLPD ADLDLAADAA VSAGYGSAGE RCMAISVVVA VGGTGDDLVE 
RIAARTTGLR VGDGTRESDM GPLVTAAHRD KVASYVDAGE AEGAALVVDG RKVDADGEQD 
GHWLGPTLFD HVTPQMSIYT DEIFGPVLSV VRAETYAEAI ELVNANRYGN GTAIFTGNGG 
AARAFEQDVE VGMIGVNVPI PVPMAYYSFG GWKASLFGDT HAHGIEGVHF FTRGKVVTTR 
WPDPGSAGGL ELAFPKNH