Gene Mlut_20000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlut_20000
Symbol
ID	7985210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Micrococcus luteus NCTC 2665
Kingdom	Bacteria
Replicon accession	NC_012803
Strand	+
Start bp	2157249
End bp	2158793
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	69%
IMG OID	644806940
Product	5-carboxymethyl-2-hydroxymuconate semialdehyde dehydrogenase
Protein accession	YP_002958028
Protein GI	239918470
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR02299] 5-carboxymethyl-2-hydroxymuconate semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGAGA AGACCAGCAT CGAGGCCCGC ACGCCCGAGG GCCTGCCCGA CGTCCTGCGC 
CACTACATCG ACGGCGAGTT CGTCGACTCG ATCGACGGCG ACACCTTCGA GGTGCTCGAC 
CCGGTGACCA ACGAGCCGTA CCTGACGGCC GCCTCCGGCA AGGCCGCGGA CATCGACCGC 
GCCGTCGCCG CCGCGAAGCG GGCCTTCAAG TCCGGCGAGT GGTCCCAGGC CCTGCCGCGC 
CAGCGCTCCC GCGTGCTGCA CCGGATCGCC GACATCATGG AGACCCGCGG CGACCAGCTG 
GCCGAGATGG AGTGCTTCGA CACCGGCCTG CCGATCAAGC AGGCGAGGGG CCAGGCCGCC 
CGCGCCGCCG AGAACTTCCG CTTCTTCGCG GACCTGATCG TGGCCCAGCA CGACGACACC 
TTCAAGGTGC CGGGCCGCCA GATCAACTAC GTGAACCGCA AGCCGATCGG CGTCGCCGGC 
CTGATCACCC CGTGGAACAC CCCGTTCATG CTGGAGTCCT GGAAGCTGGC CCCGGCCATC 
GCCACCGGCA ACTCGGTGGT CCTGAAGCCG GCGGAGTTCA CCCCGCTCTC GGCCTCCCTG 
TGGGGCGGGA TCTTCGAGGA GGCCGGCCTG CCCCAGGGCG TGTTCAACAT GGTGCACGGC 
TTCGGCGAGG AGGGCTACGC GGGCGACCCG CTCGTGAAGC ACCCGGACGT GCCGCTGATC 
TCCTTCACCG GCGAGTCCCG CACCGGCCAG ATCATCTTCG CCAACGCCGC CCCGCACCTG 
AAGGGCCTGT CCATGGAGCT CGGCGGCAAG TCCCCGGCCG TGGTGTTCGA GGACGCGGAC 
CTGGACGCGG CGATCGACGC GACCATCTTC GGCGTGTTCT CCCTGAACGG CGAGCGCTGC 
ACCGCCGGCT CCCGCATCCT GGTCCAGCGT TCCGTCTACG ACGAGTTCGT GGAGCGCTAC 
GCCGCCCAGG CCTCCCGCGT GAAGGTCGGC CTGCCGAACG ACGAGACCAC CGAAGTCGGC 
GCCATCGTGC ACCCGGAGCA CTTCGAGAAG GTCATGTCCT ACGTGGAGAT CGGCAAGACC 
GAGGCCCGCC TGGTGGCCGG CGGCGGCCGC CCGGAGGGCT TCCCCGAGGG CAACTTCGTG 
CAGCCCACCG TGTTCGCGGA CGTGGCCCCG GACGCCCGGA TCTTCCAGGA GGAGATCTTC 
GGCCCGGTCG TGGCCATCAC CCCCTTCGAC ACGGAGGAGG AGGCCCTGCA GCTGGCCAAC 
AACACCAAGT ACGGTCTGGC CGCCTACATC TGGACCAACG ACCTCAAGCG CGCCCACAAC 
GTCGCGCAGA ACGTGGAGGC CGGCATGGTG TGGCTCAACT CCAACAACGT GCGGGACCTG 
CGCACCCCGT TCGGCGGGGT GAAGGCCTCC GGCCTGGGCC ACGAGGGCGG CTACCGCTCG 
ATCGACTTCT ACACCGATCA GCAGGCCGTG CACATCAACC TCGGCGAGGT CCACAACCCG 
GTGTTCGGCA AGCAGGAGCA GGCCGCGGCG AAGATCGACG GCTGA

Protein sequence

MTEKTSIEAR TPEGLPDVLR HYIDGEFVDS IDGDTFEVLD PVTNEPYLTA ASGKAADIDR 
AVAAAKRAFK SGEWSQALPR QRSRVLHRIA DIMETRGDQL AEMECFDTGL PIKQARGQAA 
RAAENFRFFA DLIVAQHDDT FKVPGRQINY VNRKPIGVAG LITPWNTPFM LESWKLAPAI 
ATGNSVVLKP AEFTPLSASL WGGIFEEAGL PQGVFNMVHG FGEEGYAGDP LVKHPDVPLI 
SFTGESRTGQ IIFANAAPHL KGLSMELGGK SPAVVFEDAD LDAAIDATIF GVFSLNGERC 
TAGSRILVQR SVYDEFVERY AAQASRVKVG LPNDETTEVG AIVHPEHFEK VMSYVEIGKT 
EARLVAGGGR PEGFPEGNFV QPTVFADVAP DARIFQEEIF GPVVAITPFD TEEEALQLAN 
NTKYGLAAYI WTNDLKRAHN VAQNVEAGMV WLNSNNVRDL RTPFGGVKAS GLGHEGGYRS 
IDFYTDQQAV HINLGEVHNP VFGKQEQAAA KIDG