Gene Mjls_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_2042
Symbol
ID	4877763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	2151494
End bp	2152861
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	70%
IMG OID	640139340
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_001070320
Protein GI	126434629
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.57203
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTCCA GTGAGGTGAT CAACCCGGCG ACCGAGGAGG TGCTGCGGAC CGTCGACCTG 
CTCGACGTCG GCGGCGTCGA CGACGCGGTG GCGCGGGCGA AGTCGGCGCA GCGCACGTGG 
GCACGGCTCG CGCCGGCCGA ACGCGCCGCC GCGCTGCGCT CGTTCGCCGC GGTGGTCGAC 
GCGCACATCG ACGAGCTGGC CGCACTGGAG GTCGCCAACT CCGGACACCC CATCGGCAGC 
GCCGAGTGGG AGGCCGGCCA CGTCCGCGAC GTCCTGCAGT TCTATTCGGC GAGCCCGGAA 
CGGTTGTCCG GTAAGCAGAT CCCGGTGGCG GGCGGTCTGG ACGTCACGTT CAACGAGCCC 
CTCGGCGTGG TCGGCGTGAT CACCCCGTGG AACTTCCCGA TGACGATCGC GGCGTGGGGT 
TTCGCGCCCG CGCTCGCCGC GGGCAACGCG GTGGTGCTCA AACCCGCCGA GTGGACGCCG 
CTGACCTCCA TCCGCCTCGG TGAACTCGCG GTGGAGGCGG GCCTGCCCGC CGATCTGTTC 
CAGGTGCTGC CCGGGCGGGG GTCGGTGGTC GGCGAGCGCT TCGTCACCCA TCCCGACGTG 
CGCAAGATCG TGTTCACCGG GTCCACCGAA GTGGGCACCC GGGTGATGGC CGGTGCCGCC 
GCACAGGTCA AGCGGGTCAC GCTGGAGTTG GGCGGTAAGA GCGCCAACAT CGTCTTCGAC 
GACTGCGATC TGGAGAAGGC CGCCGCCACC GCGCCCTACG GGGTCTTCGA CAACGCCGGG 
CAGGACTGCT GTGCGCGCAG CCGGATCCTG GTGCAGCGCA ACGTCTACGA CCGGTTCATG 
GAACTGCTCG AACCCGCCGT CAAGGGCGTC AAGGTCGGCG ACCCGGCGGC GCGCGACACC 
GAGATGGGCC CGCTGGTGAG CAAGAAGCAC TGGCAGTCGG TGGCGTCCTA CGTGTCCGAC 
GACGCGCCCG TCGCCTTCCG CGGCACCGCA CCCGAGGGCC GCGGCTACTG GTTCGCGCCG 
ACGGTGCTCA CCCCGCAGCG CACCGACCGC ACCGTCACCG AGGAGATCTT CGGACCCGTG 
GTGACGGTCC TGCCGTTCGA CGACGAGGCC GATGCCGTCG CGCTCGCCAA CGACACCCCC 
TACGGACTGT CGGGCTCCAT CTGGACCGAG AATCTGTCAC GGGCGGTGCG GGTCTCCCGC 
GCACTGGAAT CGGGGAACCT GTCGGTCAAT TCGCATTCCT CGGTCCGGTA CAACACCCCG 
TTCGGCGGGT TCAAACAGTC CGGACTGGGC CGCGAACTCG GGCCCGACGC CCCGTTGTCG 
TTCACCGAAA CCAAGAACGT GTTCTTTGCC GTGCAGGAGG CACCCTGA

Protein sequence

MTSSEVINPA TEEVLRTVDL LDVGGVDDAV ARAKSAQRTW ARLAPAERAA ALRSFAAVVD 
AHIDELAALE VANSGHPIGS AEWEAGHVRD VLQFYSASPE RLSGKQIPVA GGLDVTFNEP 
LGVVGVITPW NFPMTIAAWG FAPALAAGNA VVLKPAEWTP LTSIRLGELA VEAGLPADLF 
QVLPGRGSVV GERFVTHPDV RKIVFTGSTE VGTRVMAGAA AQVKRVTLEL GGKSANIVFD 
DCDLEKAAAT APYGVFDNAG QDCCARSRIL VQRNVYDRFM ELLEPAVKGV KVGDPAARDT 
EMGPLVSKKH WQSVASYVSD DAPVAFRGTA PEGRGYWFAP TVLTPQRTDR TVTEEIFGPV 
VTVLPFDDEA DAVALANDTP YGLSGSIWTE NLSRAVRVSR ALESGNLSVN SHSSVRYNTP 
FGGFKQSGLG RELGPDAPLS FTETKNVFFA VQEAP