Gene Mflv_0428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_0428
Symbol
ID	4971504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	+
Start bp	445699
End bp	447177
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	68%
IMG OID	640454633
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_001131710
Protein GI	145221032
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0260686
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.349012
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAA GCACTGCCTT CAGAACCGAA TGGGACAAGT TGTTCATCGG CGGCAAGTGG 
GTCGAGCCGG CCTCCTCGGA GGTGATCGAG GTGCGCTCCC CCGCCACCGG TGACGTGGTC 
GGCAAGGTGC CGCTGGCCTC GGCCGCCGAC GTCGACGCCG CGTGCGCCGC CGCCCGCGAG 
GCCTTCGACA ACGGCCCGTG GCCGCAGATG TCGCCGACCG AGCGCGCCGA GGTGCTGGGC 
CGCGCCGTGA AGCTCATGGA GGAGCGCGCC GACGAGCTGA AGTTCCTGCT GGCCGCCGAG 
ACGGGGCAGC CGCCGACGAT CGTCGACATG ATGCAGTACG GCGCCGCGAT GTCGTCGTTC 
CAGTTCTACG CCGGCGCCGC CGACAAGTTC ACCTGGCAGG ACATCCGCGA CGGCGTGTAC 
GGCCAGACCC TGGTCGTGCG TGAGCCGGTC GGCGTGGTCG GCGCTGTCAC CGCGTGGAAC 
GTGCCGTTCT TCCTCGCCGC GAACAAGCTC GGCCCGGCGC TGCTGGCCGG CTGCACGGTG 
GTGCTGAAGC CTGCTGCCGA GACCCCGCTG TCGGTCTTCG CGATGGCCGA GATGTTCGTC 
GAGGCCGGCC TGCCCGAGGG CGTGCTGTCG ATCGTGCCCG GCGGTCCGGA GACCGGTCAG 
GCGCTGACCG CCAACCCGAA CCTGGACAAG TACACGTTCA CCGGGTCCTC GGGTGTGGGC 
AAGGAGATCG CGAAGATCGC CGCCGACAAG CTCAAGCCGT GCACCCTGGA GCTCGGCGGC 
AAGTCCGCCG CGATCATCCT CGAGGACGCC GACCTGGACT CGACGCTGCC GATGCTGGTG 
TTCTCGGGCC TGATGAACTC GGGCCAGGCG TGTGTCGGGC AGACCCGCAT CCTGGCGCCG 
CGTTCGCGCT ACGACGAGGT CATAGAGAAA CTCGGGGAAG CTGTCCGCAA TATGGCCCCG 
GGCCTGCCGG ACAACCCCGC CGCGATGATC GGCCCGCTGA TCAGCGAGAA GCAGCGCGAC 
CGCGTCGAGG GTTACATCAA GAAGGGCATC GAGGAGGGCG CGCGCGTCAT CACCGGTGGT 
GGCCGCCCCG AAGGCCTGGA CAGCGGCTGG TTCGTCGAGC CGACCGTCTT CGCCGACGTC 
GACAACTCGA TGACCATCGC GCAGGAGGAG ATCTTCGGAC CCGTCCTGTC GGTGATCCCC 
TACGAGGACG AGGACGACGC GGTCCGTATC GCCAACGACT CGGTGTACGG GCTGGCCGGT 
TCGGTGTACA CCACCGACAA CGACCGGGCG CTCAAGATCG CGCGGCGTAT CCGCACCGGC 
ACCTACGCGG TGAACATGTA CGCGTTCGAT CCGTGTGCCC CGTTCGGCGG TTACAAGAAC 
TCGGGCATCG GCCGGGAGAA CGGCTGGGAG GGCATCGAGG CCTACTGCGA GCAGAAGAGC 
ATCCTGCTGC CGTTCGGGTA CACCCCGCCG GCTTCCTGA

Protein sequence

MTQSTAFRTE WDKLFIGGKW VEPASSEVIE VRSPATGDVV GKVPLASAAD VDAACAAARE 
AFDNGPWPQM SPTERAEVLG RAVKLMEERA DELKFLLAAE TGQPPTIVDM MQYGAAMSSF 
QFYAGAADKF TWQDIRDGVY GQTLVVREPV GVVGAVTAWN VPFFLAANKL GPALLAGCTV 
VLKPAAETPL SVFAMAEMFV EAGLPEGVLS IVPGGPETGQ ALTANPNLDK YTFTGSSGVG 
KEIAKIAADK LKPCTLELGG KSAAIILEDA DLDSTLPMLV FSGLMNSGQA CVGQTRILAP 
RSRYDEVIEK LGEAVRNMAP GLPDNPAAMI GPLISEKQRD RVEGYIKKGI EEGARVITGG 
GRPEGLDSGW FVEPTVFADV DNSMTIAQEE IFGPVLSVIP YEDEDDAVRI ANDSVYGLAG 
SVYTTDNDRA LKIARRIRTG TYAVNMYAFD PCAPFGGYKN SGIGRENGWE GIEAYCEQKS 
ILLPFGYTPP AS