Gene Mflv_4919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_4919
Symbol
ID	4976230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	-
Start bp	5242999
End bp	5244054
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	69%
IMG OID	640459146
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001136173
Protein GI	145225495
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.828923
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.699782
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCTGG CGCAGACCGC CACCTCGCAG GAGACCTCCG ACCGCAGGAT CCGGCGCTTC 
AGTGAGATCC CCAGCCCGCA CGACGTCCTC ACGGAGTTCC CGCTGGGAGC CCGTCGCGCC 
GAGCGGGTCG CGCGGGACCG CGAGGAGATC GCCGACATCC TCGCCGGCCG GGACGACCGC 
CTGCTCGTCG TCGTGGGGCC GTGCTCCGTC CACGACCCCG CCGCGGCGCT CGACTACGCG 
AGCCGGCTGG TGAAGGTCGC CGACGACCTC GGCGACCGGC TCAAGGTCGT GATGCGCGTG 
TACTTCGAGA AGCCGCGCAC CACGACCGGG TGGAAAGGGC TGATCAACGA CCCGGGGATG 
GACGGCAGCT TCGACGTGGC GCGCGGGCTG CGCACCGCCC GGCAACTGCT GCTCGACATC 
ATCGACATCG GCCTGCCGGT CGGATGCGAG TTCCTGGAGC CCACCAGCCC GCAGTACATC 
GCCGACGCGG TCGCGTGGGG TGCGATCGGC GCCCGCACCA CCGAATCCCA GGTGCACCGG 
CAGCTGGCGT CGGGCCTGTC GATGCCGGTC GGCTTCAAGA ACGGCACGGA CGGCAACATC 
CAGGTGGCCG TCGACGGCGT GAAAGCCGCT GCGGCACCGC ATGTCTTCTT CGGCATGACC 
GACATGGGCC GCGGCGCGCT GGTGAGCACC ACAGGCAACC AGGACTGCCA CGTGATCCTG 
CGTGGAGGCA CCGACGGACC GAACTGCGAT GCGGCGTCGG TGACGGTCAC CGCGGAGAAA 
CTGGTCACAG CGGGCCTGCC CGGACGGGTC GTGATCGATT GCAGCCATGC CAATTCCGGC 
AAGGACCACA TCCGCCAGGT GCAGGTCGCC AAGGACGTCG CACAGTTGGT TCGCGACGGA 
CTTCCGATCA GCGGCGTCAT GCTGGAAAGC TTCCTGGTGG CCGGAGCGCA GGCGCCGGAA 
GCTCAGCCGC TGACCTACGG CCAGTCCGTG ACGGACAAGT GCATGGATTG GGGTGCAACC 
GATCTAGTGC TGCGGGAGCT CGCAAACCAC GGCTGA

Protein sequence

MTLAQTATSQ ETSDRRIRRF SEIPSPHDVL TEFPLGARRA ERVARDREEI ADILAGRDDR 
LLVVVGPCSV HDPAAALDYA SRLVKVADDL GDRLKVVMRV YFEKPRTTTG WKGLINDPGM 
DGSFDVARGL RTARQLLLDI IDIGLPVGCE FLEPTSPQYI ADAVAWGAIG ARTTESQVHR 
QLASGLSMPV GFKNGTDGNI QVAVDGVKAA AAPHVFFGMT DMGRGALVST TGNQDCHVIL 
RGGTDGPNCD AASVTVTAEK LVTAGLPGRV VIDCSHANSG KDHIRQVQVA KDVAQLVRDG 
LPISGVMLES FLVAGAQAPE AQPLTYGQSV TDKCMDWGAT DLVLRELANH G