Gene Msil_1479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1479
Symbol
ID	7091822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1597917
End bp	1598957
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	65%
IMG OID	643464813
Product	4-hydroxy-2-oxovalerate aldolase
Protein accession	YP_002361799
Protein GI	217977652
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	89
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGCA TCAATCCGAA CAAGCTATAC GTCCAGGATG TCACGCTGCG CGACGGCATG 
CATTCGGTGC GTCACCAGTA CAGCCTTGAC GCGGTGCGCG CCATCGCCCG TGCGCTCGAC 
CGCGCCCACG TCGACGCCAT CGAGATCAGC CACGGCGACG GCATCACCGG CTCGACCTTT 
AACTACGGCT TCGGCGCGCA TGACGATACC GAATGGATCG CAGCGGTGGC CGGCGAATGC 
AAGTTCTCGC GCATCACTGT GCTGCTACTG CCGGGCATCG GCACCGTGCA TGATCTCAAA 
TATGCCTGTG AGGCCGGCGC GCGTAGCGTG CGCGTCGCCA CCCATTGCAC GGAAGCGGAC 
GTTTCGCGCC AGCATATCGA GGCGGGCCGC AAGCTTGGCA TGGATACGGT CGGCTTTTTG 
ATGATGGCGC ACATGGCGCC GGTGGAGAAG CTGGTCGAAC AGGCGCTGCT GATGGAAAGC 
TATGGCGCCG AATGCGTCTA TGTGACGGAT TCGGCTGGCG CGCTGCTGCC GAAACAGTAC 
GCCGAACGCG TAAAAGCGGT GCGCGGCGCG CTGAAGCCCG AGACGGAAAT CGGCGTGCAC 
ACCCACCACA ATCTGACCCT TGGTGTCGCG AACGCCGTGG CGGGAATTGA GGCAGGCGCC 
GTTCGCGTCG ACGCCTCGCT CGCCGGCATG GGCGCGGGCG CCGGCAACGC GCCGCTCGAA 
GCTCTGATCG CGGTGCTCGA CCGGATGGGA ATCGAGACCG GCTGCGACCT GCACATGTTG 
ATGGACGCGG CGGACGATCT CGTGCGGCCC CTGCAGGACC GTCCGGTGCG GGTGGACCGC 
GAGTCGCTTT CACTCGGCTA CGCCGGCGTC TATTCGAGCT TCCTGCGCCA TGCGGAAAGC 
GCCTCGAAAC TCTATGGCGT CGATACGCGC GACATCCTCA CCGAACTCGG CAAGCGGCGC 
ATGGTCGGCG GCCAGGAAGA CATGATTGTC GACGTCGCGC TGGACATTCT CAAATCACAC 
GGGGCGGAGG CGGCCCAATG A

Protein sequence

MARINPNKLY VQDVTLRDGM HSVRHQYSLD AVRAIARALD RAHVDAIEIS HGDGITGSTF 
NYGFGAHDDT EWIAAVAGEC KFSRITVLLL PGIGTVHDLK YACEAGARSV RVATHCTEAD 
VSRQHIEAGR KLGMDTVGFL MMAHMAPVEK LVEQALLMES YGAECVYVTD SAGALLPKQY 
AERVKAVRGA LKPETEIGVH THHNLTLGVA NAVAGIEAGA VRVDASLAGM GAGAGNAPLE 
ALIAVLDRMG IETGCDLHML MDAADDLVRP LQDRPVRVDR ESLSLGYAGV YSSFLRHAES 
ASKLYGVDTR DILTELGKRR MVGGQEDMIV DVALDILKSH GAEAAQ