Gene Msil_0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0420
Symbol
ID	7093579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	461843
End bp	462934
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	66%
IMG OID	643463750
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_002360756
Protein GI	217976609
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTGGC CCCTCAATTC AAAACCGAAA CAGTTTCCGG CCGATGAGGG CGCTGCCGCG 
GCCGCGGCGC GCGCCCTCGC CCCGGACGGC GATGCTCCTG CGCCCCTGCC CGGCCCGACG 
GTGCGCCTGC GCCGCAACCG CAAGGCGGAG TGGACGCGCC GCCTCGTCCG CGAAAATGTC 
CTGACCGCCA ATGATCTGAT CTGGCCGATT TTCGTGCGCG AGGGAGTCAA TCAGCATGAG 
GCGATCGCCT CCATGCCGGG CGTCGAGCGC CTCTCGATCG ACGCCGCCGT CGAAAGCGCG 
CGCGAGGCGC ATGCCCTTGG CGTGCCGGCG ATCGCGCTGT TTCCCTATAC CGACCCCGCG 
CTTCGCGACG CCGCCGGGAC CGAGGCGCTG AACCCGGACA ATCTGATCTG CCGCGCTGTC 
CGGGCGATCA AAGAAACGAC GCCGGAGATC GGCCTCATCA CCGACGTCGC GCTCGATCCC 
TACACCAGCC ATGGCCATGA CGGCCTGATG CGCGGCGAGG AAATTCTCAA CGATGAGACG 
GTCGAGGTTC TGGTCAAACA GGCGCTGAAT TTCGCGCGCG CGGGCGCCGA CATGATCGCC 
CCCTCGGACA TGATGGACGG GCGCGTCGGC GCGATAAGGC GCGGGCTCGA CGCGGAGGGA 
TTTACCTCCG TTCAGGTGCT GGCCTATGCC GCTAAATATG CCTCGGCCTT CTACGGCCCG 
TTCCGCGACG CCGTCGGCAC GCAGAAGACG CTCATTGGCG ACAAGCGCAC CTATCAGATG 
GACCCGGCCA ATTCGGATGA AGCGCTGCGC GAGGTGGCGC AGGATATTGC CGAGGGCGCC 
GACATGGTGA TGGTGAAGCC CGGCCTGCCC TATCTCGACA TCATCTATCG CGTGAAGGAA 
AAATTCGGCC TGCCGACCTT CGCCTATCAG GTGTCGGGCG AATACGCGAT GATCGAAGGC 
GCGGCGCGCA ATGGCTGGCT CGACGGCGAC CGCGCGATTA TGGAGAGCTT GCTCGCTTTC 
AAGCGCGCCG GCGCCGACGC CGTGCTGACC TATTTCGCCC CGCGCGTGGC GCGGCTGCTG 
CGGGACGAGT AA

Protein sequence

MIWPLNSKPK QFPADEGAAA AAARALAPDG DAPAPLPGPT VRLRRNRKAE WTRRLVRENV 
LTANDLIWPI FVREGVNQHE AIASMPGVER LSIDAAVESA REAHALGVPA IALFPYTDPA 
LRDAAGTEAL NPDNLICRAV RAIKETTPEI GLITDVALDP YTSHGHDGLM RGEEILNDET 
VEVLVKQALN FARAGADMIA PSDMMDGRVG AIRRGLDAEG FTSVQVLAYA AKYASAFYGP 
FRDAVGTQKT LIGDKRTYQM DPANSDEALR EVAQDIAEGA DMVMVKPGLP YLDIIYRVKE 
KFGLPTFAYQ VSGEYAMIEG AARNGWLDGD RAIMESLLAF KRAGADAVLT YFAPRVARLL 
RDE