Gene Msil_2052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2052
Symbol
ID	7094250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	2226184
End bp	2227173
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	63%
IMG OID	643465376
Product	chlorophyllide reductase iron protein subunit X
Protein accession	YP_002362354
Protein GI	217978207
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1348] Nitrogenase subunit NifH (ATPase)
TIGRFAM ID	[TIGR02016] chlorophyllide reductase iron protein subunit X

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0401365
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTGA AGCTTCGCGC CGAGGCCGCG CTTGAAGCGG AAGCCGCGCT TGAAGCGGAA 
GCCGCGCCCG CCGCCGCGCC GACGAAAGCG ACACAGATCA TCGCCATCTA CGGCAAGGGC 
GGCATCGGCA AGAGCTTCAC CCTCGCCAAT CTCTCCTACA TGATGGCGCA GCAGGGCAAG 
AAAGTGCTGC TCATTGGCTG CGATCCCAAA AGCGACACCA CCTCTCTCCT TTTCGGCGGC 
AAGGCCTGCC CGACAATCCT TGAAACCTCG AGCCGCAAGA AACTTGCGGG CGCGCAGGTC 
GAGATCGGCG ATGTCTGCTT CAAGCGCGAC GGCGTGTTCG CGATGGAGCT CGGCGGCCCG 
GAAGTCGGCC GCGGCTGCGG CGGCCGCGGC ATCATTCACG GCTTCGAGCT ACTTGAAAAG 
CTCGGCTTCC ACGAATGGGA TTTCGACTAT GTGCTGCTCG ATTTCCTCGG CGACGTGGTC 
TGCGGCGGCT TCGGCCTGCC GATCGCGCGC GACATGTGTC AGAAAGTGAT CGTCGTCGGA 
TCGAACGATC TGCAGTCATT ATATGTCGCT AATAATGTTT GTTCCGCCGT CGATTATTTC 
CGCAGGCTCG GAGGCAATGT CGGCGTCGCC GGCCTCGTCA TCAACAAGGA CGACCATACC 
GGAGAGGCGC AGGCTTTCGC AAAATCCGTC GGCATTCCGG TTCTGGCCTC GATCCCGGCC 
GACGACGACA TCCGGCGGAA GAGCGCCAGC TACGAGATCA TTGGCCGGCC TGGCGGACAA 
TGGGCGTCCG TGTTCGAAGA GCTCGCCCGC AACATCGCCG AGGCGCCGCC AGTGCGGCCG 
TCGCCACTGA CGCAGGACGG GCTGCTCGAA TTGTTCTCCG GCGACGCCGT CGGCAGGGGC 
GTCGTGCTCC AGTCGGCGAG CGCGACCGAC ATGATGGGCG CGGCCCGCCT TGAGAAGAAA 
TCGCTCGAAA TCATCTACGA CGCCGTTTGA

Protein sequence

MALKLRAEAA LEAEAALEAE AAPAAAPTKA TQIIAIYGKG GIGKSFTLAN LSYMMAQQGK 
KVLLIGCDPK SDTTSLLFGG KACPTILETS SRKKLAGAQV EIGDVCFKRD GVFAMELGGP 
EVGRGCGGRG IIHGFELLEK LGFHEWDFDY VLLDFLGDVV CGGFGLPIAR DMCQKVIVVG 
SNDLQSLYVA NNVCSAVDYF RRLGGNVGVA GLVINKDDHT GEAQAFAKSV GIPVLASIPA 
DDDIRRKSAS YEIIGRPGGQ WASVFEELAR NIAEAPPVRP SPLTQDGLLE LFSGDAVGRG 
VVLQSASATD MMGAARLEKK SLEIIYDAV