Gene Msil_2402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2402
Symbol
ID	7093954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	2617160
End bp	2618068
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	65%
IMG OID	643465724
Product	formylmethanofuran--tetrahydromethanopterin formyltransferase
Protein accession	YP_002362694
Protein GI	217978547
COG category	[C] Energy production and conversion
COG ID	[COG2037] Formylmethanofuran:tetrahydromethanopterin formyltransferase
TIGRFAM ID	[TIGR03119] formylmethanofuran--tetrahydromethanopterin N-formyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCTA TGATCGCCAA TGGCGTCCGC ATCGACGAAT CCTTCGCCGA AGCGTTCCCG 
ATGCGCGGAA CCGCGATCAT CATCACCGCG CCCAATCTGA AATGGGCGCG GCAGGCCGCA 
GTGACGATGA CCGGCTTCGC CACCTCCGTC ATCGGCTGCA AGGTCGAGGC CGGAATCGAC 
CGCGATGCCC CGGAGAGCGA GACGCCGGAC GGACGGCCCG GCGTCCGCGT CCTCATGTTT 
TCCATGTCGA CCGACATGCT GCAGACGCAG CTTGTGACGC GCGCGGGCCA ATGCGTGCTG 
ACCTCGCCGG GATCGGCCTG CTTCAACGAC CTCGACGCGC CGGACCGCAT GCCGATCGGC 
GACCAGCTGC GCTATTTCGG CGACGGCTGG CAGATTTCGA AGAAATTTCT CGGTCGCCAT 
TTCTGGCGCG TGCCGGTGAT GGACGGCGAA TTCTTGTGCG AAGGGACCGT CGGCCTCACC 
AAAAAGGCCG TCGGCGGCGG CAATCTTCTC GTCATGGGCG CGAATTTCGC GACCACCATG 
AACGCCTGCG AACACGCCAT CGAGGCCATG AATGCGGTCG ACGGCGCGAT CATGCCGTTT 
CCGGGCGGCA TCGTGCGCTC GGGATCGAAG GTCGGCTCCA AATATGCCGG CGTTCCGGCC 
TCGACCAATG ACGCCTATTG TCCGACCCTG CGCGGCGTCG CCAAAAGCGC GCTCGAGGAA 
GACATCGGCT GCGTGCTCGA GATCGTCATC GACGGCCTCG ACGAGAAGGC GGTCGCGGAG 
GCGATGCGCG CCGGCCTTGC GGCCATCGTC AAGCTCGGGC CCAAGGACGG CGCACTGCGC 
GTGGGCGCCG GTAATTACGG CGGCAAGCTC GGCCCGTTCC ACTTCCATTT GAAGGATCTG 
CTGCCGTGA

Protein sequence

MRAMIANGVR IDESFAEAFP MRGTAIIITA PNLKWARQAA VTMTGFATSV IGCKVEAGID 
RDAPESETPD GRPGVRVLMF SMSTDMLQTQ LVTRAGQCVL TSPGSACFND LDAPDRMPIG 
DQLRYFGDGW QISKKFLGRH FWRVPVMDGE FLCEGTVGLT KKAVGGGNLL VMGANFATTM 
NACEHAIEAM NAVDGAIMPF PGGIVRSGSK VGSKYAGVPA STNDAYCPTL RGVAKSALEE 
DIGCVLEIVI DGLDEKAVAE AMRAGLAAIV KLGPKDGALR VGAGNYGGKL GPFHFHLKDL 
LP