Gene Msil_3629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3629
Symbol
ID	7092902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3991820
End bp	3993268
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	60%
IMG OID	643466917
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_002363876
Protein GI	217979729
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.205847
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGTT TAGCGAACAA GATCCAGGAC GTTTTCAACG AGCCAGGCTG CGACAAGAAT 
CAGGGCAAAT CCGACAAGGA ACGCAAGAAG GGCTGCACCA AGCAATTGCA GCCGGGGGCC 
GCTGCCGGCG GCTGCGCCTT CGACGGCGCC AAAATCGCGC TGCAGCCGAT CACCGACGTC 
GCCCACCTCG TTCACGGCCC GATCGCCTGC GAGGGCAATT CATGGGACAA CCGAGGCGCC 
AAATCCTCTG GATCTCAGCT TTACCGAACC GGCTTTACGA CCGACATCAA CGAGACGGAC 
GTCATCTTCG GCGGCGAGAA GCGGCTGTTC AAAGCGATCA AGGAAATTAT CGACAAATAT 
GATCCGCCGG CCGTGTTCGT CTATCAGACC TGCGTGCCCG CGATGATCGG CGATGATATC 
GGCGCCGTTT GCAAGGCCGC CGCCGCCAAA TTCAACAAGC CCGTCATCCC CGTCATTTCG 
CCAGGTTTCG TCGGCCCGAA AAATCTCGGC AACAAGCTCG CCGGCGAGGC CATCCTCGAT 
CATGTGATCG GCACGATGGA GCCCGAGTAC ACGACGCCCT ACGACATCAA CATCATTGGC 
GAATATAATC TCTCCGGCGA ATTGTGGCAG GTGAAGCCGC TGTTCGACGA ACTCGGCATT 
CGCATTTTGT CCTGCATCTC GGGCGACGCC AAATATAAGG AAGTCGCCTG GTCGCATCGC 
GCCAAAGCCT CGATGATGGT CTGCTCCAAG GCGATGATCA ACGTCGCCCG CAAGATGGAG 
GAGCGCTACG ACATTCCCTT CTTCGAGGGC TCTTTCTACG GCATCGAGGA CACCAGCGAC 
TCGCTGCGCG AGATCGCCCG TCTGCTGATC GAAAAAGGCG CCCCGGCCGA GCTGATGGAG 
CGCACCGAGG CGGTGATCGC CCGCGAGGAA GCGCTCGCCT GGAAGAGCAT CGAGCCCTAT 
CGGGCGCGGC TCGCCGGCAA GCGCGTGCTG CTCATCACGG GCGGCGTCAA ATCCTGGTCG 
GTCGTCGCCG CGCTGCAGGA AGCCGGATGT GAAATCGTCG GCACCAGCGT CAAGAAGTCG 
ACCAAAGAGG ACAAGGAAAA GATCAAGGAG TTGATGGGCC AGGACGCCCA TATGATCGAC 
GATATGACGC CGCGCGAAAT GTACAAGATG CTGAAGGACG CGAAAGCCGA CATCATGCTT 
TCCGGCGGCC GTTCGCAGTT CATCTCGCTG AAGGCGAAAA TGCCCTGGCT CGACATCAAC 
CAGGAGCGCC ACCACGCCTA TATGGGCTAT GTCGGCATGG CCGAGCTCGT CAAGGAGATC 
GACAAGGCGC TCTACAATCC CGTGTGGGAA CAGGCGCGCC GCGCCGCCCC CTGGGAGACG 
AAGCCTTCGG AAATGTTTTC GGAGCCCGAG CCGGAACTTG CGGCGCCAAC AGCGCTCGCG 
GCGGAATAG

Protein sequence

MTSLANKIQD VFNEPGCDKN QGKSDKERKK GCTKQLQPGA AAGGCAFDGA KIALQPITDV 
AHLVHGPIAC EGNSWDNRGA KSSGSQLYRT GFTTDINETD VIFGGEKRLF KAIKEIIDKY 
DPPAVFVYQT CVPAMIGDDI GAVCKAAAAK FNKPVIPVIS PGFVGPKNLG NKLAGEAILD 
HVIGTMEPEY TTPYDINIIG EYNLSGELWQ VKPLFDELGI RILSCISGDA KYKEVAWSHR 
AKASMMVCSK AMINVARKME ERYDIPFFEG SFYGIEDTSD SLREIARLLI EKGAPAELME 
RTEAVIAREE ALAWKSIEPY RARLAGKRVL LITGGVKSWS VVAALQEAGC EIVGTSVKKS 
TKEDKEKIKE LMGQDAHMID DMTPREMYKM LKDAKADIML SGGRSQFISL KAKMPWLDIN 
QERHHAYMGY VGMAELVKEI DKALYNPVWE QARRAAPWET KPSEMFSEPE PELAAPTALA 
AE