Gene Mpal_0236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0236
Symbol
ID	7270622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	269351
End bp	270397
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	61%
IMG OID	643568887
Product	oxidoreductase/nitrogenase component 1
Protein accession	YP_002465343
Protein GI	219850911
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.690347
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTCGA AGACCTCGCA TTCAAGTACA TATCGATATG AAGGGTGCAC GCTGACCGGA 
GCACTCTCGG TCACGACCGC GATCACCGAT GGGATCAGTA TTATCCATGG CCCGGCGGGC 
TGTGCCCATC ATAACCTTTC GCTGATCTAT GCGACGCTGC TCGACCATGA GAGCGGCCCG 
CTTCCTGCGC TCTGCTCTGA CCGGATTGGC GAAGAGGAGA TCATCTTCGG CGGCGAGGAG 
CAGTTGACCG CCGTAATCAG AAACGCCGTC AGGGACGGGT ACACCTCTGT CATGGTCCTC 
GGCACCTGCG TGACCGCTGC CATCGGCGAC GATATCGATT CGATCTGTGG ACAGGACTGG 
CCGGTTCCGG TGATCCCGGT GAAGACCCAG GGGTTTCTGG GAGGGGTCTT CTCGACCGGG 
TTTTTCAACG CCCTCTCAGC CTTGGCCGGC CTCGCACCGA CAGGCCAGGA GAAGAGGGAT 
GGGCAAGGAG TTGAACCTCG CGTGAACCTT ATCGGGGAGA AGAACCTGGA GTACGAAGTG 
GATGAGAACG CTGCCGAGGT GACCCGGTTG CTCGATCGGG CAGGGATCGA AGTGAACCTC 
AGGTTTGTCA GGGGGATCAG TACCGACGAG ATCGCCAGGC TTGGGAGGGC TGACCTGAAC 
ATCCTCCGTG AACCTTCGCT TGTCGCGTTC GGCGAGGAAC TGCAGCAGCA GTTCTCCATC 
CCGTACCTGG AAGGGTTCCC GGTCGGCCTT GCGGGAACTC TCCGATTCGT CCAGGAGACG 
GCTGACCGCT GTGCTGTCGA CGGCACCACC GCAGTCGAGG AGGAGGAGAT CTTCCAGGCT 
CAGATGCTCG ATCAGTTCGA GCGGATCAGA GGCGCCCGGG TCCGGTTCAG CCAGCCCTCC 
GACCGATTCA CTGCAGAATT GGTAGACCGA CTCGGTCTCA TCATCAGTAG CGATGGCGCA 
CCGGTCCGGC TTCCGGTGCC GCTCCCGGTC GGGACCGCCG GCATCCGCCG GATGCTGCAG 
CAGTGGAGGC GGACGATCGA TGCCTGA

Protein sequence

MNSKTSHSST YRYEGCTLTG ALSVTTAITD GISIIHGPAG CAHHNLSLIY ATLLDHESGP 
LPALCSDRIG EEEIIFGGEE QLTAVIRNAV RDGYTSVMVL GTCVTAAIGD DIDSICGQDW 
PVPVIPVKTQ GFLGGVFSTG FFNALSALAG LAPTGQEKRD GQGVEPRVNL IGEKNLEYEV 
DENAAEVTRL LDRAGIEVNL RFVRGISTDE IARLGRADLN ILREPSLVAF GEELQQQFSI 
PYLEGFPVGL AGTLRFVQET ADRCAVDGTT AVEEEEIFQA QMLDQFERIR GARVRFSQPS 
DRFTAELVDR LGLIISSDGA PVRLPVPLPV GTAGIRRMLQ QWRRTIDA