Gene Mboo_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2004
Symbol
ID	5410428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	2072781
End bp	2074328
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	52%
IMG OID	640869246
Product	nitrogenase
Protein accession	YP_001405161
Protein GI	154151543
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.811675
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAA ATAAATCACC ACATATTATC GATTCCAAGA TCAATCTTGA GGAAGCAACG 
TGCCCGAACC GTGAACAGCG TGCAAATGGG ATTAATGTCT GGTACGGAAA GGCCAGCGAT 
CTGGTAAAGG AGGCGCGTGA AGGAACCCTT ACGCGTCGGG AACGAAAATT CCAGCAGACC 
TCAGGCTGCG TGCTCAACTT CTATCTCACG GTACGGGTGG GAACGATACG CGATGCAGCG 
GTAGTTTACC ATGCACCGGT TGGATGTTCC TCATCCGCTC TTGGGTACCG GGAACTGTAC 
CGCGGTGTTC CGGTTGAACT CGGGCGACCG GCAGAATATG ATCTCCACTG GATAACCACC 
AACCTCCGGG AAAATGATGT TGTCTATGGC GCAACCGAAA AACTCAAGAG TGCCATATTT 
GAGGCACAAC GCCGCTACAA TCCCAAGGCC ATATTCGTTA TGACTTCATG CACCTCCGGG 
ATCATCGGAG AGGATATTGA AGGAGTGGTT GCAGAGGTTC AGCCAAAAGT GAAAGCCAGG 
ATAGTTCCGG TCCACTGCGA AGGTTCGCGA TCCCGGCTGG TACAGACCGG GTACGATGCG 
TTCTGGCATG GGGTCCTGAA GTACCTTGTG AAAAAACCGC AGAAGAAGCA GAAGGATCTG 
GTCAATGTTG CAAGCATGCT TTCGTATACC TGGCAGGACA GGCTTGAGAT CAAGAGATTG 
CTCGAAAAAG TCGGGCTCCG GGTCAATTTT ATTCCGGAAT TTGCAACTGT CGAGCAGCTG 
GAACAGCTCA GTGAAGCTGC GGTAACGGCA CCCTTGTGCC CGACCTACAC TGATTACCTC 
TCCCGGGGAC TTGAACAGGA ATACGGTGTC CCCTATTTCC TCTATCCTTC CCCGATGGGT 
ATTGCAAACA CGGACGCCTG GCTGCGGGAG ATTGGAAAAC ATACCGGGAA ATCAAAAGAG 
ATTGAGAAAC TCATCGAGGA TGAACATAAA GTCTGGATTC CCAAGCTTAA GGCAATTCAG 
GAAGAATTTG CAAAAGTTAA AGCCGACGGT AAGAAAGTGG AAGTGCTTGG CGCACTCGGC 
CAGGGGCGGC TTCTTGCCCA GCTCCCGTAC TTCGATGAAC TGGGACTCAA ATCTTCGGCA 
GCCATGTGCC AGGATTTTGA TAACCTGATT CTCGGGGATC TCGAAAACCT GATCAAAAAT 
GTAGGAGACT TTGATATCCT GGTCAACACG TTCCAGGCAG CGGAACAGTC ACACATAACA 
AGAAAACTTG ATCCGGATAT TGCTCTCACC TGTCCGTTCC AGGGAGGAGC GTTCAAGCGG 
GATAAAGGTA TGACCAGGAT TCACGCACTC CGGGGCGATC CGGATCCCTG GAGCCGGCAA 
AGCGGGTACA CAGGTGCGAT CGCATTTGGG AATTTCCTGC TTCAGTCGCT CAAAAGCAGT 
GCGTTCCAGC GGACCATGCT CGAAAAAACA GAGAACACCT ACAAGGACTG GTGGTACCGT 
CAGCCCGATC CCCTCCACTA CCTGATAAAA GAGGATGGAG AGCCATGA

Protein sequence

MTENKSPHII DSKINLEEAT CPNREQRANG INVWYGKASD LVKEAREGTL TRRERKFQQT 
SGCVLNFYLT VRVGTIRDAA VVYHAPVGCS SSALGYRELY RGVPVELGRP AEYDLHWITT 
NLRENDVVYG ATEKLKSAIF EAQRRYNPKA IFVMTSCTSG IIGEDIEGVV AEVQPKVKAR 
IVPVHCEGSR SRLVQTGYDA FWHGVLKYLV KKPQKKQKDL VNVASMLSYT WQDRLEIKRL 
LEKVGLRVNF IPEFATVEQL EQLSEAAVTA PLCPTYTDYL SRGLEQEYGV PYFLYPSPMG 
IANTDAWLRE IGKHTGKSKE IEKLIEDEHK VWIPKLKAIQ EEFAKVKADG KKVEVLGALG 
QGRLLAQLPY FDELGLKSSA AMCQDFDNLI LGDLENLIKN VGDFDILVNT FQAAEQSHIT 
RKLDPDIALT CPFQGGAFKR DKGMTRIHAL RGDPDPWSRQ SGYTGAIAFG NFLLQSLKSS 
AFQRTMLEKT ENTYKDWWYR QPDPLHYLIK EDGEP