Gene Mbur_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_1037
Symbol
ID	3998777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	1119253
End bp	1120365
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	47%
IMG OID	637958813
Product	hypothetical protein
Protein accession	YP_565722
Protein GI	91773030
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR03282] putative methanogenesis marker 13 metalloprotein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00782668
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAAGA ATATTACGAT CATACACCCA CGACCAAGTT CCATCGTGGC CGCATTGTAC 
ACTTTAAGGG ACCTGAATGT CGATGTTGCA GTACTGCACG GACCACCTGG ATGTTCTTTC 
AAGCATGCGA GATTGTTGGA AGAGGACGGC ATACATGTAG TTACAACTGC CCTTGATGAA 
ACCGGTTTCG TTTTTGGAGG GCATGATGCA CTCGTGAATG TGCTCCATAA AGTGAACGAG 
ATGTTCAAAC CGAAGCTAAT CGGTGTTGTG GGCACCTGTG CCAGCATGAT AATCGGAGAG 
GAAATGCATG AACCGGTCAT GGAAGCAGAC CTTGATGTGC CGGTGATAGA AGTGGAAGTG 
CACGCAGGTT ACAGGAACAA TACAAAAGGT GTGATCATTG CACTTGAATC CGCACTCGAT 
GTAGGTGTTA TTGACAAGAC AGAGTTCGAA AGACAGCGTG CCCTGCTCGA AGAAGCGACC 
AATGTCGAAC TAAAACATGG TGCTGCAAGC CGGGAATATC TTGCGCCTTC ACGCGGCGAT 
GTGAAATATA AGGTTGCACA GAGGATAATC GAGCTGCTCA AGGAAGGTAA GCGCGGACTT 
GTCATCATGA ACGCCAAAAA AGAGACAGGA TATATGTTCG CAGACATCAC AGTTGCGATC 
AACGAAGTAG CTGAGCAGCT TGGCAAAGCA GACAATATTA TCAATATGGC AAATATCGAT 
GAGAAGCTGG GACTTCCAAG AGTTCGCCAC CATGCAGAAT GCATCGCGAA CGACCTGAAG 
GAAAGGGACG TTGTCATCCA CGAGAACATT GGCGGACTTG ACGAGTATCC TATTGCAGGG 
AATGCTGTTG ACCAGCTGAT AAAGGACAAG TACATAGACT TCGATTTTGC CGTGATAAGC 
GGGGTCCCGC ATGCAATACC AATGGACCAC ATCTCCAATA TGGAACTGAT ATCCGTTACC 
AACGGACCAA GACAGGTATT ACCCCTTAAG GAAATGGGAC ACGAACATGT GATCGTCGAA 
ATAGACCTGC ATCCAAAGAC ACTCGGTGTC AACCACATCG TAGAATCCGA GTTCGGTGCA 
ACACTGAGAG AAGTCGCAAA AGAATCATTA TAA

Protein sequence

MDKNITIIHP RPSSIVAALY TLRDLNVDVA VLHGPPGCSF KHARLLEEDG IHVVTTALDE 
TGFVFGGHDA LVNVLHKVNE MFKPKLIGVV GTCASMIIGE EMHEPVMEAD LDVPVIEVEV 
HAGYRNNTKG VIIALESALD VGVIDKTEFE RQRALLEEAT NVELKHGAAS REYLAPSRGD 
VKYKVAQRII ELLKEGKRGL VIMNAKKETG YMFADITVAI NEVAEQLGKA DNIINMANID 
EKLGLPRVRH HAECIANDLK ERDVVIHENI GGLDEYPIAG NAVDQLIKDK YIDFDFAVIS 
GVPHAIPMDH ISNMELISVT NGPRQVLPLK EMGHEHVIVE IDLHPKTLGV NHIVESEFGA 
TLREVAKESL