Gene Mlab_0520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0520
Symbol
ID	4796033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	+
Start bp	492670
End bp	493731
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	59%
IMG OID	640099178
Product	hypothetical protein
Protein accession	YP_001029961
Protein GI	124485345
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR03282] putative methanogenesis marker 13 metalloprotein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.268419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.583611
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTACG TTCAGCCGCG TCCAAGCTCG ATTGTTGCCG CCCTCTATAC CCTTCGGGAT 
CTGAACGTCG ATCTCGCGAT ACTTCACGGC CCGTCAGGCT GTTCATTCAA GCACGCCCGA 
CTCTTGGAAG AGGACGGGAT CCGCGTTCTG ACGACCTCGC TTGGCGATGA GGAGTTCATC 
TTCGGCGGGC AGAAGATCCT CGAAGATGTC CTCCAATATG CTGAAAAGGA GTTTTCTCCC 
CGCCGCATCG CCGTTGTCGG GACCTGTGTT TCGATGATCA TCGGCGAGGA TCTCGATGCC 
GCGATCGAAG CCTCCGGCAT CACGACCCCT GCGATAGGGG TATCGATCCA CGCAGGATTT 
CGCGAGAACA TCGACGGGGT CATCGCCACC CTCGAGCCGG CGGCAAAGAT CGGCTGGATC 
TCCGAAGAGG AGTTCGAGCG GCAGAAACTG GTCCTTGCCT CGGCGAACAA AACCGAGCGG 
GAACGCGGAG CTGCCTGTAA AACCTACATT GCCCCGTCCC GCGGCGATCT GAAGCACGTT 
GCCGCCGCCG AACTCGCAGA GCTACTTCGT TCCGGCAAAA AAGGCATGGC GATCATGAAC 
GCAAAGAAGG AGACGGCGTA TATGTTCGCC GATCATCTCT GCGCCGTGCA TGAATGTGCG 
CCGGACGCGA ATGTCACCTT TGTCGCAAAC CTCGAAGCCC GCGGTCTGCC GAAAGTGAGA 
GGGGACGCCG CCATGATCCT TGCCGAACTC AATGAACGCG GCATCCACCC CGAACTCATC 
GGAGCTCTTG ACGAATACGG CGGAAACGGC CCGCGGATCG CAGAAAGGAT CGCGGAAGTC 
AAACCGGAAT TCCTCCTGCT CGTCGGTGTC CCCCACGCGG TCTCGCCCGA AGCTCTTGCC 
GGGATCAAAG TATTCTCCGT CACAAACGGA CCGCGGCAGG TCCTGCCCTT AAAAGAGCAG 
GGGCATGCCC ATGTCATGGT CGAGGTTGAT CTTCATCCAA AGACGCTTGG CGTCCACAAC 
ATCGTCGAAA GCGAGTTCGG AGCCGTTCTG CGGAGCATGT GA

Protein sequence

MRYVQPRPSS IVAALYTLRD LNVDLAILHG PSGCSFKHAR LLEEDGIRVL TTSLGDEEFI 
FGGQKILEDV LQYAEKEFSP RRIAVVGTCV SMIIGEDLDA AIEASGITTP AIGVSIHAGF 
RENIDGVIAT LEPAAKIGWI SEEEFERQKL VLASANKTER ERGAACKTYI APSRGDLKHV 
AAAELAELLR SGKKGMAIMN AKKETAYMFA DHLCAVHECA PDANVTFVAN LEARGLPKVR 
GDAAMILAEL NERGIHPELI GALDEYGGNG PRIAERIAEV KPEFLLLVGV PHAVSPEALA 
GIKVFSVTNG PRQVLPLKEQ GHAHVMVEVD LHPKTLGVHN IVESEFGAVL RSM