Gene Mlab_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1039
Symbol
ID	4795946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	1049426
End bp	1050589
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	42%
IMG OID	640099709
Product	hypothetical protein
Protein accession	YP_001030475
Protein GI	124485859
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.451358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATC TGTTTGTGCA CCTGCCGTCA TTTGCAACGG ATTACTCCGG CGCCGCTTCG 
GTATTTTATA ATATGGGCGG ACTTGTTGTG ATCCATGAAC CATCAGGATG TATGGGTAAT 
TTTACCGGAT TTGACGAACC CCGCTGGTAC CATGCTCCAG AGATGGTATT TAGTTCATTT 
ATCCGTGAGG AAGAGGCAAC GATGGGTGAT GAGTCGATTC TTCTCAATAA AATTCTTCAG 
GAATGCGCAA GTCATCATCC CAAATTTGTT GCGATTCTTG GAACACCAGT CCCTGCATTA 
ATCGGTTGCG ATATCTCGGG AATTGCAACT GAGGTTTTTG ATACTACCAA AATCCCCGCA 
TTTGGGCTGA ATACTACTGG ATTTCAGTAT TATGATGATG GTATCAAAAA AGCTCTCCTG 
ATGATCGAAG AGCAGTTAAT GAAGGACTCA GAAGTAAAAG AGCCAAAAAC AGTAAATATC 
CTTGGATACA CGCCCATAGA TTTTTTCCTT TCAGGTGACG ATAGGAGGTT AGCATCATTT 
GTAGAGTCGT GCGGATTTCG GATTTTATGT TCTCTCCCCG GAGATGAGCT GGAGACGATT 
ATCAAAGCAC CCAATGCAGA AAAAAATATT GTGGTGTCCG CGGCAGCAAT TCCTCTTGCA 
GAAAAAATGA GGGAAAAATA TGGCATTCCA TTCTGCGCAA TGCTTCCGGG AACGACGAAC 
GGCAAAGAGA GAATGCAGGC ATTTTTACAG GATTATACGC CGCAACTTCC CGCATCTTGC 
GTTTGTTCCG GAAAAGCTCT TGTAATTGGG GAACAGATTT CTGCGAACAC TATACGTGAT 
TTCCTGATTG AAGACCTGAA TTATTCTAAC GTGAATGTCG CCACGTTCTT TGCATTTTCT 
CGTACTATCG CACGTGAAGG AGACATCAAA CTTTCAAATG AAGGACATCT CCAAAAACTT 
ATCGAAGAAG GGTGTTACGA TATCATTGTT GGTGATCCGC TGTTTGAACG GTTTACGAAC 
CGGCAACAGA TTTTTGTTTC ACTTCCACAT CCGGCAGTAA GCAGTAAATT ACATTGGCAA 
TCGTATGTTT CTCTTCTCAG CAACGATTTT TCAAAATATC TTTATGAAAA AATCAATCGC 
AAATATCCTG TAACATTACA GTAG

Protein sequence

MSNLFVHLPS FATDYSGAAS VFYNMGGLVV IHEPSGCMGN FTGFDEPRWY HAPEMVFSSF 
IREEEATMGD ESILLNKILQ ECASHHPKFV AILGTPVPAL IGCDISGIAT EVFDTTKIPA 
FGLNTTGFQY YDDGIKKALL MIEEQLMKDS EVKEPKTVNI LGYTPIDFFL SGDDRRLASF 
VESCGFRILC SLPGDELETI IKAPNAEKNI VVSAAAIPLA EKMREKYGIP FCAMLPGTTN 
GKERMQAFLQ DYTPQLPASC VCSGKALVIG EQISANTIRD FLIEDLNYSN VNVATFFAFS 
RTIAREGDIK LSNEGHLQKL IEEGCYDIIV GDPLFERFTN RQQIFVSLPH PAVSSKLHWQ 
SYVSLLSNDF SKYLYEKINR KYPVTLQ