Gene Mlab_0163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0163
Symbol
ID	4795895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	148281
End bp	149414
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	52%
IMG OID	640098809
Product	hypothetical protein
Protein accession	YP_001029606
Protein GI	124484990
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAAG GACTGTGCGT AAATCCGGTC TGGCCGTGCG CGATGACCGG GGCCTGTTCA 
GTGCTTGCCG GCTTCTCCGG ACTGAACGTG CTGATCCACG GTTCATCCGG CTGTTATTAT 
TATCCCCGGT CGCTGCTGAA GGTTCCTTTG TTCAGCACGT ATCTTCTGGA GTCAGAGATC 
GTGTTCGGTA CGGTCGAGCG CCTGAAAGAG GTCGTGAACA CTCTTTCAAC GTCGAAGCGA 
CCGATCGCCG TTTTAAACAC CTGTATCCCG GCACTCACCG GCGAAGATCT TTCGGGGGCA 
TTTTCCGAAG AGGAGACAAT TTTTGTCGAT GCGCCCGGAT TCATCGGGAG TGTCGAAGAT 
GGAGCAAAGA TCGCCTTTGA ACGGCTGGGA ATCGAAACGG ATGCATCAAG GGAAGGCGTG 
AACATCGACG GGGTTTCCCT TCTGGATCTA TTCTGGCGGG GAAATCTGCA CGAAGCAAAA 
CGGATTCTCA CAGAGATGGG GATCCCGACC GCTCTGTGTC TTGCCAAAGA CAGCTATGAA 
AATCTGCGAA AAGGAGCTGC TTTGCATACC GTCTCGGTAA ACCCGTCGTA TCCATCCGGC 
GTTGGAACGA TGCTCGGCTC GTTTTTGTTC CCCGACCTGA AAGATACCTG TGCAAAACTC 
GCAGATATAT TTCCCAACGC CGATATCGAC CCGCTCCTCG AAGAGTGGAA TCTTGCCGAC 
GAGCAGCTGT TCTACTCAAG CGACAAATAT CTGCGAAAAT ATGAACCACC GGTCGTTGCC 
GTATGTGCTC AGGAAAGTTA CGCACTGTTT GCAAAATCGA TGATGGAGCG CTACTTCGGG 
GCGGACGTTC CGGTGATGCT TGCACGAAAC CATGATGCGG TAAGCATTCC CTCTGAAACC 
GATCTGACGA AGATTGCAGG GCATATTGCC GGCTGCCGGC CGGATCTTAT CCTTGGATCA 
ACGTTCGAAG CAAATGGTTA TCCAAACGCT GCATTCCTCG GGATAACGCC GCCTGACAGA 
AGCCGGGTCT CCATAGCGGC ACGACCGATT GCAGGAATAG AGGGCGGAAT CATGTTTTTA 
GAGAACGTGC TCAATACCTT GATTGATGCA ACTTCGTCAA AGCAGAAAAA GTGA

Protein sequence

MDEGLCVNPV WPCAMTGACS VLAGFSGLNV LIHGSSGCYY YPRSLLKVPL FSTYLLESEI 
VFGTVERLKE VVNTLSTSKR PIAVLNTCIP ALTGEDLSGA FSEEETIFVD APGFIGSVED 
GAKIAFERLG IETDASREGV NIDGVSLLDL FWRGNLHEAK RILTEMGIPT ALCLAKDSYE 
NLRKGAALHT VSVNPSYPSG VGTMLGSFLF PDLKDTCAKL ADIFPNADID PLLEEWNLAD 
EQLFYSSDKY LRKYEPPVVA VCAQESYALF AKSMMERYFG ADVPVMLARN HDAVSIPSET 
DLTKIAGHIA GCRPDLILGS TFEANGYPNA AFLGITPPDR SRVSIAARPI AGIEGGIMFL 
ENVLNTLIDA TSSKQKK