Gene Mlab_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0233
Symbol
ID	4795616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	+
Start bp	218346
End bp	219599
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	54%
IMG OID	640098879
Product	hypothetical protein
Protein accession	YP_001029676
Protein GI	124485060
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATGG CAGACACACT TTCCGAACGG ATTCTCGGCT CGGCCGAAGG TACGTATGTC 
GACCGGATGG TTGATCGGGC ATTTGCCCAC GACGGGACCG GTGCCCAGGC ACTGGTCGCA 
TTCGAAAATT TCCGGATCCA AAACAAGTCC GTTGTCAATC CTGAAAAATT ATCTATAATA 
TATGATCACA TCTCGCCGGC GAACAACTCG GTTACGGCCG ATCTTCAGGG AGATCTTCGG 
AAGTTTTCCC GACAGAACGG GATGCATTTC CACGAGGTCG GCTGCGGGAT CTGTCATCAG 
ATAATGAGCG AAGGAGTCTG CCTACCGGGT GAGATCGTTG TCGGGGCGGA TTCGCATTCC 
TGTACTCTCG GGGCACTCGG CGCATTTTCA ACCGGTGTCG GAGCAACCGA TATGGCGGGG 
ATCTGGGCGA CCGGCGGGAC CTGGTTTAGA GTTCCCGAAT CTATTAGTAT AGTGCTGTCC 
GGCAAACTTT CCGGTCATAC CGAGCCGAAG GATGTCGCAC TATCTTATGT AAAGGCACTT 
GGGATGGACG GCGGGACCTA CAAAGCTCTG GAGTTTATCG GTGACGGAGC CGCCGGCATG 
CCGGTCGAAG GAAGACTGAC GTTATCTAAC ATGGCCGTCG AGACCGGGGC AAAGACCGGA 
TTATTCTATG CTGATGCGTT GACCCGCGAA CATTTGATAA CCTACGGAGC GGACGAGAAA 
ACAATTTCTC TGCAGAAACC CGAAGACTGC AGTTATGAAT CCGAGATTTA CCTTGATCTT 
GACGATATTG AACCGCTTCT TGCCATACCT CACCGGGTCG ATAACGCAGT ACCCGTTACA 
GAGTATTCGG GCACCCAGAT CGATCAGGTA TTTATGGGTA CCTGTACAAA CGGACGGTTT 
GAGGATCTCA AACGGTTCGC TGAAATCGTC AGAGGTAAAA AAGTCGCCGT CAGGACGATC 
GTTACGCCTG CTTCGAAGGA TGCATATGCG AAGGCTCTGT CGACTGGTGT CCTGTCCGAC 
ATACTTGAGG CGGGCTGCGT AATCTGTCCG CCCGGCTGCG GCCCCTGTCT TGGGGCACAT 
ATGGGTGTCC TTGGGGGAGG CGAGGTGGGT CTGTCCACAG CGAACCGGAA TTTCAGGAAT 
CGGATGGGGG TTGGTGCCGA GTATTATCTC TGTTCTCCGT CGACGGCTGC TGTTAGCGCT 
CTTTGCGGCG AGATCAGGTC GCCGGATGAA TGGAAGGGAG GTTTGAACCG ATGA

Protein sequence

MKMADTLSER ILGSAEGTYV DRMVDRAFAH DGTGAQALVA FENFRIQNKS VVNPEKLSII 
YDHISPANNS VTADLQGDLR KFSRQNGMHF HEVGCGICHQ IMSEGVCLPG EIVVGADSHS 
CTLGALGAFS TGVGATDMAG IWATGGTWFR VPESISIVLS GKLSGHTEPK DVALSYVKAL 
GMDGGTYKAL EFIGDGAAGM PVEGRLTLSN MAVETGAKTG LFYADALTRE HLITYGADEK 
TISLQKPEDC SYESEIYLDL DDIEPLLAIP HRVDNAVPVT EYSGTQIDQV FMGTCTNGRF 
EDLKRFAEIV RGKKVAVRTI VTPASKDAYA KALSTGVLSD ILEAGCVICP PGCGPCLGAH 
MGVLGGGEVG LSTANRNFRN RMGVGAEYYL CSPSTAAVSA LCGEIRSPDE WKGGLNR