Gene Mlab_1525 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1525
Symbol
ID	4794539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	+
Start bp	1557768
End bp	1558913
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	53%
IMG OID	640100211
Product	protein tyrosine phosphatase
Protein accession	YP_001030956
Protein GI	124486340
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.469946
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.164235
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATC CGTTCCATGT CATGATCATT CCGACACTCG GCTGCCCCGG GCGCTGCAAA 
TACTGCTGGA GTTCGGACGA AACTTCACCG AGGATGACGC TTGACACGAT AGATGATATT 
GTCACGTGGC TCAAACCGCT CGAAGACCAG CGGGTCACAT TTACCTTTCA CGGCGGAGAA 
CCCCTGCTTG CCGGAGCCGA GTTTTACCGG CAGGCGTTCA AGAAGATCAC AGAAGGACTC 
CCGCATCTCT CGCCCGAGTT TGCCATTCAG ACCAATCTCT GGCTGATGGA TGACGAGCTC 
GCCGAAATCT TTGCAGAATA CCAGGTCCCA ATCGGATCTT CCATCGACGG ACCGCAGGAG 
CTGACGAATT ATCAGCGGGG CGATGAATAC TTTGAACGCT GCCTCGCCGG CTACAAGATC 
GCCGTGGACC ACGGACTTCT GGTCAGGTTC ATCTGTACGT TCACCAACTC TTCCGTTAAG 
CAGAAAGAAG CGATCGTGAA CTTTTTCAAA GAACAGGGCT GGGTGATGAA ACTTCATCCG 
GCTCTGCCGT CCCTGAAAGG AGAGAATCCG AATGCATGGA CCCTTGCCCC GGAGGAGTAC 
GGCGAGTTGC TGGTCTTTCT TCTGGACGAG GCGATCGAAC ATGCAGACGA TCTTGAGATC 
ATGAACATCA ATGATCTCTG CAGGTGCGTG TTTACCCGGG CAGGGAGCGT TTGCACCTAT 
GCGGATTGTA TGGGAACCAC GTATGCCGTT GGACCGGACG GGGAAATTTA TCCCTGTTAC 
CGGTTTATCG GGATGCCGGA ATGGGTAATG GGCCATGTCA GGAATGCTCC GTCAATCGAG 
AGCCTGATGG AGAGCCACGC AGGAAAACGG ATGCTGGCGT TCAAGGAATT TGTGGACACG 
GCATGTAAAG ATTGCGCCCA TATCACGTAC TGCAGAGGGG GATGTCCATA TAATGCAATA 
GCACCGACCG GAGGGTCTCT CGAGGGGGTC GATCCCCACT GTACTGCATA CAAGAGGATC 
TTCGATGAGA TCACAACACG GCTGAACGAG GAGATGAATG CAGCGCCGGT GAGCAGAGTT 
TCACGAGTGA AGAGGCAGAA AAAGCCAAGC GTTACGAGAC TTATTCAGAA AATCGTTGAG 
GAATAG

Protein sequence

MKNPFHVMII PTLGCPGRCK YCWSSDETSP RMTLDTIDDI VTWLKPLEDQ RVTFTFHGGE 
PLLAGAEFYR QAFKKITEGL PHLSPEFAIQ TNLWLMDDEL AEIFAEYQVP IGSSIDGPQE 
LTNYQRGDEY FERCLAGYKI AVDHGLLVRF ICTFTNSSVK QKEAIVNFFK EQGWVMKLHP 
ALPSLKGENP NAWTLAPEEY GELLVFLLDE AIEHADDLEI MNINDLCRCV FTRAGSVCTY 
ADCMGTTYAV GPDGEIYPCY RFIGMPEWVM GHVRNAPSIE SLMESHAGKR MLAFKEFVDT 
ACKDCAHITY CRGGCPYNAI APTGGSLEGV DPHCTAYKRI FDEITTRLNE EMNAAPVSRV 
SRVKRQKKPS VTRLIQKIVE E