Gene Mlab_0544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0544
Symbol
ID	4794809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	+
Start bp	518911
End bp	520185
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	54%
IMG OID	640099202
Product	hypothetical protein
Protein accession	YP_001029985
Protein GI	124485369
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.128255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.0869849
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCTCTG AATATCAAAA GGAAACACTC AGCATTCATG CCGGACAAAA ACCGGATGAA 
GCGACAGGGG CACGAACCGA ACCGATCTAC ATGACCACGG CATATGTCTT CAAAGACGCA 
AAGGAAGCGG CTGCACGATT CGATCTCTCG CTGGACGGAA ACATCTACAC CAGGCTTACG 
AATCCAAACA ACACCTCGTT TGAAAAACGG ATCTCCGCGA TCGAGGGAGG GACAGCCGCA 
ATCAGTACTG CCTCGGGGAT GGCGGCAATA AGCACCCTTG TCCTTGCCCT TACCAACCCG 
GGTGACGAGA TTGTTTCGGC CGATAATCTG TACGGAGGGA CATTCGAGCT TTTCAGCCTG 
ACCCTCCCGA ACTTCGGACG GACGGTCCGG TTTGTTCCCT CGAACGATCT CGAAGCCTTA 
AAGGCCGCCA TCAATGAAAA GACACGGGCC GTCTACTTTG AATCGCTCGG CAACCCCAAA 
CTTGACATCC CGGATTTCGA GGAGATCGGA AAAATAGCTC ACGAAGCCGG AGTTCCTTTT 
ATTGTGGACA ACACGGTAGG GATCGGAACG GTCCGTCCTC TCGAGCATGG AGCGGATCTT 
GTTGTTATGT CGGCAACAAA ATATGCCAAC GGACATGGGA ATTCCCTTGC AGGCGTGATC 
GTCGAAAACG GCAGATTCCC CTGGGACAAC GGCAAATTCC CCAAGTTCAC CGAACCTGAT 
CCGGCATACA AAGGTCTCGT GCACTACAAA GCATTCGGTC CGGCAACCGT ATCGGCCAGT 
ATTCGAATCT CCCTGATGCG GGATCTTGGG GCGACCCTTT CACCGTTCAA CGCCTGGCTC 
ACTTCGATCG GTCTTGAAAC GCTCTACCTC CGTGTCGCCC GCCATGCGGA GAATGCCCTT 
ATTGTTGCGA AGCATCTCGC ATCCCACGAA AAGGTCGCAT GGGTCAACTA TCCGGGTCTT 
CCAGGGCATC CCTCGGAAAA GAACCGGGAA AAATACTTCG GCGGATCCGG CGGTCCCCTT 
CTCACCTTCG GCGTCAAAGG AGGATATGAG GCGGCCGTCA CCGTACAGAA TAATGTCCAG 
CTCATCTCGC TTCTGGCAAA CATCGGCGAT GCAAAAACCC TCATCATCCA TCCAGCCTCG 
ACGACCCATC AGCAGCTTAC CGAAGAAGAA CAGATTTCCA CAGGGGTCAG ACCCGATACG 
ATCCGCCTCT CGGTCGGTCT TGAAAATCCG ATCGACATCA TCGCCGATCT GGACCATGCC 
CTCTCATACA TCTAG

Protein sequence

MVSEYQKETL SIHAGQKPDE ATGARTEPIY MTTAYVFKDA KEAAARFDLS LDGNIYTRLT 
NPNNTSFEKR ISAIEGGTAA ISTASGMAAI STLVLALTNP GDEIVSADNL YGGTFELFSL 
TLPNFGRTVR FVPSNDLEAL KAAINEKTRA VYFESLGNPK LDIPDFEEIG KIAHEAGVPF 
IVDNTVGIGT VRPLEHGADL VVMSATKYAN GHGNSLAGVI VENGRFPWDN GKFPKFTEPD 
PAYKGLVHYK AFGPATVSAS IRISLMRDLG ATLSPFNAWL TSIGLETLYL RVARHAENAL 
IVAKHLASHE KVAWVNYPGL PGHPSEKNRE KYFGGSGGPL LTFGVKGGYE AAVTVQNNVQ 
LISLLANIGD AKTLIIHPAS TTHQQLTEEE QISTGVRPDT IRLSVGLENP IDIIADLDHA 
LSYI