Gene Mbar_A2700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A2700
Symbol
ID	3624810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	+
Start bp	3424584
End bp	3425726
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	45%
IMG OID	637701554
Product	arylsulfatase regulator
Protein accession	YP_306184
Protein GI	73670169
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00619293
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.114693
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTTC ATGTGATGCT AATCCCTACC CTTGGTTGTC CTGCTAACTG CAGCTACTGC 
TGGAGTTCCG AAGAAAAGTC TCCGATAATG AGCATTGAAA CTATAAAAGA AGTGGTTGAG 
TGGCTTAAAA CTTTTAGAGG AGATGCCGTA ACTTTCACTT TCCACGGCGG AGAACCACTC 
CTGGCAGGAG CGGAATTTTA TCGGGAAGCA TTGCCTCTTC TGGTTGAGGG CTTGAGCCCG 
AGGAAAATCG CGTTTGCGAT ACAGACGAAC CTCTGGAAAA TGACCCATGA GATGGCCGAA 
ATTTTTGCGG AATACGGGGT TCCGATAGGC TCCAGCCTGG ATGGCCCAAA GGAACTTAAT 
GACCTGCAGA GGGGAAAAGG ATACTACGAT AAAACCATGA AAGGCTATGA AATTGCCAGG 
GAACATGGGC TTAATGTGAG GTTCATTACC ACTTTCACTT CTCATTCCGT AAAACAAAAG 
GAAGAAATTT TCAATTTTTA TCTTGAGAAA GGATTGACTC TCAAACTCCA CCCCTGCCTG 
CCTTCTTTAA AAGGTGACAA TCCTGATAAA TGGACTCTTG CTCCTGTGGA GTACGGAGAA 
TTATTAATCT ATCTCCTGGA CAAATATCTG GAAAACCTGG GCCGGATTGA CGTTATGAAC 
ATTGATCAGC TGTGCAAATG CGTATTCACA GGCAGGGGAA CAGTCTGCAC CTACGTTGAC 
TGCATGGGAG ATACCTTTGC AGTCGGCCCT GAAGGAAACA TATATCCCTG CTATCGCTTT 
GTTGGGATGC CTGAATATGT TATGGGCAAT GTTTATGACC GCCCGACAAT GGCAGACCTT 
GCTAAATCCG AAGCCTGGAA GCAGATGCAC CAGTATAAAG AATATGTGGA TACTGCATGC 
AGCAAATGCG CCCATATCAA ATATTGCAGA GGCGGATGCC CGTACAATGC AATAGTGCCC 
ACCGATGGCG AGATAAAGGG TGTAGATCCG CACTGCACCG CCTACAAGAT GATTTTTGAT 
GAAATAAACA AGCGTGTCAA TGAGGAAATG TTCGGGGGTT CAGGTATGGA TAATATGTTT 
ATGCCCCAGA CAATGAAGCC TTCAAAATCA GGAATAATGT CCCTTATGCT TAAGAAACTC 
TGA

Protein sequence

MPFHVMLIPT LGCPANCSYC WSSEEKSPIM SIETIKEVVE WLKTFRGDAV TFTFHGGEPL 
LAGAEFYREA LPLLVEGLSP RKIAFAIQTN LWKMTHEMAE IFAEYGVPIG SSLDGPKELN 
DLQRGKGYYD KTMKGYEIAR EHGLNVRFIT TFTSHSVKQK EEIFNFYLEK GLTLKLHPCL 
PSLKGDNPDK WTLAPVEYGE LLIYLLDKYL ENLGRIDVMN IDQLCKCVFT GRGTVCTYVD 
CMGDTFAVGP EGNIYPCYRF VGMPEYVMGN VYDRPTMADL AKSEAWKQMH QYKEYVDTAC 
SKCAHIKYCR GGCPYNAIVP TDGEIKGVDP HCTAYKMIFD EINKRVNEEM FGGSGMDNMF 
MPQTMKPSKS GIMSLMLKKL