Gene Mbar_A0259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A0259
Symbol
ID	3624968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	308589
End bp	309776
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	51%
IMG OID	637699151
Product	putative protease
Protein accession	YP_303823
Protein GI	73667808
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCAA AATATGTTAT CCTGCACAGC AGTGAGATAT TACCACCTTC ACGGGGAGAT 
ATAGGAAGAG CACGCCGAGC AGAAGTATTC CCCTTGGAAG CGGCCCAACC AATCGTCAAG 
TTAGAGTACG CCGAACTTAC CAAGCGGGAG AGCAATGATC TGCGCAGAGA TCCCAGAACA 
CTTGCCATTG CCAAACCTAT GCCAATGAAA CTGATTGCAC CGGTTGGTAG CCTTGATGCA 
CCAACAGCTA CAAAATCCTG GGGAATCGAC GCAGTACGTG CATCGGAATC GCCATTTGAT 
GGAACCGGTG TCACTGTAGC TGTGCTAGAT ACTGGAATCG ATCCAAATCA CCCAGCATTT 
AAAGGCATGA AGCTGGTTCA GAAGAACTTC ACTACGGAAA TCGATAATGA TATTCATGGG 
CATGGCACGC ATTGTGCAGG GACCATTTTT GGCCAGGATG TCAATGGTGT CCGCATCGGC 
ATCGCTAGAA AAATTAAATG TGCCCTAATT GGCAAGGTGC TGGGCAAAGA AGGAGGTTCC 
TCAGACACGA TCGCCAAGGC CATCCAGTGG GCAGTCCAGG AAGGCGCAAA TGTCATTTCC 
ATGTCCCTAG GTATTGATTT TCCGGGCTAT GTAGATTGGC TGGTTCATGA CCAAGGCATG 
AATATTAACC CAGCAACATC CCAGGCGCTG GAAGAGTATC GTGCAAACGT CAACCTGTTC 
ACCGAGTTAG TGCGCGTCGT GGCAGCACAT GGGGCATTTG GGCAATCTGC AATCATCGTT 
GCGGCCAGCG GTAACGAAAG CAATCGGCCT AAATACGAAA TTGCAGTCTC CCCTCCCGCT 
GCCGCCACAG GCATCGTTGC CGTTGGCGCA CTGAATAAAT CAGGCAAGGG CTTTAACGTT 
GCCGAATTTT CAAATAATCA GGTGAACATT GCCGCCCCTG GCGTTAACAT CATCTCTGCT 
AAAGCAGGCA CGAGTGGCCT TATCAGTATG AGTGGGACCA GCATGGCGAC ACCTCACGCT 
GCGGGTATTG CTGCCCTATG GGCACAGCGT CAACTGAAAT TGACCGGGAG GATAAATAAC 
GTGAGCTTGA TGGCGCAACT TATTGCTAGT GGCACCTTTG ACTCTCTAGT CCCAGGCAGC 
GAAGAGGATG ATGTGGGTAC AGGCATCATT CAGGCACCAT TGAAGTGA

Protein sequence

MDSKYVILHS SEILPPSRGD IGRARRAEVF PLEAAQPIVK LEYAELTKRE SNDLRRDPRT 
LAIAKPMPMK LIAPVGSLDA PTATKSWGID AVRASESPFD GTGVTVAVLD TGIDPNHPAF 
KGMKLVQKNF TTEIDNDIHG HGTHCAGTIF GQDVNGVRIG IARKIKCALI GKVLGKEGGS 
SDTIAKAIQW AVQEGANVIS MSLGIDFPGY VDWLVHDQGM NINPATSQAL EEYRANVNLF 
TELVRVVAAH GAFGQSAIIV AASGNESNRP KYEIAVSPPA AATGIVAVGA LNKSGKGFNV 
AEFSNNQVNI AAPGVNIISA KAGTSGLISM SGTSMATPHA AGIAALWAQR QLKLTGRINN 
VSLMAQLIAS GTFDSLVPGS EEDDVGTGII QAPLK