Gene Mbar_A2754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A2754
Symbol
ID	3624998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	3501288
End bp	3502313
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	39%
IMG OID	637701607
Product	cell surface glycoprotein (S-layer protein)
Protein accession	YP_306237
Protein GI	73670222
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3420] Nitrous oxidase accessory protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00332846
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00111806
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAGAA AATCAATCCA AAACATCTGC ATAATCTTTC TTCTTGTGCT GGGTGCAACA 
GCTACTCAGG TAAGTGCTGC GGTTCTTACC GTAGGCGTTA AAGGGGGAGA AAATTATACT 
TCGATTCAAG AAGCTGTCAA TAATTCACAG AACGGGGATA CAATTGTTGT AAGCCCTGGT 
ATATACATAG AAAATGTAAA CGTGAATAAA GAAATTGCAA TTATCTCGAA AACTGATGTT 
TCGGGCGACA GGCTGAACCG TACCTATGTA ATAGGCGCAG TTCCGACAAA TGACGTCTTC 
AGTATTAACT CAAATAACGT GAAAATAACC GGTTTCCATA TTATGGGAGG TCCTTCAGGA 
ATTAATGCTT ATCAGGAAGT CGGGCTTTAC CTTGAAGGTG TGCAAAACTG CTCCTTAAGT 
AACAATACCC TGATGTTGAA TGATGTTGGC ATTGGCCTCA ACAATTCTCA AGGCAATTTC 
CTTGACAACA ATCGGATAGG TCTTGGATCT ACAGGAATCA TTCTTTCTAG ATCAAACGAA 
AACAAGTTGT CAAACAACCT GGTAGAGACA AATGACGAGG GAATCCTTCT GGATAATTCT 
ACTAACAATA CTCTCATGAA TAACACTGCA GAATCAAATG ATATAGGAGT CCTCCTTGCT 
ACTTCAAAAA CTAACACGCT TGGATACAAC TCCATTTCAA GAAACAGTTA TGGAATAGTC 
CTTGAAGATA TGGCAGAATC TAATACTTTG ACTAATAACA GCCTGTACAT GAATGGTCTT 
GGAATGTACC TTAGAGGGTC CACCGGAAAT ATGATTTCTC TCAATAAATT CTTCAACTTC 
ATCAATGCCG TAGATGAAGG AACAAATTCC TGGAACAGCA GTTCAGCAGG CAATAAGTGG 
AAAGATTATA ATGGAACAGA TGCTGACGGA AACGGTATAG GAGACACTCC TTATGTTGTT 
AACCAGACAA CCGGAAGCAT AGATTACATG CCTCTGGCAA ATAACGTTTC TTCAGGTAAT 
CAATGA

Protein sequence

MKRKSIQNIC IIFLLVLGAT ATQVSAAVLT VGVKGGENYT SIQEAVNNSQ NGDTIVVSPG 
IYIENVNVNK EIAIISKTDV SGDRLNRTYV IGAVPTNDVF SINSNNVKIT GFHIMGGPSG 
INAYQEVGLY LEGVQNCSLS NNTLMLNDVG IGLNNSQGNF LDNNRIGLGS TGIILSRSNE 
NKLSNNLVET NDEGILLDNS TNNTLMNNTA ESNDIGVLLA TSKTNTLGYN SISRNSYGIV 
LEDMAESNTL TNNSLYMNGL GMYLRGSTGN MISLNKFFNF INAVDEGTNS WNSSSAGNKW 
KDYNGTDADG NGIGDTPYVV NQTTGSIDYM PLANNVSSGN Q