Gene Mbar_A0416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A0416
Symbol
ID	3626979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	501106
End bp	502146
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	39%
IMG OID	637699310
Product	hypothetical protein
Protein accession	YP_303979
Protein GI	73667964
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0322809
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.695963
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTGTC AAAAAGTTAA TATTTTTAGG AAAATATTGT TTTGTTTGGT TTTATTATTT 
CTTTGTTTGA TGAGCGCTTC TGCTACATAT GCTGAGACTT ATAATTTTGT TACTAAATGG 
GGTTCTTATG GCAGTGGCAG TGGACAATTT GCATGTCCAA CTGGTGTTGC TGTAGATTCT 
TCGGGTAACG TTTATGTTAC CGATACTGGC AATCACCGCA TTCAGAAGTT TAATAGCACA 
GGCGGTTACC TCACTCAATG GGGTTCTAAT GGAACCGACA ACAGACAATT TTTTTTACCA 
TATGGTGTTG CTGTCGATTC TTCGGGTAAT GTTTATGTTG CCGATAAGGG TAATAAATGC 
ATTCAGAAGT TTAACAGCAA CGGCGGACAC CTCACTCAAT GGGGTTCTTC AGGCAATGGA 
AACGGACAAT TTTATTTCCT AAATGGTGTT GCTGTAGATT CTTCGGGTAA TGTTTATGTT 
GCCGATAGTG GTAATAATCG CATTCAGAAG TTTAACAGCA ACGGCGGATA CCTCACTCAA 
TGGGGTTCTT ATGGTAGCGG CAACGGACAA TTTAATGATC CTGAGGGCGT TGCTGTAGAT 
TCTTCGGGTA ATGTTTATGT TGCCGATAGT GGTAATAATC GCATTCAAAA ATTTAACAGC 
ACAGGCGGAT ACCTCACTCA ATGGGGTTCT TATGGTAGCG GCAACGGACA ATTTGAATTT 
CCGTTGAGTA TTGCTGTAGA TTCTTCGGGT AATGTTTATG TTGCCGATAA ATATAATCAG 
CGCATTCAGA AGTTTAACAG CATAGGCAGA TACCTCACTC AATGGGGTTC TAATGGAACC 
GACAACAGAC AAATTTATGA CCCAAATGGT ATTTATGACC CAAATGGTGT TGCTGTAGAT 
TCTTCGGGTA ATGTTTATGT TGCTGAAACA GGATATTCAC GCATTCAGAA GTTTGCTCCA 
AATTTCGTAG ATTTTCCTTC AATTATTGTA CCTGTTGCTG CAATGCTTGT TTTAACAGTA 
ATATTTAGAC GTAAAAAATA G

Protein sequence

MKCQKVNIFR KILFCLVLLF LCLMSASATY AETYNFVTKW GSYGSGSGQF ACPTGVAVDS 
SGNVYVTDTG NHRIQKFNST GGYLTQWGSN GTDNRQFFLP YGVAVDSSGN VYVADKGNKC 
IQKFNSNGGH LTQWGSSGNG NGQFYFLNGV AVDSSGNVYV ADSGNNRIQK FNSNGGYLTQ 
WGSYGSGNGQ FNDPEGVAVD SSGNVYVADS GNNRIQKFNS TGGYLTQWGS YGSGNGQFEF 
PLSIAVDSSG NVYVADKYNQ RIQKFNSIGR YLTQWGSNGT DNRQIYDPNG IYDPNGVAVD 
SSGNVYVAET GYSRIQKFAP NFVDFPSIIV PVAAMLVLTV IFRRKK