Gene Mbar_A2944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A2944
Symbol
ID	3626143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	+
Start bp	3780681
End bp	3781787
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	45%
IMG OID	637701789
Product	hypothetical protein
Protein accession	YP_306419
Protein GI	73670404
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.81591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00297728
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGACTGA GCCAAAACCC TGACGGAGTA AGCCAGATCA TCGCCAGCCG ATGGAAAATT 
GGGGCAGCCC TGGCGGTAGC GCTGCTTCTG TACTTTGCGT TTCTAATTCT GCTGCCCCTC 
GCAGATGGAA TCGTACTGGG CATAGTCTTT GCTTACATTG CCAGGCCTAT CCGGGTAAAA 
TTCAAAAAAC ACAGAAAGGT GGGAGCTCTC GTTGCCAGTC TGTGCATATT CATCCCAATA 
GTATTCATTG TTGGGGCAGG TATTGTTGAG ATCCTTAACC AGATCTCCTG GGTTATTGAA 
CATCAGACAG CAGTTGCGGC AGCAATTTTG AATTTCATAA ACTCTCTGAA CATTCCAGAT 
AAAATCATAG AAAGTATTAA TTCCGCGATC TGGGACCTCT TTACCTCGCT GCTTCCTGCA 
GTTGGCAGTA TAGGGCTTCT TTCATATGCC CAGAGTATAG GTCTATTTTT CATTAATTTT 
TTAATCTCGA TCATTTTCTG CTATTTTGTA CTTGCTGATG GGGATCGGCT TTACTGCGCA 
TTTCTTGGTG TGATCCCAAA AGAGTACAAA GGAGTTGTAA ACTGTTACGC GCATCATCTT 
GATATAATCC TTAAAGGAGT TTTCATAGGC AATGCCTACT CTGCTCTGAT AGTAAGCGTA 
ACTTCGGTTT TTGTTTTCTA CTCTTTTGGG TTTACCCATG TACTTGCCCT AGCGACCCTT 
ATCTTTGTAG CTTCGATAAT TCCCCTTTTT GCCGGGTACA TGGTGCTGGT ACCTCTGGCT 
TTAATGCGGT ACTTTGAATC CGGGTTTAGA AGTGCAGCCA TTTTTTTTAC GGTATCCTCC 
ATCATTATCT ACGGCCCCCC AGAACTGATT CTCAGGCCTT ACCTGACCAG CTTGAAATCT 
AAGATTCACC CAATGCTGCT TATGCTCGCC TTCCTGGGCG GGGCTTTTGT CGGAGGGATT 
GCAGGATTTT TTGCAGCCCC TATTCTTCTC GGGGCTCTGG TTGCAGCTTA CAGGGTTTAT 
CAGGATCACA CCAATCCCGA AATTACCGAG ACCTGTGCAG ACTTCAAGAA CCTTGGACAT 
GCCCATAAGG CTGGTTCGGA AAAGTAA

Protein sequence

MRLSQNPDGV SQIIASRWKI GAALAVALLL YFAFLILLPL ADGIVLGIVF AYIARPIRVK 
FKKHRKVGAL VASLCIFIPI VFIVGAGIVE ILNQISWVIE HQTAVAAAIL NFINSLNIPD 
KIIESINSAI WDLFTSLLPA VGSIGLLSYA QSIGLFFINF LISIIFCYFV LADGDRLYCA 
FLGVIPKEYK GVVNCYAHHL DIILKGVFIG NAYSALIVSV TSVFVFYSFG FTHVLALATL 
IFVASIIPLF AGYMVLVPLA LMRYFESGFR SAAIFFTVSS IIIYGPPELI LRPYLTSLKS 
KIHPMLLMLA FLGGAFVGGI AGFFAAPILL GALVAAYRVY QDHTNPEITE TCADFKNLGH 
AHKAGSEK