Gene Mbar_A3374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A3374
Symbol
ID	3625682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	+
Start bp	4333101
End bp	4334531
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	41%
IMG OID	637702202
Product	hypothetical protein
Protein accession	YP_306827
Protein GI	73670812
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0508877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0110235
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAACG CAGGTCTGCA TGTCTCTCTT GATAATTTTT CCGTGAGGGT ACGCACAAGG 
AATTTCAATT ACTGGAATGT GAGTGGCGCA AACGTTGTGG GAGTTAAAGA GGGAAATGTC 
CTTAAAAATG AGATTATTCT CGTAACTGCA CATTATGATT CAAGAATAAT TGTACCTCCT 
AAACCCGGTC TACGAGGTTT TTTTGATTCC AGGGTCAAAA GGCCCTATCT CTGGCCGATC 
TGGTCCGATA CTTACGTTTG CGAATCGGCC AACGGAACAG GAGTGGATGA TAATGCAGGT 
GGAGTTGCCT GCATGCTTGA ACTTGCAAAA ACATTGCAGA ATAAGTCATT AAACAGGACA 
ATATATTTCA TTGCCTTTTC CGGAGAAGAG TCTAATCTTC TTGGCAGCCA GGCATGGGTT 
GAAGCCCATC CTGAGCTGAA AGACAATATT GTTGCAGTTG TTAATCTCGA CTGCGTAGGA 
AACGAACCTC TTTGCGTATG CTATCTTCCC CAGTATGCCT GGCTTAAAGA TATTTTTGAA 
AATGAAGCAA GAAATTCGGG GGTTAGAATT CAATCTGCAC TTATAGAAAG AGGAGATCAT 
GAAATCTTTT GGGAAAACCA CATTCCTGCA GTAGTCCTTT GCCACCACAA TTACAAAAGT 
CATGATAATT TCCACGAATT GAGTGATACA GTTGATAATA TCGATTTTTC GGTTATCAGG 
AATGCAAGTA CTCTGGCTGC AAGAAGTGTT ATTTATCTGG CAGATCCAGA TGAGAATCAG 
GCTCCTCTTG TTAATGTTTC CAATCCGGAG ATTTCAGAAG CCTCATTTGA ACTCATCTAT 
AACGTCTCCG ACCCCGAAAG TACTGTGGAA GTCTTTTTTG ACAATCAGAG CCTGGGAAAT 
CTCCAATCAG GCAGGACTTT TTCGCTTCCG GTAGGAGGAC ATACTATCAA GGTTCTGGCA 
ACCGACCGTT ATGGAAATAG AGGCACCGAG AGCATAAATG TTGTAAATAA GGAAAAACAA 
AGCAGAAGTT CTGAACCTCC TCATCAGGAA ATAGAGAGCT CTGAGAATGA GGTATCATAT 
GTAATCGGTT ATCTAGAAAA TTCCGTGGAC TCAAACAAAA CTCTTTATTA TTATCTGGAT 
GATTTCGGGC CTCTGGATCC CGAGAATCTT TTTGTTCTCA CCCCTGGTAG TCATAATTTA 
AAAATATGGT TTGAAAATGA AAACGGAACT CTGTTCATGG AGAATAAAAC TTCTGATTTT 
AGAAAATATT CCATGGAACG AGTCCAGGTA GATAACCCAT TCATGGATCG TAGAAATCCT 
CTTATCTTTG TCTCAGGTGT AGTTGCAATT TTGGCTGCTT TTGCGTTTTA TGGGAAGTGG 
ATAAAAAAGA GATTTTCGGG TCCAAAGGTC TCTGAAGATG AAAAAAAATA G

Protein sequence

MENAGLHVSL DNFSVRVRTR NFNYWNVSGA NVVGVKEGNV LKNEIILVTA HYDSRIIVPP 
KPGLRGFFDS RVKRPYLWPI WSDTYVCESA NGTGVDDNAG GVACMLELAK TLQNKSLNRT 
IYFIAFSGEE SNLLGSQAWV EAHPELKDNI VAVVNLDCVG NEPLCVCYLP QYAWLKDIFE 
NEARNSGVRI QSALIERGDH EIFWENHIPA VVLCHHNYKS HDNFHELSDT VDNIDFSVIR 
NASTLAARSV IYLADPDENQ APLVNVSNPE ISEASFELIY NVSDPESTVE VFFDNQSLGN 
LQSGRTFSLP VGGHTIKVLA TDRYGNRGTE SINVVNKEKQ SRSSEPPHQE IESSENEVSY 
VIGYLENSVD SNKTLYYYLD DFGPLDPENL FVLTPGSHNL KIWFENENGT LFMENKTSDF 
RKYSMERVQV DNPFMDRRNP LIFVSGVVAI LAAFAFYGKW IKKRFSGPKV SEDEKK