Gene Mbar_A3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A3049
Symbol
ID	3624846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	+
Start bp	3927537
End bp	3928649
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	36%
IMG OID	637701890
Product	transposase
Protein accession	YP_306520
Protein GI	73670505
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00782519
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.671104
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAG CGTTCAAATT TAGACTCTAT CCTACAACTA CGCAGGCTGT TCAATTAAAT 
CAGCATATAG GTAGCTGTAG ATTTGTCTAC AATTGGGCAC TTGATCAGAA AATTAAAACT 
TATGAACAGA CAGGAAAATC AATTTCCAGA TTTGACTTAA ACAAAAAGCT TCCTGTCTTG 
AAAGCTTCTA ATGAATGGTT AGGAGAAGTC AATTCTCAAT CATTGCAGAG AATGACTAAG 
CAGGTTGAGT CTGCCTTCAC TCGATTTTTC CGAGAGAAGA ACGGCTTTCC TAAGTTCAAA 
TCTAAGAAAA ACCCAATTCA ATCTTTTCCT GTACCTCAAC ACTACTCCGT AGACTTTGAA 
AAAAACACTA TCAAGCTCCC TAAAATAGAA CCAATTAAAG CAGTTTTTCA CAGGAAGTTT 
GAGGGCGAGC TTAAAACAGC TACTGTTTCA AGGACATGTC AAGGACATTA CTACATTAGT 
ATCCTTGTTG AAGATGGAAA AGAACTTCCT ACAAAACAGA AGTATTCAGA ATCTACTACA 
GTGGGTATAG ATGTCGGGAT TAAGGATTTT GCTATACTTT CCACAGGAGA AACGATTGAG 
AATCCTAACT ACCTGAAAAA CTCTTTGAAC AGGTTAAAGG TTCTTCAAAA AAGAGCATCA 
AGGAAACTGA AAGGTTCTAA GAACAGGGTA AAAGCCAAAC ATAGGCTTGC TGTACTACAT 
GACAAAATAA CTAATCAGAG GAACGACTTC CAGAACAAAC TCTCTTTTAA ACTCATAAGC 
GAAAACCAAG CAATAGCTCT GGAAACTCTG AATGTTAAAG GAATGGTCAA GAATCATCAT 
TTGGCACAGG CTATAAGTGA TTCCGCATGG AGCAGTTTTG TAACAAAACT AGAGTATAAA 
GCTGAATGGT ACGGAAAAAC CATCCTGAGA ATTGGGCAAT TTGAACCATC TTCTAAAGTA 
TGTCATGTTT GTGGATATCA TAATTCATAT TTGACATTAA AAGATAGAGA ATGGACTTGC 
CCAGACTGTA AAACAAAACA TGATAGAGAT ATAAATGCCG CTATCAATAT CAAGAAATTT 
GCTCTCATAG ATCAAAATCT AATTGGATTA TAA

Protein sequence

MMKAFKFRLY PTTTQAVQLN QHIGSCRFVY NWALDQKIKT YEQTGKSISR FDLNKKLPVL 
KASNEWLGEV NSQSLQRMTK QVESAFTRFF REKNGFPKFK SKKNPIQSFP VPQHYSVDFE 
KNTIKLPKIE PIKAVFHRKF EGELKTATVS RTCQGHYYIS ILVEDGKELP TKQKYSESTT 
VGIDVGIKDF AILSTGETIE NPNYLKNSLN RLKVLQKRAS RKLKGSKNRV KAKHRLAVLH 
DKITNQRNDF QNKLSFKLIS ENQAIALETL NVKGMVKNHH LAQAISDSAW SSFVTKLEYK 
AEWYGKTILR IGQFEPSSKV CHVCGYHNSY LTLKDREWTC PDCKTKHDRD INAAINIKKF 
ALIDQNLIGL