Gene Mboo_2355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2355
Symbol
ID	5411884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	2419988
End bp	2421874
Gene Length	1887 bp
Protein Length	628 aa
Translation table	11
GC content	56%
IMG OID	640869611
Product	type II secretion system protein E
Protein accession	YP_001405512
Protein GI	154151894
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0630] Type IV secretory pathway, VirB11 components, and related ATPases involved in archaeal flagella biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.692167
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.583317
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCAC AGATAAAGAT ATCTGTCATT CTGCGACGAG TCGGTGCCGG AATCGCCGCA 
AACGCCCTCC CGTATCGCTG CCCGTTTGGC CGACGTTTCC TTTGGAAACA CTATTTATAT 
GAGTGTCTGC CGAACTATAA ACAGAAATAC GGGGTACCAC GCGAGGATGG ACGCATGAAG 
GTTTCAGATC TTTTTACCAG ACTCCGGGAA TACCGGTCCC GGGCCGGGAT GGCCGTGAAG 
GGTGCAGGTA CCCCGCAACC TTTGGCGGGA GATACCGGCA CCGCCCTGCA GTCATCCGGC 
ATCCGCGAGG CGAGCTACCG GCATTATTTC CGGTTCCTTA AAGGCCGTGA TAAACTGCCA 
GAGGAGGAGT ACGATCCTGC ACGGCACGGC CCGCTTGTGA AGGCCGAGAT CCCCGCCGGC 
TACGATCTTC TCGACCAGTA CTGGATTGAA GAGGGCCTGA CCCTTGTGTA TATCGCTCTC 
AACCGGAAGA CCAACCAGAC CGAGTACCTC CTCTTCGAAC CGCCGCTCTC GGAGTTTGAG 
TACGAGCTGC TCGAACGCCT CCATGAAGAC CTCCTTGATG TCCTGATCCT GACCTCAGAT 
GAGGTAAAAA CAGATCGGAA GAAAATCCTC CTCTCAAAGG TGCATGGCCT CCTCGACGAC 
TATGGCCTTG TCCTTGATGA GTCCGCACAT TTCAAGATCG AATACTACCT GATCCGGAAT 
TTCATCGGCT GGTCGCGTAT CGATCCGCTC ATGAAAGATC CCAACCTCGA GGATATTTCA 
TGCGATGGCA GCCGGATCCC GATCTTCCTG TACCACCGGA AACACCGGAA TATCAAGACC 
AACATCGCGT TCGAGGCCAC GGTCTTGAAT TCGCTTGCAA TCACCCTTGC CCAGCGTTCG 
GGAAAACACA TCTCTACCGG CTCCCCCCTG CTGGATGCCA CCCTTCCGGA CGGTTCGCGG 
CTCCAGCTGA CGCTCGGGAC CGAGGTAACT ACCCGGGGAA CCTCCTTTAC CATACGCAAG 
TTCCGCGAAG ACCCGTTTTC TCCCATTGAG CTTATGGAGT ACGGGACATT CTCCAGCGAC 
GAGCTGGTGT ACTTCTGGCT TGCCATTGAA AACGGTATGA GCCTGCTCTT TATCGGGGGA 
ACTGCATCAG GGAAGACCAC ATCGCTCAAT GCAGTCTCAC TGTTTATCCC CCCCATTGCC 
AAGGTGGTCA GCATCGAAGA TACGCGGGAG ATCACTCTCT ATCATGACAA CTGGATCGCT 
AGCGTCACCC GCGAGGCGCT CACTGAGGGC GGCAATGCCA TCAGCATGTT CGATCTTCTC 
CGGGCTGCAA TGCGGCAGCG GCCGGAGTAC ATTCTTGTCG GGGAAGTCAG GGGTCCTGAG 
GCACAGACGC TTTTCCAGGC AATGAATACC GGCCACACCA CGTTCTCCAC CATGCATGCA 
GGAAGCATCG ATGCGGCCAT CCACCGTCTG GAGAGCGCGC CGCTCAACGT GCCGCGTAAC 
ATGGTCCAGG CATTGAACGT CATTTGTGTT CAGGCCCTCA TCTACCGCGG TACAGAAAGG 
GTGCGGCGGG TCCAGGAGGT TGTCGAGATT GCCGGAATCG ATCCTGCTAC CGGGAACCTC 
CGGGTCAACA ATGTCTTTCA GTACGATCCA GTCCATGACC GGACCATCTA TACGGGTCGA 
TCCCAGATTT ACAGCATGAT CGCCACAAAA CGAGGATGGA CACGGGAAGA ACTCGATTAT 
GAGATCACCG TAAGGAAAAG CCTCCTCGAT GCCATGCATG CGCAGGGGAT CCGCGACTAC 
ATATCAGTTG CCTCACTCTT CCATAATTAT AATATCAACC GTGCGGACGT ACTCGCCCAC 
AACGACGATC TCAGACAGGT ACTCTGA

Protein sequence

MGAQIKISVI LRRVGAGIAA NALPYRCPFG RRFLWKHYLY ECLPNYKQKY GVPREDGRMK 
VSDLFTRLRE YRSRAGMAVK GAGTPQPLAG DTGTALQSSG IREASYRHYF RFLKGRDKLP 
EEEYDPARHG PLVKAEIPAG YDLLDQYWIE EGLTLVYIAL NRKTNQTEYL LFEPPLSEFE 
YELLERLHED LLDVLILTSD EVKTDRKKIL LSKVHGLLDD YGLVLDESAH FKIEYYLIRN 
FIGWSRIDPL MKDPNLEDIS CDGSRIPIFL YHRKHRNIKT NIAFEATVLN SLAITLAQRS 
GKHISTGSPL LDATLPDGSR LQLTLGTEVT TRGTSFTIRK FREDPFSPIE LMEYGTFSSD 
ELVYFWLAIE NGMSLLFIGG TASGKTTSLN AVSLFIPPIA KVVSIEDTRE ITLYHDNWIA 
SVTREALTEG GNAISMFDLL RAAMRQRPEY ILVGEVRGPE AQTLFQAMNT GHTTFSTMHA 
GSIDAAIHRL ESAPLNVPRN MVQALNVICV QALIYRGTER VRRVQEVVEI AGIDPATGNL 
RVNNVFQYDP VHDRTIYTGR SQIYSMIATK RGWTREELDY EITVRKSLLD AMHAQGIRDY 
ISVASLFHNY NINRADVLAH NDDLRQVL