Gene Mboo_1903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1903
Symbol
ID	5410860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	1966400
End bp	1967449
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	55%
IMG OID	640869141
Product	type II secretion system protein
Protein accession	YP_001405061
Protein GI	154151443
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1955] Archaeal flagella assembly protein J
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.697256
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTCA ACGATAGATT AAAGGGCATT CTTGGAAAAG AAAAAGATCC TCTCTCCCAA 
GCCCCGCCAC CGCTTTCCAA AAGCGAGATG GATTCCGTGG AAAAGGAACT GAGCGATATT 
TCCGGCAGGC TGGATACGGA ACGCAAGAGC CGGGAAGGGA TCGGGCGTTT TCTTAAGCAC 
CCGCTCAAGG TGCTCGTGGA AAAGCCCGAG AATATCCTTA TTGTCTGCGT CCCCCTGTCA 
CTTATCGTTT TTGTTGGTGG ATTTATCTCG ATGGTGAAGA TGTACGGCAT CTCCGTGCTC 
TTCAACTCAA CCGTGATTGA TGATTTTGCC GTTGCGGCGG TGCTCATTTC CATCATCCCG 
GTGGCAGTCC TCGATTTCCG GGAACAATCA CGGATGCGGA ACCTGGAGAC CGCACTCCCC 
AACTTCTTCC GTGATCTTGC CGGCATGAAT GATTCCGGTA TGACCCTGCC AAACGCGGTC 
CACCTGGTGG CAGGGGCGGA ATACGGTACC CTGTCCCCCC ATATCAGAAA ACTCGATAAC 
GAGATGTCAT GGGGAGTCGG TTTTGTCGAA GCCCTGTACC GGTTTGGGAA AAGCCTGGGG 
ACCCCGCTTG CCGACCGGAG TGTTGACCTG ATTGCCAAGG CAAGCAAGGC CGGCGGGGAC 
ATCAGCGAAG TGCTCCGTGC GGCGGCAAAC GATACCTTTG AGGTGGTCAA TCTTGCCCAG 
GAACGCCGGA ACAACATGCT GATTTACGTG ATCATCGTGA TTGTCTCATT TACCGTATTC 
CTGTTTGTTA TCGCGGTGCT CGTAAGCTCT TTCCTGAGCA CCATGGCAAC CGCAGGGACG 
GCCGCCCAAG TAACCGCGGC AAGCAGCAAA TTCATGGGAC GAATTGATCT CCCGGCCTAT 
AAGCGCCTGT TCTCCCATGC GGCTATGATC CAAGGCTTTT TCTCTGGCCT CTGCGCCGGG 
CAGATGGGCG AAGGCCGGGT CATTGCCGGG CTCAAATACT CCGCGATCAT GCTGATTGTC 
GCGTGGGTCA CCTTCCGGTT CTTCATCTGA

Protein sequence

MAFNDRLKGI LGKEKDPLSQ APPPLSKSEM DSVEKELSDI SGRLDTERKS REGIGRFLKH 
PLKVLVEKPE NILIVCVPLS LIVFVGGFIS MVKMYGISVL FNSTVIDDFA VAAVLISIIP 
VAVLDFREQS RMRNLETALP NFFRDLAGMN DSGMTLPNAV HLVAGAEYGT LSPHIRKLDN 
EMSWGVGFVE ALYRFGKSLG TPLADRSVDL IAKASKAGGD ISEVLRAAAN DTFEVVNLAQ 
ERRNNMLIYV IIVIVSFTVF LFVIAVLVSS FLSTMATAGT AAQVTAASSK FMGRIDLPAY 
KRLFSHAAMI QGFFSGLCAG QMGEGRVIAG LKYSAIMLIV AWVTFRFFI