Gene Mboo_2111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2111
Symbol
ID	5411209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	2186100
End bp	2187041
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	59%
IMG OID	640869356
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_001405268
Protein GI	154151650
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGATG AGACCATCAG GATCGGCCAT CTCTCCACCC TTTACCATAC TGCGTTCCTG 
CTCCGCGGCT CGGATCTTCT TGCACAACGG GGTGTCCGTG CAACCTGGTC GCTCTTCCCC 
TCGGGGCCGG ATATCATCAG TGCAATGCAG GCAGGGCGGC TTGACCTTGG GTATATCGGT 
ATGCCACCGG TCATCATAGG GATCGACCGG GGGCTGGAAC TTGCCTGTAT CGCCGGCGGC 
CATATCGAAG GAACGGTCAT GATTGCGGAC AGTACGATCC GGACCCTTGA TGAATGCGGC 
AGCATGCAGG CGTTCTTTTC CCAGCTTGCA GGAAAAGCGA TCGGGACACC CCCGAAAGGC 
TCCATTCATG ATGTGATCGT TACCGATCTG CTGGAAAAGA ACAGGAGGCC GGACATCTCC 
GTGCGCAACT ATCCCTGGGC AGACTTCCTC TCCGATGCAC TCGTACAGAA GGAGATTGCC 
GCTGCCGCCG GTACCCCGGC GCTTGCAACA ACTGCCCGGA CGTACGGGAA TGGCAGGATC 
GTGATCCCGC CGGACCGGCT CTGGCCGTTC AATCCCAGCT ATGGCATCGT GGTGATGCGC 
AGGATGCTTA AAAATCGCGA TCTCCTTACC CGGTTTTTAA CCGCCCATGA GGCTGCATGC 
GAGTGGATCC GCAGTGACCC GGCTGCATGT GCACGGATCG TGGCAGGGAC AACCGGGATG 
GTGGACCCAG GTTTTGTTCT TGAAACCTAC CGGATCTCAC CGAAATACTG CGCGGCGCTG 
CCGCCGGAGT ATATCGCGTC CACCATGAAG TTCGCACAAA CGCTTCATAC CCTCGGGTAT 
ATTTCCCGCC TGATCCGCGA GGACGAGTGC TTTGAGCGGT CACTGATAGA AATCGTCCAC 
CCGGGACCCC ACCATTACGC TGACGGGATC GCAGACGCGT GA

Protein sequence

MPDETIRIGH LSTLYHTAFL LRGSDLLAQR GVRATWSLFP SGPDIISAMQ AGRLDLGYIG 
MPPVIIGIDR GLELACIAGG HIEGTVMIAD STIRTLDECG SMQAFFSQLA GKAIGTPPKG 
SIHDVIVTDL LEKNRRPDIS VRNYPWADFL SDALVQKEIA AAAGTPALAT TARTYGNGRI 
VIPPDRLWPF NPSYGIVVMR RMLKNRDLLT RFLTAHEAAC EWIRSDPAAC ARIVAGTTGM 
VDPGFVLETY RISPKYCAAL PPEYIASTMK FAQTLHTLGY ISRLIREDEC FERSLIEIVH 
PGPHHYADGI ADA