Gene Mboo_2013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2013
Symbol
ID	5411894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2083338
End bp	2084477
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	52%
IMG OID	640869255
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_001405170
Protein GI	154151552
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.258799
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.135742
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCCAA AATTTCACAA CAGGAAAAAA GAGCTTGCCG TAATAGCGGC AGTATCCCTC 
TTCATCCTGC TTTTCCTCAT TATTGCAGGA TGCACACAGA ATAGCAGCAG CACGAACTCC 
GCAGGATCCT CCGGTGCAGT AGCCTCGGTT TCATCCGGGG TAAATTCTTC CTTCTACACG 
ATCCGGGCAA ACGTGAATAA GGACTGCTCG GGAACTCCCT GGTATGTCGG CGTGATGAAA 
GGCTATTTTG TTAGCGGCGG CATTAATTTC GTTGACGCCG GTGCCCTTGA CTGGTCTCTC 
CAGCCGGCAG CTCTCGTCTC CGGACAGACC GACGTGGTGG ATGAACACCC CAACACGCTC 
ATCGATCTTA AGCTTGCAGG AGCCAATGTC ACTGGTGTCG CACTCAGCGG GCAGGAACCC 
CCTGAGGGCG ATATAAGTGA ATACCACATG CAATGGCTGG TTCTCAACAG CAGTCCCTAC 
TATACGATTC AGGATCTCGT TGCAAACGGT CACAAGCCAA AGATTGCCGT CGGTGCACTG 
GGTATCTGTG CGGACCTGGA GAATAACGCA TGGTTCCGTG CGAATAACCT ATCAAACACG 
AGTTTCCAGT ACGTCATAAT GCCCGATCCG CAGCAGGAAG CAGCTCTCCG TTCCGGACAG 
ATCGATGTTG CAGTCCTCCA CCCGCCATTC TATACAGCGG CTGAAAAACA TGGCGGTGTC 
CGGGTCATTA CGACTAGTTA TGATGCATTC GGACCGCAGG CGGGTACAAC CCTGCTTGTC 
TTCAGAGATG CTGACATCCA GGAACACCCG GATGATGTAA GAGCGTTCAT TAAAGCGTAC 
AAGAATGCGG AGAGATGGTC TGACAACCAC CTGACAGAAT CCGGTATACT GACTGCCGGT 
GTCATAGGGC TTTCCAATGC AACTCCTCAC TACTACAGTC AATCGGGTGC AATTACGGAT 
GACGAGATCC AGCCGTGGAT AGACGCAATG GTTGCAGACG GTGACATTGC GCCGGGACAG 
TTCAAACCCT CGGATCTGTA TACGACTGAG TTTAGCGATA CGTGGGTAAA TGAAACCGCG 
GTCAATGGAC CGGATCCGGT TGATCCCTTC CCGAGCCTGG AAAAGAGCAC ATACGACTGA

Protein sequence

MTPKFHNRKK ELAVIAAVSL FILLFLIIAG CTQNSSSTNS AGSSGAVASV SSGVNSSFYT 
IRANVNKDCS GTPWYVGVMK GYFVSGGINF VDAGALDWSL QPAALVSGQT DVVDEHPNTL 
IDLKLAGANV TGVALSGQEP PEGDISEYHM QWLVLNSSPY YTIQDLVANG HKPKIAVGAL 
GICADLENNA WFRANNLSNT SFQYVIMPDP QQEAALRSGQ IDVAVLHPPF YTAAEKHGGV 
RVITTSYDAF GPQAGTTLLV FRDADIQEHP DDVRAFIKAY KNAERWSDNH LTESGILTAG 
VIGLSNATPH YYSQSGAITD DEIQPWIDAM VADGDIAPGQ FKPSDLYTTE FSDTWVNETA 
VNGPDPVDPF PSLEKSTYD