Gene Mboo_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1024
Symbol
ID	5411487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	1003547
End bp	1004755
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	55%
IMG OID	640868250
Product	hypothetical protein
Protein accession	YP_001404185
Protein GI	154150567
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.210647
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.67232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGA TTTTCTGGGA GATCTCAAAA CGCAATATCC GGATTCATAT GCTTCGTTCG 
TCCCTTGCGA TGCTTGGGAT CATTATCGGG GTAGTTGCCA TCGGCGCCAT GGGAATTCTT 
GGGAACAGCA TGACCCAGGA TATCAGTTCC AGCCTCTCGT CCGTGGGAGA CAGCGTGATC 
GTCACCCCAT ACTCCGGCAG CGGCGGAATG GGACCGGGTG GCGGAGGCAG TGGGGGAAGT 
TCACAGAACA TGTACCTTTC CGACCAGAAT TACCAGCAGA TCGAACGGGC CGTTGCCCCG 
AACGTTGCGA TCCCGGTCCA CTCCACATCC GAACACATGT CGGTCGGCGT GGGCAGCACC 
GACATCGTGG CAACTATCTA CGGCCTCCCG ACCGACAAGG TAAAAGACCT GCTTCCCACT 
CTTCAATCCG GGGACTACAG TAACGGGAAT TCCGGCTGCC TTGTCGGGGC GACGTTCGCA 
TCGGACCATA ATGTCCAGGT CGGATCCCGG ATCACGATCG GGCAGGATGG CGAGTACGGG 
ACACTCCGGG TGACCGGCAT CATCCCGGAG CGGGGGATGA GTTTTGATAT CAGCACGGAC 
AGTGCGATCG TTGTTACCCA GGACTGGTTT GAGAACACGT ACAATGATCA ATATGAGTAC 
AATGAGGTTG TCGTAAAGGT AACAAGCGGC ACTACCGCCG GGGTCACAAC AACCATTGAA 
AAGCAGCTCA ACCGGAATAC CCGGGAGAAG ACCGTAACGG TCACCGACAG CCAGGCAACG 
CTTGCAACGA TCTATTCGAC ATTTAGTACA GTAACGCTCT TTGTCACCGC AATCGGCGGC 
ATCTCCATGG TAGTAGCCGG CGTCTCCATC TTCAACATCA TGATGATGTC GGTATCTGAG 
CGGATCAAGG AGATCGGGAT CATGCGCAGC ATCGGCACCC AGAAACGGGA GGTGATGAGC 
ATGTTCATCT ACGAAGCCGG GATTATCGGT GTCGTTGGGA GCCTTGTCGG AGGAGTTCTC 
TGCCTCCTTG CGGGTTATGC GGTGAGTGCG CTGATGCTTG GTACTACCAA GTACCTGTTT 
ACGGTTTCCA GTATGAGCTC GGTAGTGGAA GGTGTGGTGT TTGGGATTAT CATCTGCATT 
GCCTGTGCAG TATACCCGGC GTGGCAGGCG GCTAATCTTA ACCCGATCGA TGCACTGAGG 
CACGAGTGA

Protein sequence

MSGIFWEISK RNIRIHMLRS SLAMLGIIIG VVAIGAMGIL GNSMTQDISS SLSSVGDSVI 
VTPYSGSGGM GPGGGGSGGS SQNMYLSDQN YQQIERAVAP NVAIPVHSTS EHMSVGVGST 
DIVATIYGLP TDKVKDLLPT LQSGDYSNGN SGCLVGATFA SDHNVQVGSR ITIGQDGEYG 
TLRVTGIIPE RGMSFDISTD SAIVVTQDWF ENTYNDQYEY NEVVVKVTSG TTAGVTTTIE 
KQLNRNTREK TVTVTDSQAT LATIYSTFST VTLFVTAIGG ISMVVAGVSI FNIMMMSVSE 
RIKEIGIMRS IGTQKREVMS MFIYEAGIIG VVGSLVGGVL CLLAGYAVSA LMLGTTKYLF 
TVSSMSSVVE GVVFGIIICI ACAVYPAWQA ANLNPIDALR HE