Gene Mboo_0254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_0254
Symbol
ID	5410971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	237066
End bp	238265
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	58%
IMG OID	640867470
Product	nucleotidyl transferase
Protein accession	YP_001403419
Protein GI	154149801
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATGCG TTGTGCTGGC AGCGGGGGAG GGAAAACGCA TGCGTCCCCT TACTGCCCGG 
CGACCGAAAG TGATGCTCCC GGTGGCAAAC CGCCCGATGA TGGAGCATCT TGTACTTGCG 
GCCCGGGATG CCGGCATCAC CGAATTTGTC TTTGTGGTCG GGTATGGGGA GCGTGAGGTC 
CGGAACCATT TCGGAAACGG GGAACGCTTC GGGATCCAGG TGGCATATGC ACCGCAGCGG 
CAACAGTCGG GAACCGCAGA TGCCCTCCGC TCGGCACAGG ACCTTGTCAC AGGCCCGTTC 
CTTGCAATGA ACGGGGACAT GATCCTCTCC TCTGCCGACA TAGCCCGGAT GATCGATGCA 
CCGGCGCCTG CCATGGGAAC GAGCACCACC GACCATCCCG GGGACTTCGG AGTCGTACTC 
GTGGAAGACG GCCGGGTCCT CTCATTAGAG GAGAAATCGA AACACCCGAA ATCCAACATC 
ATCAATGCCG GGGCGTATTC CTTTACCCCG GAGATCTTTG AGCTGCTCGC CGGGATCAGG 
CTCTCGGAGC GGGGCGAACT CGAGCTCACT GATGCTCTTG GCATCCTTAT CGCACGGCAT 
GATCTGGGAG CAGTCCCCCT CTCAACATGG AGGGATATAG GATATCCCTG GGACCTGCTC 
GATGCAAATG CTGCCCTCCT TTTGGGGCTC AATTCTCAGA ACGAGGGCAT CGTTGAGGAG 
GGTGTCCATC TCTTGGGCCC TGTGGCAGTC GGTGAAGGCA CTGTGATAAA ATCGGGCACA 
TACATCGAGG GGCCCTGCAT CATAGGAAAG AACTGCCGGA TCGGGCCGCA TGCCTATATC 
AGGGGAGCCA CGAGCATCGG CGACGAAAGC CACATCGGGC ACTGCACCGA GATCAAGAAC 
ACGGTTGTCA TGGCAAGGAC CAAGATTCCC CACTTCAACT ATATCGGTGA TTCGGTGATC 
GGCAGCGGGT GTAATTTCGG TGCAGGGACC AAGATTGCAA ATCTCAGGCA CGATCATGGC 
CCGGTAAAGG CCGGTGGGAA GGATACCCGG CACACCAAAT TTGGCGCGGT TGTCGGGGAC 
AACGTGCACT TTGGGATCAA CTGTTCGGTC AATGTCGGAT CGGTGATCGG CAGCAATGCA 
CAGTTCGCGC CCAACTCGGT TATCGAAGGG AGTTTTGGCG AGGACGCGGC GATCCGGTAG

Protein sequence

MQCVVLAAGE GKRMRPLTAR RPKVMLPVAN RPMMEHLVLA ARDAGITEFV FVVGYGEREV 
RNHFGNGERF GIQVAYAPQR QQSGTADALR SAQDLVTGPF LAMNGDMILS SADIARMIDA 
PAPAMGTSTT DHPGDFGVVL VEDGRVLSLE EKSKHPKSNI INAGAYSFTP EIFELLAGIR 
LSERGELELT DALGILIARH DLGAVPLSTW RDIGYPWDLL DANAALLLGL NSQNEGIVEE 
GVHLLGPVAV GEGTVIKSGT YIEGPCIIGK NCRIGPHAYI RGATSIGDES HIGHCTEIKN 
TVVMARTKIP HFNYIGDSVI GSGCNFGAGT KIANLRHDHG PVKAGGKDTR HTKFGAVVGD 
NVHFGINCSV NVGSVIGSNA QFAPNSVIEG SFGEDAAIR