Gene Mboo_0226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_0226
Symbol	trpD
ID	5410469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	213312
End bp	214331
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	62%
IMG OID	640867440
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001403391
Protein GI	154149773
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGA AAGAGGCGAT TGCCACCGTA GTGGAGGGAC GGGATCTTGC TCCCGCCCAG 
GCCGCGGCAG TCATGAACAT GATGATGGAT GGGCAGGCAA CTCCGGCCCA GATCGGGGGA 
TTTTTGACCG CACTACGCGC CAAGGGTGAG ACCCCGGAAG AGATCGCGGC GTTTGCCCGG 
GTCATGAGGG AGCATACGGT CCACGTAAAG CCACGGGTGT CCGGAACATT GGTCGATACG 
TGCGGCACCG GGGGAGACGG GGCGCAGACA TTTAACATCA GCACGGCTGC CGCCTTTGTT 
GCCGCGGGAG CCGGCATCAC CGTGGTCAAG CACGGCAACC GGAGCGTGAG CAGCCGGTGC 
GGATCGGCAG ATGTTCTTAC GGCTCTCGGT GTGGATATCA GCGTGGACCC GGGCCGGCAG 
GCAGGGATCG TACAGGAGAC CGGGATCATC TTTCTCTTTG CACCCAGCCA CCACCCGGCC 
ATGAAGCATG TGATGGCTAC ACGACAGGAT CTTGGCTGCC GGACGGTCTT TAACCTGCTC 
GGGCCGCTGG CAAATCCTGC GGGAGCGGCA GCCCAGGTGC TTGGGGTCTA CGATCAAAAA 
CTCACCGGTC CTATGGCAGA AGTCCTGAGT CTGCTAGGAG TGTCCCGGGC GATGGTCGTC 
TTTGGCTCAG GCCTAGACGA GATCACAGTC ACGGGCGAGA CAAGCGTGAC CGAACTTGCC 
AATAGCAGGA TCACGAACTA TATAGTTACA CCGGAACAGT TCGGATTTAC CCGGGCTGCA 
CCGGGCGATC TTCTTGGCGG TGACCCGGAG AAGAACGCAC GCATCATCCG CGCCATTCTT 
GACGGGGCGC CGGGCCCGGC CCGCGATATC GTGCTCATGA ACGCGGGCGC TGCCATTTAC 
GTGGGAGGCC GGGCTGCAAC CCTTGCAGAG GGAATCCGGC ACGCAGCGGA GTCCATTGAC 
TCAGGGAAAG CGGCGGGCAA ACTCGCCGCC CTCGTTACAG CAACCCGGGG TGCATCATGA

Protein sequence

MTMKEAIATV VEGRDLAPAQ AAAVMNMMMD GQATPAQIGG FLTALRAKGE TPEEIAAFAR 
VMREHTVHVK PRVSGTLVDT CGTGGDGAQT FNISTAAAFV AAGAGITVVK HGNRSVSSRC 
GSADVLTALG VDISVDPGRQ AGIVQETGII FLFAPSHHPA MKHVMATRQD LGCRTVFNLL 
GPLANPAGAA AQVLGVYDQK LTGPMAEVLS LLGVSRAMVV FGSGLDEITV TGETSVTELA 
NSRITNYIVT PEQFGFTRAA PGDLLGGDPE KNARIIRAIL DGAPGPARDI VLMNAGAAIY 
VGGRAATLAE GIRHAAESID SGKAAGKLAA LVTATRGAS