Gene Mboo_1354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1354
Symbol
ID	5410600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	1379175
End bp	1380161
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	56%
IMG OID	640868586
Product	homoserine dehydrogenase
Protein accession	YP_001404515
Protein GI	154150897
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0271184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0214619
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGG CGCTGATCGG GCTTGGCTCG GTGGGACGCG GTGTTCTTGA AATACTTGCC 
AACAAAAATC TCGGTATCAC TATCACCGGG ATCGCCGATT CCAAGAGCGG GTGCATCGAT 
AACGCCGGCA TTGATCCTGA GGTTGTGCTT AAGGAAAAGC AGAGGACCGG CTTGTGCGGT 
GACCGCAGGA TCGATGCGGC TGCGGTGATC AGGAACGCGG ACTATGAGGT TCTTATCGAA 
GTTACCCCGA CCAATGCCCT GACCGGAGAA CCGGCTCTTG GGTACATACG GGCAGCCCTG 
GCACGAAAGA AGCACATTGT CACCTCCAAC AAAGGCCCGA TTGCCCTTGC TTACCGCGAT 
CTTGCGGGGC TTGCACAGAA GAAAGAAGTG GCGCTCCGGT ACGAGGCTAC GGTTGGCGGG 
GCAATCCCGA TCATGCATAC ACTCCAAGAC GGCCTGTGCG GGAACAGGAT TGTCGCGGTC 
CATGGGGTTC TCAACGGAAC CTGCAATTAC ATCCTTACCC GTATGGCTGC CGAGGGACTC 
ACCTACGAAC AGGCACTGCT GGAGGCTCGG GAGATGGGAT ATGCCGAGGC CGATCCCACC 
TACGATGTAA AAGGGATCGA TGCTGCTATA AAACTCGTCA TCCTAGCAAA TACGGTCTGG 
GACAATGGTG TCACGCTTGC CGATATTGAT ATCACCGGCA TCGACCTCCT CACCCCGGAC 
GCCCTGCGCT TGGCTGAGGA AGGGGACAGC ACCATCCGCC TGATCGCTGA GGCCATCCCG 
GATAAGAAAA TATTCCGGGT CTCGCCGCGC ATGATCGAAA AAAGCCACCC TCTCGTAGTC 
GAAGGATCGC TGAATGCGCT CACCCTCGAG ACCGACATGG CAAAGGAGAT CACGCTGATT 
GGAAAAGGTG CCGGATCGAT CGAGACGGCG AGTGCGATTA TCGGAGATAT CCTGTATATC 
CGCGACCATT ATGGCAAGCG TGCTTGA

Protein sequence

MKAALIGLGS VGRGVLEILA NKNLGITITG IADSKSGCID NAGIDPEVVL KEKQRTGLCG 
DRRIDAAAVI RNADYEVLIE VTPTNALTGE PALGYIRAAL ARKKHIVTSN KGPIALAYRD 
LAGLAQKKEV ALRYEATVGG AIPIMHTLQD GLCGNRIVAV HGVLNGTCNY ILTRMAAEGL 
TYEQALLEAR EMGYAEADPT YDVKGIDAAI KLVILANTVW DNGVTLADID ITGIDLLTPD 
ALRLAEEGDS TIRLIAEAIP DKKIFRVSPR MIEKSHPLVV EGSLNALTLE TDMAKEITLI 
GKGAGSIETA SAIIGDILYI RDHYGKRA