Gene Mpal_2151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2151
Symbol
ID	7270234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	2284943
End bp	2285992
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	60%
IMG OID	643570765
Product	aminotransferase class I and II
Protein accession	YP_002467172
Protein GI	219852740
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.518477
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGTTC TGCATATCTA TCAAGGAGAT AATGGCAGGG TGGAGATGAA ACTGGGGAAG 
AGAAGGCAGT ACCGGCGAGC AGTCCATGGG GGTGTGCTTC CCGATCAGTC CCTTCCGGGA 
GAGACGATCA TCGACTTCAG CGCAAGTATA AATCCGTTTC CCCCGGAGGT GGCCTGGGAT 
CCAGCATCGG TTCCTGTTCA CCGGTATCCT GATAACCGGT ACTCCGCCCT TAAGGCGGTG 
ATTGCAGAGA CCTTCCACCG GGACCCGGCA GAGGTGACCG TCGGAAACGG CTCTGCCGAA 
CTGATGCGGG TCTTCTGTCA GGTGGCACTC AGTCCGGGGG ATTGCGTCAG GATCGACCGG 
TCCACGTTCG AAGAGTATGC GGTCTCTGCC GAAATCGCCG GCGCCATCGT CGACGAACAC 
GCCAAAAACC CTGTCGTTCG GTTCCTCTGC AACCCGAACA ACCCGACCGG GATGCTGGCC 
CCAAAGAGTA CGATGCTCGA TCATCTCGAT CACTGCAGCA GTGCGGGGGC GACGCTCTTC 
CTCGATGAGG CCTTCATCGA TCTGGCGGCT CCGGACCAGA GCCTCGTCGA TCAGCAGAGC 
CCCGATCTCT TTCTGCTCCG ATCCCTGACC AAGGCCTTCT CGGTGCCAGG ACTCCGGTTT 
GGGTACGGAT TTGGGGACCC CGAACTGATC GAAGCGATGG AGGCCGTCCG CCCACCCTGG 
TCGATCAATG CCTATGCAGA GCAGTTCGCC ATCGCTGCGT TCGGATCCTA TGACCTCCTG 
GCGGTGTCAC GGAAGGCGAT CGCGCGGGAA CGGGAGTTCC TCTGTTCCGG TTTGGATGAT 
CTCGGGATCG CTTATTGCCC TTCATCGGTC AACTACCTGC TGCTCGACCC TGGGGTACCG 
GCACCCGGAC TGACCCGGTC CCTGCTTGCC CATGGCATCC TGGTGCGCGA CTGCACCTCA 
TTTCATCTGC CTGATTCGGT TCGGATCGCC GTCCTCACCC GGGATGAGAA CATACGGCTC 
CTCGCAGCGC TGAACGCATG CTTGGTCTGA

Protein sequence

MPVLHIYQGD NGRVEMKLGK RRQYRRAVHG GVLPDQSLPG ETIIDFSASI NPFPPEVAWD 
PASVPVHRYP DNRYSALKAV IAETFHRDPA EVTVGNGSAE LMRVFCQVAL SPGDCVRIDR 
STFEEYAVSA EIAGAIVDEH AKNPVVRFLC NPNNPTGMLA PKSTMLDHLD HCSSAGATLF 
LDEAFIDLAA PDQSLVDQQS PDLFLLRSLT KAFSVPGLRF GYGFGDPELI EAMEAVRPPW 
SINAYAEQFA IAAFGSYDLL AVSRKAIARE REFLCSGLDD LGIAYCPSSV NYLLLDPGVP 
APGLTRSLLA HGILVRDCTS FHLPDSVRIA VLTRDENIRL LAALNACLV