Gene Mpal_0400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0400
Symbol
ID	7271426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	414790
End bp	415782
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	64%
IMG OID	643569045
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_002465497
Protein GI	219851065
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.243821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAC ATGCCTACCG CGACGCCGGG GTCGACATTG ACCTCGAGGC CGCTGCGGTG 
AAAGCACTGA TCGGCCAGCT CTCGTTCCGC CGGCAGGGAT CGTATCCGAT GCTCGGAAAG 
GTCGGCCACT TCGCCGGGCT GATCGACTTC GGGCCCGTGG CCCTGGCGCT GGCCGTCGAC 
GGAGTCGGGA CCAAGATGCT CATCGCCGAC CACCAGCAGA ACTGGAAGAC GGTCGGGATC 
GACTGCATCG CGATGAACGT CAACGACCTC TACGTGATGA ACCTGGAGCC GATCGCGTTC 
GTCGATTACA TCGCCACCGA CCGTCTCTCG CTCGAGAAGA TGACCGAGAT CGGGATCGGA 
TTGAATGAGG GGGCCAGGCA GGCGAATATG AACATCGTCG GCGGGGAGAC GGCCTCGCTC 
GCCGGGCTCG TGAACGGTCT CGACCTCGCC GGGGCCTGCC TTGGGGTCCA GCAGAAGGAA 
CGGATCATCT CCGGGGAGGC GATCCGGCCG GGCGATCTCG TCATTGGGGT CCCGTCGACC 
GGGGTCCACT CCAACGGCCT CTCGCTGGCG CGAAGGATCG CCGAGACCCA TGATGGCTAC 
GACCAGGAGA TACGGCCGGG AAGGACACTC GGCGAGGAAC TGCTGACCCC CACGAGGATC 
TATGCCGAGG TGCCGGCCAT CACCGCGGCC CATGAGGTGC ACGGGATGTG CCACATCACC 
GGCGGCGGCC TTCTGAACTT CACCAGGCTG AGCCGGTTCG GGATCGCCAT CACGGATCCT 
CTGCCACCAC AGCAGGTCTT CACCTGGCTG CAGGAGACCG GCGAGGTGAG CGAGGTCGAG 
ATGTACCGGA CCTTCAACAT GGGCATGGGG TACGCGCTGG TCATCCCACC GGATGCAGCG 
GACGGGGTCG TGCGTGACCT GCCGGGCTCA AAGATCGTCG GATCCTGCAC AGAAGAGGCG 
AAGATCACGC TCTGCGGAAC CGAGATCAGA TAA

Protein sequence

MSEHAYRDAG VDIDLEAAAV KALIGQLSFR RQGSYPMLGK VGHFAGLIDF GPVALALAVD 
GVGTKMLIAD HQQNWKTVGI DCIAMNVNDL YVMNLEPIAF VDYIATDRLS LEKMTEIGIG 
LNEGARQANM NIVGGETASL AGLVNGLDLA GACLGVQQKE RIISGEAIRP GDLVIGVPST 
GVHSNGLSLA RRIAETHDGY DQEIRPGRTL GEELLTPTRI YAEVPAITAA HEVHGMCHIT 
GGGLLNFTRL SRFGIAITDP LPPQQVFTWL QETGEVSEVE MYRTFNMGMG YALVIPPDAA 
DGVVRDLPGS KIVGSCTEEA KITLCGTEIR