Gene Moth_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2047
Symbol
ID	3831193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2138044
End bp	2139441
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	63%
IMG OID	637829976
Product	amidophosphoribosyltransferase
Protein accession	YP_430886
Protein GI	83590877
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0034] Glutamine phosphoribosylpyrophosphate amidotransferase
TIGRFAM ID	[TIGR01134] amidophosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.330153
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCCT GGCACGAGGA GTGCGGTGTC TTTGGCATCT ACGCTCCGGG CCAGGACGTG 
GCCCGGCTGG CCTACTACGG ACTCTTTGCC CTCCAGCACC GCGGCCAGGA GAGCGCTGGT 
ATCGCCGTGG CCAACGGCCG CCATATCGCC GTCCACAAGG GTATGGGGCT GGTGGCGGAG 
GTCTTTAACC GGGACAACCT TCGGGCTTTA CATGGTGACG TGGCCATCGG CCACGTGCGT 
TACTCCACCA CTGGTGCCAG TTCCCTGGTC AACGCCCAGC CCCTGGTCTT CCGCTACCTC 
AGGGGCATGG TGGCCATCGC CCATAACGGT AACCTGACCA ACGCCAGCGA GCTGCGGCGG 
GAGCTTGGAG CCAGCGGGTC TATCTTCCAG TCCTCCACCG ATAGTGAAAT CATCGTTAAC 
CTTATCGCCC GCCACAGCCA GGAGCCCGTC GAAGCAGCCT TGCTCCATTG CCAGGAAGAG 
CTTCGCGGTG CTTATTCCCT GGTGGTCATG ACCGAGGAAC AACTCATCGG CGTCCGTGAT 
CCCCATGGTG TCCGGCCCCT GTGCCTGGGC AGGATGGATG GGGCCTGGAT CCTGGCCTCG 
GAGTCCTGCG CCCTGGATAC CCTGGGGGCC GATTTTGTCC GCGATCTGGA ACCCGGGGAG 
ATTGTCATTA TCGACAGCCG GGGGGTGCGT TCCCTCCAGG GACCCCGGGC GGCCCACCGG 
GCCCACTGCA TTTTTGAATA TGTCTACTTT GCCCGGCCGG ATAGCATCCT GGACGGCGAG 
ACCGTCAACC TGGTGCGGCG GGAACTGGGC CGGAATCTAG CCCGGGAATA CCGGGTGGCG 
GCCGACGCCG TCATTCCGGT ACCCGACTCC GGTATTGCCG CCGCCGCCGG CTATGCCGAG 
GTGGCCGGCC TGCCCTTTGT GGAGGGGTTG ATGAAAAACC GCTACGTCGG CCGGACCTTC 
ATCCAGCCCA CCCAGGAGAT GCGGGACCTG GGGGTGCGCT TGAAGCTCAA CCCTATCAAG 
CCCATCTTAA AGGATAAAAG GGTTATTATA ATTGATGACT CCCTGGTCCG GGGAACCACC 
AGCCGGAGGA TAGTAGCCAT GCTGCGCCAG GCCGGGGTCC GGGAGGTGCA CCTGCTGGTG 
GCCTCGCCGC CGGTCCTGTA TCCCTGTTAC TACGGCATTG ATACCAGCGC CCGGGGAGAG 
CTCATTGCCG CCCGGTATCC CCTGGAGGAC ATCCGCCGCC ATGTGGATGC CGACAGTCTC 
CACTACCTCA GCCTGGAAGG GTTGTTTCGT TCCGTGCAGA GGGGGATGGA AGACTTCTGC 
GCCGCCTGCT TCACCGGCCG CTACCCCATC CCCATCCCTT CCCCGGAGGA GGCTACCAAG 
TACAGCCTGG AAGGGTAG

Protein sequence

MSSWHEECGV FGIYAPGQDV ARLAYYGLFA LQHRGQESAG IAVANGRHIA VHKGMGLVAE 
VFNRDNLRAL HGDVAIGHVR YSTTGASSLV NAQPLVFRYL RGMVAIAHNG NLTNASELRR 
ELGASGSIFQ SSTDSEIIVN LIARHSQEPV EAALLHCQEE LRGAYSLVVM TEEQLIGVRD 
PHGVRPLCLG RMDGAWILAS ESCALDTLGA DFVRDLEPGE IVIIDSRGVR SLQGPRAAHR 
AHCIFEYVYF ARPDSILDGE TVNLVRRELG RNLAREYRVA ADAVIPVPDS GIAAAAGYAE 
VAGLPFVEGL MKNRYVGRTF IQPTQEMRDL GVRLKLNPIK PILKDKRVII IDDSLVRGTT 
SRRIVAMLRQ AGVREVHLLV ASPPVLYPCY YGIDTSARGE LIAARYPLED IRRHVDADSL 
HYLSLEGLFR SVQRGMEDFC AACFTGRYPI PIPSPEEATK YSLEG