Gene Moth_2409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2409
Symbol	pyrG
ID	3830776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2528723
End bp	2530336
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	58%
IMG OID	637830328
Product	CTP synthetase
Protein accession	YP_431234
Protein GI	83591225
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0504] CTP synthase (UTP-ammonia lyase)
TIGRFAM ID	[TIGR00337] CTP synthase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCCA AATTTATTTT TGTTACCGGC GGTGTCACTT CTTCCCTGGG GAAGGGGATA 
ACCGCCGCTT CTTTAGGTAG ACTTCTAAAA AGCCGAGGCC TCAAAGTAGC CATCCAGAAG 
TTCGACCCCT ATATCAATAT CGACCCCGGC ACCATGAGCC CGTACCAGCA TGGCGAGGTC 
TTCGTCACCG ATGACGGCGC CGAAACTGAT CTGGACCTGG GCCATTACGA GCGCTTTATC 
GACATTAGCC TTACCAAGGC CAGCAACGTC ACCGCCGGCA AGGTATACTG GTCCGTCATC 
ACGAAAGAAC GGCGCGGCGA TTTCCTCGGC GGTACAGTCC AGGTCATACC CCACATCACC 
AATGAGATCA AGGCCCGCCT CCTCCGGGTG GCCGAGGAGA GCGACCCGGA CGTTGTCATT 
ACCGAGATTG GCGGTACTGT GGGGGATATC GAATCTCTGC CTTTCCTGGA AGCCATCCGC 
CAGATGAAGA GCGATATCGG CCGCGATCGT GTCCTCTATA TCCATGTCAC CCTGGTTCCC 
TACCTGCGGG CTGCCGGCGA AGCCAAAACC AAACCTACCC AGCACAGCGT CAAAGAGTTA 
CGCAGCATTG GCATCCAGCC GGATATCATC GTCTGCCGGA CTGAACGTCC CTTCTCCCGG 
GAAATGGAAG AAAAAATAGC TCTCTTTTGC GATATTGACC CCGATGCCGT CATCCAGGCC 
TGGGATGCCG ATTCCATCTA TGAGGTCCCC CTGATGATGC AAGAGGAAGG CCTGGACAGC 
ATCGTCGTCG AGCGGCTGAA GTTAAACTGC GGTCCTGCTC AAATGGACGA TTGGCGGGCC 
ATGGTAGCAA AGTTAAAGAA TATCACCAGG CACCTGGAGA TCGCCCTGGT GGGCAAATAC 
GTCACCCTGC CGGACGCCTA TTTAAGCGTA GTAGAATCCC TGCGCCATGC CGGCATGTAT 
CACAACGTCC AGGTGGATAT TCGCTGGATT TATTCGGCTG ACCTGGAGCG GGGGGGCCTT 
GAACAACTCC AGGATGTGGC CGGCATCCTG GTACCCGGGG GCTTTGGCGA CCGGGGGGTT 
GAAGGGAAGA TCATAGCCGC CCGGTATGCC CGGGAGCATG GTATACCCTT CCTGGGTATT 
TGCCTGGGGA TGCAGCTGGC AGTGGTTGAG TTTGCCCGTC ACGTCTGCGG ACTGGAAGCG 
GCCAACAGCT CGGAATTCAA CCCGGAAACG CCCCACCCAG TCATCGACCT TTTGCCGGAG 
CAAAAGGAGA TTGAAGATAA GGGTGGTACC ATGCGCCTGG GCCTCTATCC CTGCCGCTTA 
CAGCCCGGTA CCCGGGCCCA CCAGGCCTAT GGCGAAGAAA TTATCTATGA ACGCCATCGC 
CATCGCTATG AATTTAATAA CAACTACCGG GCCGAACTGA CGGCCAGGGG TATGGTTATC 
AGCGGCACCT CCCCGGACGA CCGCCTGGTT GAGATTATTG AGCTGGCGGA TCACCCGTGG 
TTTGTGGCCT GCCAGTTCCA TCCGGAATTC AAATCCCGGC CTAACCGGCC GCATCCCCTT 
TTCCGGGACT TCATCGGCGC CGCCTGCCGG CGGGCCGGGG GGGGTGCAGG CTGA

Protein sequence

MPAKFIFVTG GVTSSLGKGI TAASLGRLLK SRGLKVAIQK FDPYINIDPG TMSPYQHGEV 
FVTDDGAETD LDLGHYERFI DISLTKASNV TAGKVYWSVI TKERRGDFLG GTVQVIPHIT 
NEIKARLLRV AEESDPDVVI TEIGGTVGDI ESLPFLEAIR QMKSDIGRDR VLYIHVTLVP 
YLRAAGEAKT KPTQHSVKEL RSIGIQPDII VCRTERPFSR EMEEKIALFC DIDPDAVIQA 
WDADSIYEVP LMMQEEGLDS IVVERLKLNC GPAQMDDWRA MVAKLKNITR HLEIALVGKY 
VTLPDAYLSV VESLRHAGMY HNVQVDIRWI YSADLERGGL EQLQDVAGIL VPGGFGDRGV 
EGKIIAARYA REHGIPFLGI CLGMQLAVVE FARHVCGLEA ANSSEFNPET PHPVIDLLPE 
QKEIEDKGGT MRLGLYPCRL QPGTRAHQAY GEEIIYERHR HRYEFNNNYR AELTARGMVI 
SGTSPDDRLV EIIELADHPW FVACQFHPEF KSRPNRPHPL FRDFIGAACR RAGGGAG