Gene Mlg_1841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1841
Symbol	pyrG
ID	4269209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2098888
End bp	2100510
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	66%
IMG OID	638126597
Product	CTP synthetase
Protein accession	YP_742675
Protein GI	114320992
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0504] CTP synthase (UTP-ammonia lyase)
TIGRFAM ID	[TIGR00337] CTP synthase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.41222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGAT ACATTTTCAT CACCGGCGGT GTCGTATCGT CCCTGGGAAA GGGCATCACC 
GCCGCTTCCC TGGGTACCAT CCTGCAGGCC CGTGGCCTGA GTGTCTCCAT GACCAAACTG 
GATCCCTACA TCAATGTGGA TCCGGGCACT ATGAGCCCTT TCCAGCACGG CGAGGTCTAC 
GTCACCGACG ACGGCGCGGA GACCGACCTG GACCTGGGGC ACTACGAGCG TTTCGTGCGC 
ACCACCATGA CCCGCAACAA CAACTACACC ACCGGCCGGA TCTACGAATC CGTCATCCGC 
AAGGAGCGCC GGGGTGAGTA TCTGGGCGGT ACGGTGCAGG TCATCCCCCA CATCACCGAC 
GAGATCAAGC GCAGCATCCA GCAGGGTGCC GACGACGCGG ACATCGCCCT GATCGAGATC 
GGCGGTACGG TGGGCGATAT CGAATCGCTC CCCTTCCTGG AGGCCATCCG CCAGATGGGC 
GCCGAGCTCG GCCGTGGCCG TTGCCTGTTT ATGCACCTCA CCCTGGTGCC CTTCATCGGT 
GCCGCGGGCG AGATGAAGAC CAAGCCCACC CAGCACTCGG TCAAGGAACT GCGCTCCATC 
GGCATCCAGC CCGATATCCT GGTCTGCCGG GCCAGTCAGC GCATCCCCGA GGAAGAGCGC 
CGCAAGATCG CCCTGTTCAC CAACGTGGAG CCGCGGGCGG TGGTCTCCTG TCTGGACGTG 
GACAACATCT ACAAGATCCC CGAGGTGCTG CACCGGCAGG GGCTGGACAA CATCGTTGCG 
GAGAAGCTCG GTCTGGAGCT GCCGCCGGCC AGCCTGCAGG ACTGGCAGCG GGTGGTGGAG 
GCCATGCAGA ACCCCGAGGG CGAGGTCACC ATCGCCATGG TGGGCAAGTA CGTGGATCTC 
ACCGATGCCT ACATGTCGCT CAACGAGTCG CTGCGCCACG CGGGGATACA GACCCGGCAC 
CGGGTCAATA TCCGGTACAT CGACTCCGAG GAGTTGGAAC GCGAAGGGAC CCACGCCTTG 
GACGGGGTGG ACGCCGTCCT GGTGCCCGGT GGCTTCGGCG AGCGCGGCGT GGAGGGCAAG 
ATCCTGGCGG CCCGCTACGC CCGGGAGCGC AAGGTGCCTT ACCTGGGCAT CTGCCTGGGG 
ATGCAGGTGG CGGTCATCGA GTACGCCCGC AACGTCGCCG GGCTGGAGGG GGCCCACAGC 
ACCGAATTCA CCCGCCACCC CCACCATCCG GTCATCGGCC TGATCACCGA GTGGATGACC 
GACGAGGGCA CCGTGGAGCA GCGTAGCGAG GACTCCGACC TGGGCGGCAC CATGCGCCTG 
GGGGCCCAGC CCTGTCGGCT GACCGAGGGC TCGCTGGCCC GCCAGGTCTA CGGCAAGGAC 
GTGGTGGAGG AGCGCCACCG CCATCGCTAC GAATTCAACA ACCACTACCT GGAGGCGCTG 
GAGGCGGCCG GGCTGCGGTT CTCCGGCTGG TCCCACGACC GCAAACTGGT GGAAGTGGTG 
GAGCAGCCGG ACCATCCCTG GTTTCTGGCC TGCCAGTTCC ACCCGGAGTT CACCTCCACG 
CCCCGCGACG GCCATCCGCT GTTTGCCGCC TTCGTGCGTG CCGCCATCGC CCACAGGGGC 
TAA

Protein sequence

MTRYIFITGG VVSSLGKGIT AASLGTILQA RGLSVSMTKL DPYINVDPGT MSPFQHGEVY 
VTDDGAETDL DLGHYERFVR TTMTRNNNYT TGRIYESVIR KERRGEYLGG TVQVIPHITD 
EIKRSIQQGA DDADIALIEI GGTVGDIESL PFLEAIRQMG AELGRGRCLF MHLTLVPFIG 
AAGEMKTKPT QHSVKELRSI GIQPDILVCR ASQRIPEEER RKIALFTNVE PRAVVSCLDV 
DNIYKIPEVL HRQGLDNIVA EKLGLELPPA SLQDWQRVVE AMQNPEGEVT IAMVGKYVDL 
TDAYMSLNES LRHAGIQTRH RVNIRYIDSE ELEREGTHAL DGVDAVLVPG GFGERGVEGK 
ILAARYARER KVPYLGICLG MQVAVIEYAR NVAGLEGAHS TEFTRHPHHP VIGLITEWMT 
DEGTVEQRSE DSDLGGTMRL GAQPCRLTEG SLARQVYGKD VVEERHRHRY EFNNHYLEAL 
EAAGLRFSGW SHDRKLVEVV EQPDHPWFLA CQFHPEFTST PRDGHPLFAA FVRAAIAHRG