Gene EcHS_A2924 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2924
Symbol	pyrG
ID	5593340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2926238
End bp	2927875
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	52%
IMG OID	640922041
Product	CTP synthetase
Protein accession	YP_001459552
Protein GI	157162234
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0504] CTP synthase (UTP-ammonia lyase)
TIGRFAM ID	[TIGR00337] CTP synthase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000000000016445
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGA ACTATATTTT TGTGACCGGC GGGGTCGTAT CCTCTCTGGG TAAAGGCATT 
GCCGCAGCCT CCCTCGCAGC CATTCTTGAA GCCCGTGGCC TCAATGTGAC CATCATGAAA 
CTGGATCCGT ACATCAACGT CGATCCAGGT ACTATGAGCC CAATCCAACA CGGGGAAGTG 
TTCGTTACTG AAGACGGCGC TGAAACCGAC CTGGACCTGG GGCACTACGA GCGTTTCATT 
CGTACCAAAA TGAGCCGCCG CAACAACTTC ACCACGGGTC GTATCTACTC TGACGTTCTG 
CGTAAAGAAC GCCGCGGTGA CTACCTCGGC GCAACCGTGC AGGTTATTCC GCACATCACT 
AACGCAATCA AAGAGCGCGT GCTGGAAGGT GGCGAAGGTC ATGACGTAGT ACTGGTAGAA 
ATCGGCGGTA CAGTAGGTGA TATCGAATCC TTGCCGTTCC TCGAAGCGAT TCGCCAGATG 
GCTGTTGAAA TTGGCCGTGA GCACACTCTG TTTATGCACC TGACGCTGGT GCCGTACATG 
GCAGCGTCTG GTGAAGTCAA AACCAAACCG ACTCAGCACT CTGTAAAAGA GCTGCTCTCC 
ATCGGTATCC AGCCTGACAT CCTGATTTGT CGTTCAGATC GCGCTGTTCC GGCGAACGAA 
CGTGCGAAGA TTGCATTGTT CTGTAATGTT CCGGAAAAAG CGGTTATTTC TCTGAAAGAC 
GTCGATTCCA TCTATAAAAT TCCGGGCCTG TTGAAATCTC AGGGGCTGGA CGATTATATT 
TGTAAACGAT TCAGCTTAAA CTGCCCGGAA GCGAATCTGT CCGAATGGGA ACAGGTTATC 
TTCGAAGAAG CGAACCCGGT AAGTGAAGTC ACCATCGGTA TGGTCGGCAA GTACATTGAA 
CTGCCGGATG CTTATAAATC AGTGATCGAA GCACTGAAAC ACGGTGGGCT GAAGAATCGT 
GTCAGCGTCA ACATCAAACT GATCGATTCA CAAGATGTTG AAACGCGCGG CGTTGAAATC 
CTTAAAGGTC TGGACGCAAT CCTCGTACCT GGCGGTTTCG GCTATCGTGG CGTAGAAGGC 
ATGATTACGA CCGCGCGTTT TGCGCGTGAG AACAATATTC CTTATCTGGG CATTTGCCTG 
GGTATGCAGG TGGCGTTAAT TGATTACGCT CGCCATGTTG CCAACATGGA GAATGCCAAC 
TCTACGGAAT TTGTGCCAGA CTGTAAGTAC CCGGTTGTGG CGCTGATTAC CGAGTGGCGC 
GATGAAAACG GCAACGTTGA AGTTCGTAGC GAGAAGAGCG ATCTCGGCGG TACCATGCGT 
CTCGGCGCAC AGCAGTGCCA GTTGGTTGAC GATAGCCTGG TTCGCCAGCT GTACAATGCG 
CCGACAATTG TTGAGCGTCA TCGTCACCGT TACGAAGTCA ACAACATGCT GTTGAAACAG 
ATTGAAGATG CAGGTCTGCG CGTTGCGGGC CGTTCCGGGG ATGATCAGTT GGTCGAGATC 
ATCGAAGTTC CGAATCACCC GTGGTTCGTG GCTTGCCAGT TCCATCCGGA GTTTACTTCT 
ACTCCACGTG ATGGTCACCC GCTGTTTGCA GGCTTTGTGA AAGCCGCCAG CGAGTTCCAG 
AAACGTCAGG CGAAGTAA

Protein sequence

MTTNYIFVTG GVVSSLGKGI AAASLAAILE ARGLNVTIMK LDPYINVDPG TMSPIQHGEV 
FVTEDGAETD LDLGHYERFI RTKMSRRNNF TTGRIYSDVL RKERRGDYLG ATVQVIPHIT 
NAIKERVLEG GEGHDVVLVE IGGTVGDIES LPFLEAIRQM AVEIGREHTL FMHLTLVPYM 
AASGEVKTKP TQHSVKELLS IGIQPDILIC RSDRAVPANE RAKIALFCNV PEKAVISLKD 
VDSIYKIPGL LKSQGLDDYI CKRFSLNCPE ANLSEWEQVI FEEANPVSEV TIGMVGKYIE 
LPDAYKSVIE ALKHGGLKNR VSVNIKLIDS QDVETRGVEI LKGLDAILVP GGFGYRGVEG 
MITTARFARE NNIPYLGICL GMQVALIDYA RHVANMENAN STEFVPDCKY PVVALITEWR 
DENGNVEVRS EKSDLGGTMR LGAQQCQLVD DSLVRQLYNA PTIVERHRHR YEVNNMLLKQ 
IEDAGLRVAG RSGDDQLVEI IEVPNHPWFV ACQFHPEFTS TPRDGHPLFA GFVKAASEFQ 
KRQAK