Gene ECH74115_3731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3731
Symbol	guaA
ID	6966589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3451217
End bp	3452794
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	54%
IMG OID	643387524
Product	GMP synthase
Protein accession	YP_002271977
Protein GI	209397616
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0518] GMP synthase - Glutamine amidotransferase domain [COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00256427
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAAA ACATTCATAA GCATCGCATC CTCATTCTGG ACTTCGGTTC TCAGTACACT 
CAACTGGTTG CGCGCCGCGT GCGTGAGCTG GGTGTTTACT GCGAACTGTG GGCATGGGAT 
GTGACAGAAG CACAAATTCG TGACTTCAAT CCAAGCGGCA TTATTCTTTC CGGCGGCCCG 
GAAAGTACTA CTGAAGAAAA CAGCCCGCGT GCGCCGCAGT ATGTCTTTGA AGCAGGCGTA 
CCGGTATTCG GCGTTTGCTA TGGCATGCAG ACCATGGCAA TGCAGTTGGG CGGTCACGTT 
GAAGCCTCTA ACGAACGTGA ATTTGGCTAC GCGCAGGTTG AAGTCGTAAA CGACAGCGCA 
CTGGTTCGCG GTATCGAAGA TGCGCTGACC GCAGACGGTA AACCGCTGCT CGATGTCTGG 
ATGAGCCACG GCGATAAAGT TACCGCTATC CCGTCCGACT TCGTCACCGT AGCCAGCACC 
GAAAGCTGCC CGTTTGCCAT TATGGCTAAC GAAGAAAAAC GCTTCTATGG CGTACAGTTC 
CACCCGGAAG TGACTCACAC CCGCCAGGGT ATGCGCATGC TGGAGCGTTT TGTGCGTGAT 
ATCTGCCAGT GTGAAGCCCT GTGGACGCCA GCGAAAATTA TCGACGATGC TGTAGCTCGC 
ATCCGCGAGC AGGTAGGCGA CGATAAAGTC ATCCTCGGCC TCTCTGGTGG TGTGGATTCC 
TCCGTAACCG CAATGCTGCT GCACCGCGCT ATCGGTAAAA ACCTGACTTG CGTATTCGTC 
GACAACGGCC TGCTGCGTCT CAACGAAGCA GAGCAGGTTC TGGATATGTT TGGCGATCAC 
TTTGGTCTTA ACATTGTTCA CGTACCGGCA GAAGATCGCT TCCTGTCAGC GCTGGCTGGC 
GAAAACGATC CGGAAGCAAA ACGTAAAATC ATCGGTCGCG TTTTCGTTGA AGTATTCGAT 
GAAGAAGCGC TGAAACTGGA AGACGTGAAG TGGCTGGCGC AGGGCACCAT CTACCCTGAC 
GTTATCGAAT CTGCGGCGTC TGCAACCGGT AAAGCACACG TCATCAAATC TCACCACAAC 
GTGGGCGGCC TGCCGAAAGA GATGAAGATG GGCCTGGTTG AACCGCTGAA AGAGCTGTTC 
AAAGACGAAG TGCGTAAGAT TGGTCTGGAG CTGGGCCTGC CGTACGACAT GCTGTACCGT 
CACCCGTTCC CGGGACCAGG CCTTGGCGTT CGTGTTCTGG GTGAAGTGAA GAAAGAGTAC 
TGTGACCTGC TGCGCCGTGC TGACGCCATC TTCATTGAAG AACTGCGTAA AGCGGACCTG 
TACGACAAAG TCAGCCAGGC GTTCACCGTC TTCCTGCCAG TACGTTCCGT TGGCGTAATG 
GGCGATGGTC GTAAGTATGA CTGGGTTGTC TCTCTGCGTG CTGTCGAAAC CATCGACTTT 
ATGACCGCAC ACTGGGCGCA TCTGCCGTAC GATTTCCTCG GTCGCGTTTC CAACCGCATT 
ATCAATGAAG TGAACGGTAT TTCCCGCGTG GTGTATGACA TCAGCGGCAA GCCACCAGCT 
ACCATTGAGT GGGAATGA

Protein sequence

MTENIHKHRI LILDFGSQYT QLVARRVREL GVYCELWAWD VTEAQIRDFN PSGIILSGGP 
ESTTEENSPR APQYVFEAGV PVFGVCYGMQ TMAMQLGGHV EASNEREFGY AQVEVVNDSA 
LVRGIEDALT ADGKPLLDVW MSHGDKVTAI PSDFVTVAST ESCPFAIMAN EEKRFYGVQF 
HPEVTHTRQG MRMLERFVRD ICQCEALWTP AKIIDDAVAR IREQVGDDKV ILGLSGGVDS 
SVTAMLLHRA IGKNLTCVFV DNGLLRLNEA EQVLDMFGDH FGLNIVHVPA EDRFLSALAG 
ENDPEAKRKI IGRVFVEVFD EEALKLEDVK WLAQGTIYPD VIESAASATG KAHVIKSHHN 
VGGLPKEMKM GLVEPLKELF KDEVRKIGLE LGLPYDMLYR HPFPGPGLGV RVLGEVKKEY 
CDLLRRADAI FIEELRKADL YDKVSQAFTV FLPVRSVGVM GDGRKYDWVV SLRAVETIDF 
MTAHWAHLPY DFLGRVSNRI INEVNGISRV VYDISGKPPA TIEWE