Gene EcolC_3554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3554
Symbol
ID	6065967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3885094
End bp	3886137
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	51%
IMG OID	641602971
Product	guanosine 5'-monophosphate oxidoreductase
Protein accession	YP_001726495
Protein GI	170021541
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0516] IMP dehydrogenase/GMP reductase
TIGRFAM ID	[TIGR01305] guanosine monophosphate reductase, eukaryotic

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00169079
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTATTG AAGAAGATCT GAAGTTAGGT TTTAAAGACG TTCTTATCCG CCCTAAACGC 
TCCACTCTTA AAAGCCGTTC CGATGTTGAA CTGGAACGTC AATTCACCTT CAAACATTCA 
GGTCAGAGCT GGTCCGGCGT GCCGATTATC GCCGCAAATA TGGACACCGT AGGCACATTT 
TCTATGGCCT CTGCGCTGGC TTCTTTTGAT ATTTTGACTG CTGTGCATAA ACACTATTCT 
GTCGAAGAGT GGCAAGCGTT TATCAACAAT TCTTCCGCTG ATGTGCTGAA ACATGTGATG 
GTTTCTACCG GTACGTCTGA TGCGGATTTC GAAAAAACTA AACAGATTCT CGACCTGAAC 
CCGGCATTAA ACTTCGTTTG TATTGACGTG GCGAATGGTT ATTCCGAACA CTTCGTGCAG 
TTCGTTGCGA AAGCGCGTGA AGCGTGGCCG ACCAAAACCA TTTGTGCTGG TAACGTAGTG 
ACTGGTGAAA TGTGTGAGGA GCTTATCCTC TCAGGTGCCG ATATCGTTAA AGTTGGCATT 
GGCCCAGGTT CTGTTTGTAC AACTCGCGTC AAAACAGGCG TCGGTTATCC GCAACTTTCT 
GCGGTAATCG AATGTGCCGA TGCTGCGCAC GGTCTGGGCG GAATGATCGT CAGCGATGGT 
GGCTGCACCA CGCCGGGCGA TGTGGCGAAA GCCTTTGGCG GCGGTGCCGA TTTCGTCATG 
CTTGGCGGCA TGCTGGCGGG CCACGAAGAG AGCGGCGGTC GCATCGTTGA GGAGAACGGC 
GAGAAATTTA TGCTGTTCTA CGGCATGAGC TCCGAGTCTG CGATGAAACG TCACGTTGGC 
GGCGTTGCGG AATATCGCGC AGCAGAAGGT AAAACCGTTA AGCTGCCGCT GCGAGGCCCG 
GTTGAAAATA CCGCGCGAGA TATTTTGGGC GGCCTGCGTT CAGCTTGTAC ATACGTTGGG 
GCTTCACGCC TGAAAGAGCT GACCAAGCGC ACCACGTTTA TTCGTGTGCA GGAACAAGAA 
AACCGCATCT TCAACAACCT GTAA

Protein sequence

MRIEEDLKLG FKDVLIRPKR STLKSRSDVE LERQFTFKHS GQSWSGVPII AANMDTVGTF 
SMASALASFD ILTAVHKHYS VEEWQAFINN SSADVLKHVM VSTGTSDADF EKTKQILDLN 
PALNFVCIDV ANGYSEHFVQ FVAKAREAWP TKTICAGNVV TGEMCEELIL SGADIVKVGI 
GPGSVCTTRV KTGVGYPQLS AVIECADAAH GLGGMIVSDG GCTTPGDVAK AFGGGADFVM 
LGGMLAGHEE SGGRIVEENG EKFMLFYGMS SESAMKRHVG GVAEYRAAEG KTVKLPLRGP 
VENTARDILG GLRSACTYVG ASRLKELTKR TTFIRVQEQE NRIFNNL