Gene EcHS_A3057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3057
Symbol	ygfZ
ID	5594485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3068826
End bp	3069806
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	54%
IMG OID	640922174
Product	putative global regulator
Protein accession	YP_001459676
Protein GI	157162358
COG category	[R] General function prediction only
COG ID	[COG0354] Predicted aminomethyltransferase related to GcvT
TIGRFAM ID	[TIGR03317] folate-binding protein YgfZ

Plasmid Coverage information

Num covering plasmid clones	83
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTTA CACCTTTTCC TCCCCGTCAG CCTACGGCTT CTGCCCGTTT ACCGCTGACG 
CTGATGACGC TTGATGACTG GGCGCTTGCC ACCATTACTG GCGCGGACAG CGAAAAATAT 
ATGCAGGGTC AGGTGACAGC AGATGTCAGC CAGATGGCAG AAGATCAGCA CCTGCTCGCC 
GCCCATTGCG ACGCCAAAGG TAAAATGTGG AGCAATTTAC GTCTGTTCCG CGACGGCGAT 
GGCTTTGCAT GGATTGAACG GCGCAGCGTG CGTGAACCGC AGCTGACTGA ACTGAAAAAA 
TATGCGGTAT TCTCTAAAGT GACCATCGCG CCAGACGACG AGCGTGTGCT GCTTGGTGTT 
GCCGGTTTTC AGGCGCGCGC CGCGCTGGCA AATCTCTTTA GCGAACTGCC TTCGAAAGAA 
AAACAGGTAG TCAAAGAAGG CGCGACCACT TTGCTATGGT TTGAACACCC GGCAGAACGT 
TTCCTGATCG TAACCGATGA AGCTACTGCT AATATGCTGA CCGATAAACT GCGCGGTGAA 
GCGGAACTGA ACAATAGCCA ACAGTGGCTG GCATTAAACA TTGAAGCGGG TTTCCCGGTG 
ATTGATGCCG CCAACAGCGG GCAGTTTATC CCACAGGCGA CCAATCTCCA GGCGCTGGGC 
GGTATCAGCT TTAAGAAAGG CTGTTATACC GGACAAGAGA TGGTGGCGCG AGCAAAATTC 
CGTGGTGCCA ATAAACGTGC GCTCTGGTTG CTGGCAGGTA GCGCCAGCCG ACTGCCGGAA 
GCTGGTGAAG ACTTAGAGCT GAAAATGGGC GAGAACTGGC GTCGTACCGG TACGGTGCTG 
GCTGCGGTAA AACTGGAAGA TGGTCAGGTC GTGGTACAGG TCGTCATGAA TAACGATATG 
GAACCGGATA GCATCTTCCG CGTACGCGAC GATGCGAATA CATTGCATAT CGAGCCGCTG 
CCGTATTCGC TCGAAGAGTA A

Protein sequence

MAFTPFPPRQ PTASARLPLT LMTLDDWALA TITGADSEKY MQGQVTADVS QMAEDQHLLA 
AHCDAKGKMW SNLRLFRDGD GFAWIERRSV REPQLTELKK YAVFSKVTIA PDDERVLLGV 
AGFQARAALA NLFSELPSKE KQVVKEGATT LLWFEHPAER FLIVTDEATA NMLTDKLRGE 
AELNNSQQWL ALNIEAGFPV IDAANSGQFI PQATNLQALG GISFKKGCYT GQEMVARAKF 
RGANKRALWL LAGSASRLPE AGEDLELKMG ENWRRTGTVL AAVKLEDGQV VVQVVMNNDM 
EPDSIFRVRD DANTLHIEPL PYSLEE