Gene EcSMS35_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3031
Symbol	ygfZ
ID	6144047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3120113
End bp	3121093
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	54%
IMG OID	641617900
Product	putative global regulator
Protein accession	YP_001745051
Protein GI	170683930
COG category	[R] General function prediction only
COG ID	[COG0354] Predicted aminomethyltransferase related to GcvT
TIGRFAM ID	[TIGR03317] folate-binding protein YgfZ

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTTA CACCTTTTCC TCCCCGTCAG CCTACGGCTT CTGCCCGTTT GCCACTGACG 
CTGATGACGC TTGATGACTG GGCGCTTGCC ACCATTACTG GCGCGGACAG CGAAAAATAT 
ATGCAGGGTC AAGTGACAGC AGATGTCAGC CAGATGACAG AAGATCAGCA CCTGCTCGCC 
GCCCATTGCG ACGCCAAAGG CAAAATGTGG AGCAACTTAC GTCTGTTCCG CGACGGCGAT 
GGCTTTGCAT GGATTGAACG GCGCAGCGTG CGTGAACCGC AGCTGACTGA ACTGAAAAAA 
TATGCGGTGT TCTCTAAAGT GACAATCGCG CCAGACGACG AGCGTGTGCT GCTTGGTGTT 
GCCGGTTTTC AGGCGCGCGC CGCGCTGGCA AATCTCTTTA GTGAACTGCC TTCGAAAGAA 
AAACAGGTAG TTAAAGAAGG CGCGACCACT TTGCTATGGT TTGAACACCC GGCAGAACGT 
TTCCTGATCG TAACCGATGA AGCCACTGCC AATATGCTGA CCGATAAACT GCGCGGTGAA 
GCGGAACTGA ACAATAGCCA ACAGTGGCTG GCATTAAACA TTGAAGCGGG TTTCCCGGTG 
ATTGATGCCG CCAACAGCGG GCAGTTTATC CCACAGGCGA CCAACCTCCA GGCGCTGGGC 
GGCATTAGCT TTAAAAAAGG CTGCTATACC GGACAAGAGA TGGTGGCGCG AGCTAAATTC 
CGTGGTGCCA ACAAACGCGC GCTCTGGTTG CTGACAGGTA GTGCCAGCCG ACTGCCGGAA 
GCTGGTGAAG ACTTAGAGCT GAAAATGGGC GAGAACTGGC GTCGTACCGG TACGGTGCTG 
GCTGCGGTCA AACTGGAAGA TGGTCAGGTC GTGGTACAGG TCGTCATGAA TAACGATATG 
GAACCGGACA GCATCTTCCG CGTGCGTGAC GATGCGAATA CATTGCGTAT CGAGCCGCTG 
CCGTATTCGC TCGAAGAGTA A

Protein sequence

MAFTPFPPRQ PTASARLPLT LMTLDDWALA TITGADSEKY MQGQVTADVS QMTEDQHLLA 
AHCDAKGKMW SNLRLFRDGD GFAWIERRSV REPQLTELKK YAVFSKVTIA PDDERVLLGV 
AGFQARAALA NLFSELPSKE KQVVKEGATT LLWFEHPAER FLIVTDEATA NMLTDKLRGE 
AELNNSQQWL ALNIEAGFPV IDAANSGQFI PQATNLQALG GISFKKGCYT GQEMVARAKF 
RGANKRALWL LTGSASRLPE AGEDLELKMG ENWRRTGTVL AAVKLEDGQV VVQVVMNNDM 
EPDSIFRVRD DANTLRIEPL PYSLEE