Gene ECH74115_4190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4190
Symbol
ID	6971019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3883859
End bp	3884839
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	54%
IMG OID	643387934
Product	putative global regulator
Protein accession	YP_002272373
Protein GI	209400648
COG category	[R] General function prediction only
COG ID	[COG0354] Predicted aminomethyltransferase related to GcvT
TIGRFAM ID	[TIGR03317] folate-binding protein YgfZ

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTTA CACCTTTTCC TCCCCGTCAG CCTACGGCTT CTGCCCGTTT GCCACTGACG 
CTGATGACGC TTGATGACTG GGCGCTTGCC ACCATTACTG GCGCGGACAG CGAAAAATAT 
TTGCAGGGCC AGGTGACAGC AGATGTCAGC CAGATGACAG ATGATCAGCA CCTGCTCGCC 
GCCCATTGCG ACGCCAAAGG TAAAATGTGG AGCAATTTAC GTCTGTTCCG CGACGGCGAT 
GGCTTTGCAT GGATTGAACG GCGCAGCGTG CGTGAACCGC AGCTGGCTGA ACTGAAAAAA 
TATGCGGTGT TCTCTAAAGT GACCATCGCG CCAGACGACG AGCGTGTGCT GCTTGGTGTT 
GCCGGTTTTC AGGCGCGCGC CGCGCTGGCA AATATCTTTA GTGAACTGCC TTCGAAAGAA 
AAACAGGTAG TTAAAGAAGG CGCGACCACT TTGCTATGGT TTGAACACCC GGCAGAACGT 
TTCCTGATCG TAACCGATGA AGCTACTGCC AATATGCTGA CCGATAAACT GCGCGGTGAA 
GCGGAACTGA ACAATAGCCA ACAGTGGCTG GCATTAAACA TTGAAGCGGG TTTCCCGGTG 
ATTGATGCCG CGAACAGCGG GCAGTTTATC CCACAGGCGA CCAACCTCCA GGCGCTGGGC 
GGTATCAGCT TTAAGAAAGG CTGCTATACC GGACAAGAGA TGGTGGCGCG AGCAAAATTC 
CGTGGTGCCA ACAAACGCGC GCTCTGGTTG CTGACAGGTA GTGCCAGCCG ACTGCCGGAA 
GCTGGTGAAG ACTTAGAGCT GAAAATGGGC GAGAACTGGC GTCGTACTGG TACGGTGCTG 
GCTGCGGTAA AACTGGAAGA TGGTCAGGTC GTGGTGCAGG TAGTGATGAA TAACGATATG 
GAACCGGACA GCATCTTCCG CGTGCGCGAC GATGCGAATA CATTGTGTAT CGAGCCACTG 
CCGTATTCGC TCGAAGAGTA A

Protein sequence

MAFTPFPPRQ PTASARLPLT LMTLDDWALA TITGADSEKY LQGQVTADVS QMTDDQHLLA 
AHCDAKGKMW SNLRLFRDGD GFAWIERRSV REPQLAELKK YAVFSKVTIA PDDERVLLGV 
AGFQARAALA NIFSELPSKE KQVVKEGATT LLWFEHPAER FLIVTDEATA NMLTDKLRGE 
AELNNSQQWL ALNIEAGFPV IDAANSGQFI PQATNLQALG GISFKKGCYT GQEMVARAKF 
RGANKRALWL LTGSASRLPE AGEDLELKMG ENWRRTGTVL AAVKLEDGQV VVQVVMNNDM 
EPDSIFRVRD DANTLCIEPL PYSLEE