Gene EcolC_0811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0811
Symbol
ID	6066545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	870451
End bp	871431
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	54%
IMG OID	641600216
Product	putative global regulator
Protein accession	YP_001723810
Protein GI	170018856
COG category	[R] General function prediction only
COG ID	[COG0354] Predicted aminomethyltransferase related to GcvT
TIGRFAM ID	[TIGR03317] folate-binding protein YgfZ

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.535495
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTTA CACCTTTTCC GCCCCGTCAG CCTACGGCTT CTGCCCGTTT GCCACTGACA 
CTGATGACGC TTGATGACTG GGCGCTTGCC ACCATTACTG GCGCGGACAG CGAAAAATAT 
ATGCAGGGTC AGGTGACAGC AGACGTTAGC CAAATGACAG AAGATCAGCA CCTGCTGGCC 
GCCCATTGCG ACGCCAAAGG TAAAATGTGG AGCAATTTAC GTCTGTTCCG CGACGGCGAT 
GGCTTTGCGT GGATTGAACG GCGCAGCGTG CGTGAACCGC AGCTGACTGA ACTGAAAAAA 
TATGCGGTAT TCTCTAAAGT GACCATCGCG CCAGACGACG AGCGTGTGCT GCTTGGTGTT 
GCCGGTTTTC AGGCGCGCGC CGCGCTGGCA AACCTCTTTA GTGTATTACC TTCGAAGGAA 
AAGCAGGTTA TCAGAGAAGA TGCGACTACC CTGCTATGGT TTGAACATCC GGCAGAACGT 
TTCCTGATCG TAACCGATGA AGCTACTGCC AATATGCTGA CCGATAAACT GCGCGGTGAA 
GCGGAACTGA ACAATAGCCA ACAGTGGCTG GCATTAAACA TTGAAGCTGG TTTCCCGGTG 
ATTGATGCCG CCAACAGCGG GCAGTTTATC CCACAGGCGA CCAACCTCCA GGCGCTGGGC 
GGTATCAGCT TTAAGAAAGG CTGCTATACC GGACAAGAGA TGGTGGCGCG AGCAAAATTC 
CGTGGTGCCA ACAAACGCGC GCTCTGGTTG CTGACAGGTA GTGCCAGCCG ACTGCCGGAA 
GCTGGTGAAG ACTTAGAGCT GAAAATGGGC GAGAACTGGC GTCGCACCGG TACGGTGCTG 
GCTGCGGTAA AACTGGAAGA TGGCCAGGTC GTGGTACAAG TCGTCATGAA TAACGATATG 
GAACCGGACA GCATCTTCCG CGTACGCGAC GATGCGAATA CATTGCATAT CGAGCCGCTG 
CCGTATTCGC TCGAAGAGTA A

Protein sequence

MAFTPFPPRQ PTASARLPLT LMTLDDWALA TITGADSEKY MQGQVTADVS QMTEDQHLLA 
AHCDAKGKMW SNLRLFRDGD GFAWIERRSV REPQLTELKK YAVFSKVTIA PDDERVLLGV 
AGFQARAALA NLFSVLPSKE KQVIREDATT LLWFEHPAER FLIVTDEATA NMLTDKLRGE 
AELNNSQQWL ALNIEAGFPV IDAANSGQFI PQATNLQALG GISFKKGCYT GQEMVARAKF 
RGANKRALWL LTGSASRLPE AGEDLELKMG ENWRRTGTVL AAVKLEDGQV VVQVVMNNDM 
EPDSIFRVRD DANTLHIEPL PYSLEE