Gene EcolC_0224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0224
Symbol
ID	6066217
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	256048
End bp	257250
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	55%
IMG OID	641599625
Product	hypothetical protein
Protein accession	YP_001723232
Protein GI	170018278
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAAGGT TTGATGCCAT TATTATAGGC GCTGGTGCGG CGGGTATGTT CTGTTCTGCG 
CTGGCAGGTC AGGCAGGACG CCGGGTTCTG CTGATCGATA ATGGTAAAAA ACCAGGGCGC 
AAAATCCTTA TGTCTGGCGG TGGGCGCTGC AACTTTACCA ACCTTTATGT CGAACCAGGC 
GCTTATCTGA GCCAGAATCC GCATTTTTGT AAGTCTGCAC TCGCGCGTTT TACCCAGTGG 
GATTTCATTG ATCTGGTCAA TAAACACGGC ATCGCCTGGC ACGAGAAAAC GTTAGGACAA 
CTCTTCTGCG ATGACTCCGC GCAGCAGATT GTCGACATGC TGGTGGATGA GTGCGAGAAG 
GGCAATGTAA CCTTCAGATT GCGTAGCGAA GTGCTGAGTG TGGCGAAGGA TGAAACAGGC 
TTCACGCTTG AACTGAACGG CATGACTGTC GGTTGCGAAA AGCTGGTCAT CGCGACCGGT 
GGGCTGTCAA TGCCGGGGCT GGGCGCGTCG CCGTTTGGTT ATAAGATTGC CGAACAATTT 
GGCCTCAACG TGCTGCCGAC CCGTGCGGGT CTGGTGCCAT TCACTCTGCA TAAACCGTTG 
CTCGAAGAGT TACAGGTGCT GGCGGGCGTG GCGGTGCCTT CCGTGATTAC CGCTGAAAAC 
GGCATCGTTT TCCGTGAGAA CTTACTCTTC ACCCATCGCG GCTTGTCTGG ACCGGCGGTG 
TTGCAGATTT CAAGCTACTG GCAACCGGGT GAATTTGTCA GTATCAATCT GCTACCTGAT 
GTGGACCTCG AAACCTTCCT GAATGAGCAG CGTAACGCAC ATCCGAATCA GAGCCTGAAA 
AACACACTGG CGGTTCATCT ACCGAAGCGG TTGGTTGAAC GCTTACAGCA ACTCGGGCAA 
ATCCCGGATG TTTCGCTAAA ACAGCTCAAC GTGCGTGACC AACAGGCACT GATTAGCACA 
TTGACCGACT GGCGCGTACA ACCCAACGGC ACTGAAGGCT ATCGCACTGC CGAAGTGACG 
CTCGGCGGCG TGGACACCAA CGAACTCTCT TCACGGACGA TGGAAGCGCG CAAAGTGCCT 
GGGCTGTACT TCATCGGCGA AGTGATGGAC GTCACCGGCT GGCTGGGGGG CTATAACTTC 
CAGTGGGCGT GGTCGAGTGC ATGGGCTTGT GCGCAGGATT TGATTGCAGC GAAGTCGTCC 
TGA

Protein sequence

MERFDAIIIG AGAAGMFCSA LAGQAGRRVL LIDNGKKPGR KILMSGGGRC NFTNLYVEPG 
AYLSQNPHFC KSALARFTQW DFIDLVNKHG IAWHEKTLGQ LFCDDSAQQI VDMLVDECEK 
GNVTFRLRSE VLSVAKDETG FTLELNGMTV GCEKLVIATG GLSMPGLGAS PFGYKIAEQF 
GLNVLPTRAG LVPFTLHKPL LEELQVLAGV AVPSVITAEN GIVFRENLLF THRGLSGPAV 
LQISSYWQPG EFVSINLLPD VDLETFLNEQ RNAHPNQSLK NTLAVHLPKR LVERLQQLGQ 
IPDVSLKQLN VRDQQALIST LTDWRVQPNG TEGYRTAEVT LGGVDTNELS SRTMEARKVP 
GLYFIGEVMD VTGWLGGYNF QWAWSSAWAC AQDLIAAKSS