Gene EcolC_2691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2691
Symbol
ID	6067591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2953726
End bp	2955486
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	52%
IMG OID	641602097
Product	hypothetical protein
Protein accession	YP_001725647
Protein GI	170020693
COG category	[S] Function unknown
COG ID	[COG1944] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00702] uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.864502
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAA CATTTATCCC CGGCAAAGAT GCCGCTCTGG AAGATTCCAT CGCTCGCTTC 
CAGCAAAAAC TTTCAGACCT CGGCTTTCAG ATTGAAGAGG CCTCCTGGCT GAATCCCGTA 
CCTAACGTCT GGTCTGTACA TATTCGCGAC AAAGAGTGCG CACTGTGTTT TACCAACGGT 
AAAGGCGCAA CCAAGAAAGC GGCGCTGGCT TCTGCACTCG GTGAATATTT CGAGCGTCTC 
TCAACCAACT ACTTTTTTGC GGACTTCTGG CTGGGCGAAA CCATCGCCAA CGGTCCGTTC 
GTGCATTATC CCAACGAAAA ATGGTTCCCA CTGACCGAAA ATGACGATGT GCCAGAAGGG 
CTGCTCGATG ACCGTCTGCG CGCGTTTTAT GATCCGGAGA ATGAACTGAC CGGCAGCATG 
CTGATTGACC TACAATCCGG TAACGAAGAT CGTGGTATTT GCGGCCTGCC GTTTACGCGT 
CAGTCCGACA ATCAGACCGT TTATATTCCG ATGAATATCA TTGGTAACCT GTACGTCTCC 
AACGGTATGT CCGCAGGTAA TACCCGCAAC GAAGCACGCG TTCAGGGATT GTCTGAAGTT 
TTCGAACGCT ACGTGAAAAA CCGCATTATT GCTGAAAGCA TCAGCCTGCC AGAGATCCCG 
GCAGACGTGC TGGCGCGTTA CCCAGCAGTA GTTGAAGCCA TCGAAACGCT GGAAGCGGAG 
GGTTTCCCAA TCTTCGCTTA TGACGGTTCG CTTGGCGGCC AGTATCCGGT GATTTGCGTG 
GTACTGTTCA ATCCTGCTAA CGGTACCTGC TTTGCCTCTT TCGGTGCGCA TCCTGATTTT 
GGCGTAGCAC TGGAACGTAC CGTGACCGAG CTGCTGCAAG GTCGTGGCCT GAAAGATTTG 
GATGTGTTTA CTCCGCCAAC CTTCGATGAT GAAGAAGTCG CTGAACATAC CAACCTCGAA 
ACGCACTTTA TCGATTCCAG CGGTTTAATC TCCTGGGACC TGTTCAAGCA GGATGCCGAT 
TATCCGTTTG TGGACTGGAA TTTCTCCGGC ACCACGGAAG AAGAGTTCGC CACACTGATG 
GCTATCTTCA ACAAAGAAGA TAAAGAAGTT TATATTGCCG ATTACGAGCA TCTGGGCGTT 
TATGCTTGCC GTATTATCGT GCCTGGCATG TCCGATATTT ATCCGGCTGA AGATCTGTGG 
CTCGCGAATA ACAGTATGGG CAGCCATTTA CGTGAAACGA TTCTTTCGCT ACCAGGCAGC 
GAGTGGGAAA AAGAAGATTA CCTGAACCTC ATCGAGCAAC TGGATGAAGA AGGTTTTGAT 
GACTTTACCC GCGTGCGTGA GCTGTTGGGT CTGGCGACCG GGTCGGATAA CGGTTGGTAC 
ACCCTGCGTA TCGGTGAATT AAAAGCCATG CTGGCGCTGG CTGGTGGCGA TCTGGAACAG 
GCTCTGGTCT GGACCGAATG GACGATGGAG TTTAACTCAT CAGTATTTAG TCCGGAACGC 
GCCAACTATT ATCGCTGCCT GCAAACGTTG TTATTACTGG CACAGGAAGA AGATCGCCAG 
CCGCTGCAAT ATCTGAATGC GTTTGTTCGC ATGTACGGCG CAGATGCCGT AGAAGCCGCC 
AGTGCGGCAA TGAGCGGCGA AGCGGCGTTT TACGGCCTGC AACCGGTAGA TAGCGATCTG 
CACGCGTTTG CTGCACATCA GTCGTTGTTG AAGGCCTACG AAAAGCTGCA GCGCGCCAAA 
GCAGCATTCT GGGCAAAATA A

Protein sequence

MTQTFIPGKD AALEDSIARF QQKLSDLGFQ IEEASWLNPV PNVWSVHIRD KECALCFTNG 
KGATKKAALA SALGEYFERL STNYFFADFW LGETIANGPF VHYPNEKWFP LTENDDVPEG 
LLDDRLRAFY DPENELTGSM LIDLQSGNED RGICGLPFTR QSDNQTVYIP MNIIGNLYVS 
NGMSAGNTRN EARVQGLSEV FERYVKNRII AESISLPEIP ADVLARYPAV VEAIETLEAE 
GFPIFAYDGS LGGQYPVICV VLFNPANGTC FASFGAHPDF GVALERTVTE LLQGRGLKDL 
DVFTPPTFDD EEVAEHTNLE THFIDSSGLI SWDLFKQDAD YPFVDWNFSG TTEEEFATLM 
AIFNKEDKEV YIADYEHLGV YACRIIVPGM SDIYPAEDLW LANNSMGSHL RETILSLPGS 
EWEKEDYLNL IEQLDEEGFD DFTRVRELLG LATGSDNGWY TLRIGELKAM LALAGGDLEQ 
ALVWTEWTME FNSSVFSPER ANYYRCLQTL LLLAQEEDRQ PLQYLNAFVR MYGADAVEAA 
SAAMSGEAAF YGLQPVDSDL HAFAAHQSLL KAYEKLQRAK AAFWAK