Gene EcE24377A_1002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1002
Symbol
ID	5590752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1020786
End bp	1022546
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	51%
IMG OID	640924709
Product	hypothetical protein
Protein accession	YP_001462123
Protein GI	157155234
COG category	[S] Function unknown
COG ID	[COG1944] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00702] uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.332512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAAA CATTTATCCC CGGCAAAGAT GCCGCTCTGG AAGATTCCAT CGCTCGCTTC 
CAGCAAAAAC TTTCAGACCT CGGCTTTCAG ATTGAAGAGG CCTCCTGGCT GAATCCTGTG 
CCTAACGTCT GGTCTGTACA TATTCGCGAC AAAGAGTGCG CACTGTGTTT TACCAACGGA 
AAAGGCGCAA CCAAAAAAGC GGCGCTGGCT TCTGCACTTG GTGAATATTT CGAGCGTCTC 
TCAACCAACT ACTTTTTTGC TGATTTCTGG CTGGGCGAAA CCATCGCCAA CGGTCCGTTC 
GTGCATTATC CCAACGAAAA ATGGTTCCCA CTGACCGAAA ATGACGATGT GCCAGAAGGA 
CTACTCGATG ACCGTCTGCG CGCGTTTTAT GATCCGGAGA ATGAACTGAC CGGCAGCATG 
CTGATTGACC TACAATCCGG TAACGAAGAT CGTGGTATTT GCGGCCTGCC GTTTACGCGT 
CAGTCCGACA ATCAGACCGT TTATATTCCG ATGAATATCA TTGGTAACCT GTACGTCTCC 
AACGGTATGT CCGCAGGTAA TACCCGCAAC GAAGCACGCG TTCAGGGATT GTCTGAAGTT 
TTCGAACGCT ACGTGAAAAA CCGCATTATT GCTGAAAGCA TCAGCCTGCC AGAGATCCCG 
GCAGACGTGC TGGCGCGTTA CCCAGCAGTA GTTGAAGCCA TCGAAACGCT GGAAGCGGAG 
GGTTTCCCAA TCTTCGCTTA TGACGGTTCG CTTGGCGGCC AGTATCCGGT GATTTGCGTG 
GTACTGTTCA ATCCTGCTAA CGGTACCTGC TTTGCCTCTT TCGGTGCGCA TCCTGATTTT 
GGCGTAGCAC TGGAACGTAC CGTGACCGAG CTGCTGCAAG GTCGTGGCCT GAAAGATTTG 
GATGTGTTTA CTCCGCCAAC CTTCGATGAT GAAGAAGTCG CTGAACATAC CAACCTCGAA 
ACGCACTTTA TCGATTCCAG CGGTTTAATC TCCTGGGACC TGTTCAAGCA GGATGCCGAT 
TATCCGTTTG TGGACTGGAA TTTCTCCGGC ACCACGGAAG AAGAGTTCGC CACGCTGATG 
GCTATCTTCA AAAAGGAAGA TAAAGAAGTT TATATTGCCG ATTACGAGCA TCTGGGTGTC 
TACGCTTGCC GCATTATCGT GCCTGGCATG TCCGATATTT ATCCGGCTGA AGATCTGTGG 
CTCGCGAATA ACAGTATGGG CAGCCATTTA CGTGAAACGA TTCTTTCGCT ACCAGGCAGC 
GAGTGGGAAA AAGAAGATTA CCTGAACCTC ATCGAGCAAC TGGATGAAGA AGGTTTTGAT 
GACTTTACCC GCGTGCGTGA GCTGTTGGGT CTGGCGACCG GGTCGGATAA CGGTTGGTAC 
ACCCTGCGTA TCGGTGAATT AAAAGCCATG CTGGCGCTGG CTGGTGGCGA TCTGGAACAG 
GCTCTGGTCT GGACCGAATG GACGATGGAG TTTAACTCAT CAGTATTTAG TCCGGAACGC 
GCCAACTATT ATCGCTGCCT GCAAACGTTG TTATTACTGG CACAGGAAGA AGATCGCCAG 
CCGCTGCAAT ATCTGAATGC GTTTGTTCGC ATGTACGGCG CAGATGCCGT AGAAGCCGCC 
AGTGCGGCAA TGAGCGGCGA AGCGGCGTTT TACGGCCTGC AACCGGTAGA TAGCGATCTG 
CACGCGTTTG CTGCACATCA GTCGTTGTTG AAGGCCTACG AAAAGCTGCA GCGCGCCAAA 
GCAGCATTCT GGGCAAAATA A

Protein sequence

MTQTFIPGKD AALEDSIARF QQKLSDLGFQ IEEASWLNPV PNVWSVHIRD KECALCFTNG 
KGATKKAALA SALGEYFERL STNYFFADFW LGETIANGPF VHYPNEKWFP LTENDDVPEG 
LLDDRLRAFY DPENELTGSM LIDLQSGNED RGICGLPFTR QSDNQTVYIP MNIIGNLYVS 
NGMSAGNTRN EARVQGLSEV FERYVKNRII AESISLPEIP ADVLARYPAV VEAIETLEAE 
GFPIFAYDGS LGGQYPVICV VLFNPANGTC FASFGAHPDF GVALERTVTE LLQGRGLKDL 
DVFTPPTFDD EEVAEHTNLE THFIDSSGLI SWDLFKQDAD YPFVDWNFSG TTEEEFATLM 
AIFKKEDKEV YIADYEHLGV YACRIIVPGM SDIYPAEDLW LANNSMGSHL RETILSLPGS 
EWEKEDYLNL IEQLDEEGFD DFTRVRELLG LATGSDNGWY TLRIGELKAM LALAGGDLEQ 
ALVWTEWTME FNSSVFSPER ANYYRCLQTL LLLAQEEDRQ PLQYLNAFVR MYGADAVEAA 
SAAMSGEAAF YGLQPVDSDL HAFAAHQSLL KAYEKLQRAK AAFWAK