Gene EcE24377A_4938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4938
Symbol
ID	5590314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4922870
End bp	4924150
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	52%
IMG OID	640928538
Product	hypothetical protein
Protein accession	YP_001465865
Protein GI	157158478
COG category	[S] Function unknown
COG ID	[COG2733] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAC TCATTGAACT CAGACGCGCC AAAATGTTGG CGCTCTCTTT ACTGCTTATC 
GCCGCTGCTA CCTTTGTCGT TACGCTGTTT TTGCCGCCCA ATTTTTGGGT GAGCGGCGTG 
AAGGCGATTG CTGAAGCGGC GATGGTCGGC GCGCTGGCGG ACTGGTTTGC GGTGGTGGCG 
CTGTTTCGCC GCGTGCCGAT TCCGATCATT TCTCGTCATA CGGCGATTAT TCCGCGTAAT 
AAAGACCGGA TTGGCGAAAA TCTCGGCCAG TTCGTGCAGG AAAAATTTCT CGATACCCAA 
TCGCTGGTGG CATTGATTCG ACGTCACGAA CCGGCGTTGT TGATTGGCAA CTGGTTTAGT 
CAGCCAGAAA ACGCCCGCCG CGTTGGTCAG CATCTGTTGC AGATCATGAG CGGTTTTCTT 
GAACTAACCG ATGATGCGCG TATTCAGCGC CTGCTTAAGC GCGCGGTCCA CCGGGCGATT 
GATAAAGTCG ATCTTTCTGG CACCAGTGCG TTGATGCTGG AGAGTATGAC TAAAAACGAT 
CGTCATCAGG TGCTGCTGGA TACGCTGATC GCACAGTTGA TCGCCCTTCT CCAGCGCGAT 
AAATCGCGCA AGTTTATTGC CCAGCAAATT GTTCGCTGGC TGGAGAGCGA GCATCCACTG 
AAAGCCAAAA TTTTGCCCAC TGAATGGCTG GGCGAACATA GCGCGGAGTT GGTTTCTGAC 
GCGGTGAATT CTTTGCTTGA TGATATCAGC CGCGATCGTG CGCATCAGAT CCGCCATGCG 
TTTGATCGCG CTACCTTCGC CCTGATCGAG AAACTGAAAA ACGATCCGGA AATGGCGGCG 
CGAGCCGATG CCGTAAAAAG CTATCTGAAA GAAGATGAAG CTTTTAACCG CTATCTCAGT 
GAATTGTGGG GGGATTTACG GAAATGGCTG AAAGCGGATA TCAACAGTGA AGATTCTCGT 
GTGAAAGAAC GTATCGCGCG GGCTGGTCAA TGGTTTGGCG AAACGTTAAT TGCCGATGAT 
GCCTTGCGGG CGTCGTTAAA TGGTCATCTG GAACAAGCCG CACACCGCAT TGCGCCTGAG 
TTTTCCGCAT TCCTGACTCG CCATATCAGC GACACGGTAA AAAGCTGGGA CGCACGGGAC 
ATGTCGCGGC AAATCGAGTT AAATATCGGC AAAGATCTCC AGTTTATCCG TGTCAACGGT 
ACGCTGGTTG GCGGTTGTAT TGGACTTATT TTGTATTTGC TGTCGCAGCT CCCGGCCTTG 
TTCCCCCTCG GCAATTTATA G

Protein sequence

MNKLIELRRA KMLALSLLLI AAATFVVTLF LPPNFWVSGV KAIAEAAMVG ALADWFAVVA 
LFRRVPIPII SRHTAIIPRN KDRIGENLGQ FVQEKFLDTQ SLVALIRRHE PALLIGNWFS 
QPENARRVGQ HLLQIMSGFL ELTDDARIQR LLKRAVHRAI DKVDLSGTSA LMLESMTKND 
RHQVLLDTLI AQLIALLQRD KSRKFIAQQI VRWLESEHPL KAKILPTEWL GEHSAELVSD 
AVNSLLDDIS RDRAHQIRHA FDRATFALIE KLKNDPEMAA RADAVKSYLK EDEAFNRYLS 
ELWGDLRKWL KADINSEDSR VKERIARAGQ WFGETLIADD ALRASLNGHL EQAAHRIAPE 
FSAFLTRHIS DTVKSWDARD MSRQIELNIG KDLQFIRVNG TLVGGCIGLI LYLLSQLPAL 
FPLGNL