Gene EcE24377A_F0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_F0022
Symbol
ID	5585666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009786
Strand	-
Start bp	19020
End bp	20171
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	46%
IMG OID	640913742
Product	IS30, transposase
Protein accession	YP_001451392
Protein GI	157149334
COG category	[L] Replication, recombination and repair
COG ID	[COG2826] Transposase and inactivated derivatives, IS30 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACGAA CATTTACAGC AGAGGAAAAA GCCTCTGTTT TTGAACTATG GAAGAACGGA 
ACAGGCTTCA GTGAAATAGC GAATATCCTG GGTTCAAAAC CCGGAACGAT CTTCACTATG 
TTAAGGGATA CTGGCGGCAT AAAACCCCAT GAGCGTAAGC GGGCTGTAGC TCACCTGACA 
CTGTCTGAGC GCGAGGAGAT ACGAGCTGGT TTGTCAGCCA AAATGAGCAT TCGTGCGATA 
GCTACTGCGC TGAATCGCAG TCCTTCGACG ATCTCACGTG AAGTTCAGCG TAATCGGGGC 
AGACGCTATT ACAAAGCTGT TGATGCTAAT AACCGAGCCA ACAGAATGGC GAAAAGGCCA 
AAACCGTGCT TACTGGATCA AAATTTACCA TTGCGAAAGC TTGTTCTGGA AAAGCTGGAG 
ATGAAATGGT CTCCAGAGCA AATATCAGGA TGGTTAAGGC GAACAAAACC ACGTCAAAAA 
ACGCTGCGAA TATCACCTGA GACAATTTAT AAAACGCTGT ACTTTCGTAG CCGTGAAGCG 
CTACACCACC TGAATATACA GCATCTGCGA CGGTCGCATA GCCTTCGCCA TGGCAGGCGT 
CATACCCGCA AAGGCGAAAG AGGTACGATT AACATAGTGA ACGGAACACC AATTCACGAA 
CGTTCCCGAA ATATCGATAA CAGACGCTCT CTGGGGCATT GGGAGGGCGA TTTAGTCTCA 
GGTACAAAAA ACTCTCATAT AGCCACACTT GTAGACCGAA AATCACGTTA TACGATCATC 
CTTAGACTCA GGGGCAAAGA TTCTGTCTCA GTAAATCAGG CTCTTACCGA CAAATTCCTG 
AGTTTACCGT CAGAACTCAG AAAATCACTG ACATGGGACA GAGGAATGGA ACTGGCCAGA 
CATCTAGAAT TTACTGTCAG CACCGGCGTT AAAGTTTACT TCTGCGATCC TCAGAGTCCT 
TGGCAGCGGG GAACAAATGA GAACACAAAT GGGCTAATTC GGCAGTACTT TCCTAAAAAG 
ACATGTCTTG CCCAATATAC TCAACATGAA CTAGATCTGG TTGCTGCTCA GCTAAACAAC 
AGACCGAGAA AGACACTGAA GTTCAAAACA CCGAAAGAGA TAATTGAAAG GAGTGTTGCA 
TTGACAGATT GA

Protein sequence

MRRTFTAEEK ASVFELWKNG TGFSEIANIL GSKPGTIFTM LRDTGGIKPH ERKRAVAHLT 
LSEREEIRAG LSAKMSIRAI ATALNRSPST ISREVQRNRG RRYYKAVDAN NRANRMAKRP 
KPCLLDQNLP LRKLVLEKLE MKWSPEQISG WLRRTKPRQK TLRISPETIY KTLYFRSREA 
LHHLNIQHLR RSHSLRHGRR HTRKGERGTI NIVNGTPIHE RSRNIDNRRS LGHWEGDLVS 
GTKNSHIATL VDRKSRYTII LRLRGKDSVS VNQALTDKFL SLPSELRKSL TWDRGMELAR 
HLEFTVSTGV KVYFCDPQSP WQRGTNENTN GLIRQYFPKK TCLAQYTQHE LDLVAAQLNN 
RPRKTLKFKT PKEIIERSVA LTD