Gene EcE24377A_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1049
Symbol
ID	5587806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1071486
End bp	1073474
Gene Length	1989 bp
Protein Length	662 aa
Translation table	11
GC content	51%
IMG OID	640924753
Product	bacteriophage Mu transposase MuA
Protein accession	YP_001462167
Protein GI	157159157
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAT GGTATACAGC AAAAGAGTTG CTCGGTTTGG CAGGTTTACC AAAGCAAGCC 
ACTAACATTA CACGTAAGGC ACAAAGAGAA GGCTGGGAGT TCAGGCAGGT TGCAGGGACT 
AAAGGTGTAT CATTTGAATT CAATATCAAA TCATTCCCTG TCGCATTACG TGCTGAAATT 
CTGTTGCAAC AAGGGAGAAT TGAAACAAGT CAGGGGTATT TTGAAATCGC CCGCCCCACG 
CTGGAAGCCC ATGATTATGA TCGTGAGGCA CTGTGGAGCA AATGGGATAA CGCCAGCGAT 
TCCCAGCGCA GACTTGCTGA AAAATGGTTG CCTGCGGTTC AGGCTGCAGA CGAAATGCTG 
AACCAGGGGA TTTCAACAAA AACGGCTTTT GCGACCGTTG CTGGGCATTA CCAGGTCAGC 
GCATCCACTT TGCGGGACAA GTATTACCAG GTACAGAAGT TTGCGAAGCC TGACTGGGCG 
GCTGCGCTTG TTGATGGACG TGGTGCATCC CGTCGCAACG TTCACAAAAG TGAATTTGAC 
GAGGATGCCT GGCAGTTTCT GATTGCAGAT TATCTGCGAC CGGAAAAGCC CGCCTTCCGC 
AAATGTTATG AGCGTCTGGA ACTGGCAGCC CGCGAGCATG GCTGGAGTAT TCCCTCCCGT 
GCCACGGCCT TTCGCCGGAT TCAGCAACTG GACGAGGCAA TGGTTGTTGC CTGTCGTGAA 
GGTGAACATG CACTGATGCA TCTGATACCG GCACAGCAGC GAACTGTGGA ACACCTGGAC 
GCCATGCAGT GGATCAACGG CGACGGTTAT CTGCATAACG TCTTTGTACG CTGGTTTAAC 
GGTGATGTGA TCCGCCCGAA AACATGGTTC TGGCAGGATG TGAAAACCCG AAAAATTCTG 
GGCTGGCGCT GCGATGTAAG CGAGAACATC GACTCAATTC GCCTCTCGTT TATGGATGTG 
GTGACACGCT ACGGCATCCC GGAGGATTTT CACATCACCA TTGATAACAC CCGTGGTGCA 
GCGAATAAAT GGCTGACGGG GGGCGCGCCC AATCGTTACC GCTTTAAGGT AAAAGAGGAC 
GATCCAAAGG GACTGTTTTT ACTGATGGGC GCGAAAATGC ACTGGACAAG CGTTGTTGCC 
GGTAAAGGCT GGGGCCAGGC AAAACCTGTT GAACGTGCTT TCGGTGTTGG TGGGCTTGAG 
GAATACGTTG ATAAGCATCC GGCACTGGCT GGCGCATATA CGGGGCCAAA TCCGCAGGCA 
AAACCTGATA ACTATGGCGA CCGCGCTGTT GATGCAGAGC TGTTTCTGAA AACCCTTGCC 
GAAGGTGTGG CGATGTTCAA TGCCAGAACA GGCCGTGAAA CAGAAATGTG CGGAGGCAAA 
CTTTCGTTTG ATGACGTTTT TGAGCGTGAA TACGCCAGAA CGATTGTGCG TAAGCCTACC 
GAAGAGCAAA AACGGATGCT GTTACTGCCT GCCGAGGCGG TGAACGTTTC ACGTAAAGGC 
GAGTTCGCGC TTAAAGTTGG CGGCTCCCTT AAAGGTGCGA AAAACGTTTA TTACAACATG 
GCGTTAATGA ATGCCGGAGT GAAAAAAGTT GTGGTCAGAT TTGATCCACA GCAGTTACAC 
AGCACGGTTT ATTGCTACAC CCTGGACGGT CGGTTTATCT GTGAAGCGGA ATGTCTGGCA 
CCTGTTGCGT TTAATGATGC TGCGGCAGGC CGTGAATATC GCCGCCGCCA GAAACAACTG 
AAATCTGCGA CGAAAGCAGC GATTAAGGCA CAAAAACAAA TGGATGCACT GGAAGTGGCA 
GAGCTGCTGC CGCAGATAGC CGAACCTGAA GCACCAGAAT CACGAATTGT CGGCATTTTC 
CGGCCTTCCG GTAATACGGA ACGGGTGAAG AATCAGGAGC GTGATGATGA ATACGAAACT 
GAGCGTGATG AATATCTGAA TCATTCGCTG GATATTCTGG AACAGAACAG ACGTAAAAAA 
GCCATTTAA

Protein sequence

MKEWYTAKEL LGLAGLPKQA TNITRKAQRE GWEFRQVAGT KGVSFEFNIK SFPVALRAEI 
LLQQGRIETS QGYFEIARPT LEAHDYDREA LWSKWDNASD SQRRLAEKWL PAVQAADEML 
NQGISTKTAF ATVAGHYQVS ASTLRDKYYQ VQKFAKPDWA AALVDGRGAS RRNVHKSEFD 
EDAWQFLIAD YLRPEKPAFR KCYERLELAA REHGWSIPSR ATAFRRIQQL DEAMVVACRE 
GEHALMHLIP AQQRTVEHLD AMQWINGDGY LHNVFVRWFN GDVIRPKTWF WQDVKTRKIL 
GWRCDVSENI DSIRLSFMDV VTRYGIPEDF HITIDNTRGA ANKWLTGGAP NRYRFKVKED 
DPKGLFLLMG AKMHWTSVVA GKGWGQAKPV ERAFGVGGLE EYVDKHPALA GAYTGPNPQA 
KPDNYGDRAV DAELFLKTLA EGVAMFNART GRETEMCGGK LSFDDVFERE YARTIVRKPT 
EEQKRMLLLP AEAVNVSRKG EFALKVGGSL KGAKNVYYNM ALMNAGVKKV VVRFDPQQLH 
STVYCYTLDG RFICEAECLA PVAFNDAAAG REYRRRQKQL KSATKAAIKA QKQMDALEVA 
ELLPQIAEPE APESRIVGIF RPSGNTERVK NQERDDEYET ERDEYLNHSL DILEQNRRKK 
AI