Gene EcE24377A_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1044
Symbol
ID	5586977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1067867
End bp	1068949
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	54%
IMG OID	640924749
Product	baseplate assembly protein J
Protein accession	YP_001462163
Protein GI	157155596
COG category	[S] Function unknown
COG ID	[COG3299] Uncharacterized homolog of phage Mu protein gp47
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTATT CACCACCGAC ATTATCATCG CTGATTGCCC GTACAGAACA GAATATTGAA 
CAGCGCCTGC CGGGTAGCTG GCCTCAGGCC CGTGAAAAAA CGCTGAGTGC CATTGCTTAT 
GCTCAGGCGG GCCTTGCTGC CGGTTGTCAC GAGCATATTT CATGGGTTGG ACGGCAGATT 
ATCCCGTCGA CAGCAGATGA AGATGAGTTG CTGGAGCACT GCCGGTTCTG GGGCGTGCGC 
CGCAAACAGG CGACAGCCGC CAGCGGCCCG CTGACTGTCA CCACATCGGC AGCGACCACC 
ATTCCTGCCG GTACACGCTG GCAGCGTGCT GATGGTGTGG TTTACAGCCT GGCTGATGCC 
ATTGTGATTG ACCGTGCAGG AACGACGGAA ATTACCGTTA CCGCACTGGC TGCCGGTGAG 
GCAGGAAATA CCGGTGAGAA TACCCTTTTA ACGTTGATCA CCCCGGTTGC CTGTGTTGTT 
TCCGATGCCA TCACTGTAAA AGGGTTTTCC GGTGGGGCTG ATATTGAGAG TGCAGCGGAG 
CTGCTGTCAC GGCTGGAATA TCGTGTCCAG TATCCTCCGT TCGGCGGTAA TCAGTTTGAT 
TATGTTCGCT GGGCGCGTGA AGTCAGCGGC GTTACCCGTG CCTGGTGTTT TCCGACATGG 
AAAGGCGGTG GCACAGTCGG GGTGACGTTT GTTATGGATA ACCGGAGCAA TATTTTTCCA 
CAACCGGCAG ACGTGGAACG CGTGGCGGAT TATATCGCCG GTCATACTGA CCCGATCACT 
GGTCTGATTG TCGGACAGCC TGATGGTGTA AATGTCACGG TATTTGCGGC AAAGGCAAAG 
CCGGTAAATC CACGGATTTA TATATCACCG AAGACAGCCG AACTGAAACA GGCTATTACT 
CACGCCATTA ATACCATGTT TTTTAATGAG GTGACGCCGG GCGGCGCACT TGCCCCCTCC 
CGTATTATCC GTGCGGTGGC AGGTGTTACC GGTCTGGATG ATTTTGAAGT GCGTTTCCCG 
ACAGAGATCC AGCGTTCGGA GAATACGGAA CTGTTAACAC CGGGGACAAT TGAATGGCTG 
TAA

Protein sequence

MAYSPPTLSS LIARTEQNIE QRLPGSWPQA REKTLSAIAY AQAGLAAGCH EHISWVGRQI 
IPSTADEDEL LEHCRFWGVR RKQATAASGP LTVTTSAATT IPAGTRWQRA DGVVYSLADA 
IVIDRAGTTE ITVTALAAGE AGNTGENTLL TLITPVACVV SDAITVKGFS GGADIESAAE 
LLSRLEYRVQ YPPFGGNQFD YVRWAREVSG VTRAWCFPTW KGGGTVGVTF VMDNRSNIFP 
QPADVERVAD YIAGHTDPIT GLIVGQPDGV NVTVFAAKAK PVNPRIYISP KTAELKQAIT 
HAINTMFFNE VTPGGALAPS RIIRAVAGVT GLDDFEVRFP TEIQRSENTE LLTPGTIEWL