Gene EcE24377A_1204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1204
Symbol	flgJ
ID	5586381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1214801
End bp	1215742
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	55%
IMG OID	640924903
Product	flagellar rod assembly protein/muramidase FlgJ
Protein accession	YP_001462315
Protein GI	157158487
COG category	[M] Cell wall/membrane/envelope biogenesis [N] Cell motility [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3951] Rod binding protein
TIGRFAM ID	[TIGR02541] flagellar rod assembly protein/muramidase FlgJ

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.592055
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAGCG ACAGCAAACT ACTGGCAAGT GCGGCCTGGG ATGCGCAATC ACTCAACGAA 
CTAAAGGCGA AAGCGGGCGA AGATCCGGCG GCAAATATCC GTCCGGTGGC CCGCCAGGTG 
GAAGGGATGT TCGTGCAGAT GATGTTGAAA AGCATGCGCG ACGCTTTACC AAAAGATGGC 
CTGTTCAGCA GCGAGCACAC TCGTCTGTAT ACCAGTATGT ATGACCAGCA GATTGCCCAA 
CAGATGACGG CGGGCAAAGG TCTGGGGCTT GCAGAGATGA TGGTTAAACA GATGACGCCA 
GAACAACCAT TGCCAGAGGA GTCCACGCCA GCAGCACCGA TGAAATTCCC GCTCGAAACC 
GTGGTGCGTT ATCAAAATCA GGCGCTTTCG CAGCTGGTGC AAAAGGCCGT GCCACGTAAC 
TACGATGATT CGCTGCCGGG TGACAGTAAA GCATTCCTCG CGCAACTCTC GCTGCCCGCC 
CAACTGGCAA GCCAGCAAAG CGGTGTGCCA CATCATTTGA TCCTCGCTCA GGCGGCACTG 
GAATCTGGTT GGGGGCAACG GCAAATCCGC CGCGAAAACG GCGAGCCGAG CTATAACCTG 
TTTGGTGTCA AAGCCTCTGG CAACTGGAAA GGGCCAGTTA CTGAAATCAC CACGACTGAA 
TATGAAAACG GCGAAGCGAA GAAAGTAAAA GCGAAGTTTC GCGTCTACAG CTCGTATCTG 
GAAGCCTTGT CGGATTACGT TGGGCTGTTA ACGCGTAACC CGCGCTACGC CGCCGTGACG 
ACCGCCGCGA GTGCGGAACA GGGGGCGCAG GCCCTACAGG ACGCGGGCTA TGCCACCGAT 
CCTCACTATG CCCGCAAACT CACCAACATG ATTCAGCAGA TGAAATCGAT AAGCGACAAG 
GTGAGCAAAA CCTACAGCAT GAACATTGAT AATCTGTTCT GA

Protein sequence

MISDSKLLAS AAWDAQSLNE LKAKAGEDPA ANIRPVARQV EGMFVQMMLK SMRDALPKDG 
LFSSEHTRLY TSMYDQQIAQ QMTAGKGLGL AEMMVKQMTP EQPLPEESTP AAPMKFPLET 
VVRYQNQALS QLVQKAVPRN YDDSLPGDSK AFLAQLSLPA QLASQQSGVP HHLILAQAAL 
ESGWGQRQIR RENGEPSYNL FGVKASGNWK GPVTEITTTE YENGEAKKVK AKFRVYSSYL 
EALSDYVGLL TRNPRYAAVT TAASAEQGAQ ALQDAGYATD PHYARKLTNM IQQMKSISDK 
VSKTYSMNID NLF