Gene EcE24377A_3562 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3562
Symbol
ID	5587527
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	3576049
End bp	3577137
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	47%
IMG OID	640927188
Product	putative pilus biogenesis initiator protein
Protein accession	YP_001464557
Protein GI	157157077
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAATC GATTGATTGC GGCGATATTG GGCTTGTTTG GCACGCTCAC TGGCGTTCAG 
GCAGCTCCTG ACGTGACCAG TGAAATTACG TATGATTTGG CATCTGGTAG AGCGGATTAT 
TACTTCTGGA AGGATGAAGC GTCGGCAGGA AATAATGGAT ATATGTGGTA TGAATGTTCG 
TATCCTGACC TCCAACAAAC CTGTACAGCT AATGGAAATA TATCGACAGT ACAAATCTAT 
TTAACTGAAC AACGCAGTGG GATGCGTTGG CCGGTAAAAC TCAAAGGATT TAAAACAGCC 
ATTGTAAGTA GCGATGAAGC GCCGCCAGGA TGCAAGGGGG GCAAAGGGCT TCAGACGAAT 
CTTAAGGATT CTAATAGATC TTCATGTACA GAAGATGGTC AACATTATTA TATATACGAT 
ACAAAGTTTC TTACGCTCTA CCTTGAGCAG ACAGAGATGA AGAATTTGCC GATTGGTGGC 
GTCTGGAAGG GGAAAGTTAA ATTACATTCG AACAGCCCGG CCCAGGACTA TTTCGCAAAT 
ATTACCCTGA ATACGCTCGA CCCCAACCAT ATTGACGTGT TCTTCCCGGA GTTCGCCCAC 
GCCACGCCAA GGGTGCAGTT AGACTTGCAT CCAACAGGAA GCGTTAACGG CAGCAACTAC 
GCGCAAGATC TGACCATGTT GGACATGTGC CTGTACGATG GTTTTAACGG TAATGCCATC 
AGTTATGAAA TCATGCTCAA AGATGAAGGG CGACCAGCTG CAGGGCGCAG AGACGGTTAC 
TTCTCTATCT ATCGTCAGGG AGGGACCACC ACCGACGAGG GAGAACGCAT TGATTACCGG 
GTCAAAATGT ACAACCCGGA AACCGGTGGG CAAATTGATG TGCGCAATAA TGAAAATATG 
GTCTGGAACA GCATTAACCT GAAACGTGTG CGTCCGGTGG TACTGCCCGG TATTCGCTAT 
GCCGTGATGT GTGTGCCGAC ACCCTTGACT CTGGCAGTCG ATAAATTCAG CGTGATGGAT 
AAACAGGCCG GGTACTACAT GGGCAAATTG TCAGTAATCT TTACGCCTTC CTTGCCAACC 
ATCAATTAA

Protein sequence

MRNRLIAAIL GLFGTLTGVQ AAPDVTSEIT YDLASGRADY YFWKDEASAG NNGYMWYECS 
YPDLQQTCTA NGNISTVQIY LTEQRSGMRW PVKLKGFKTA IVSSDEAPPG CKGGKGLQTN 
LKDSNRSSCT EDGQHYYIYD TKFLTLYLEQ TEMKNLPIGG VWKGKVKLHS NSPAQDYFAN 
ITLNTLDPNH IDVFFPEFAH ATPRVQLDLH PTGSVNGSNY AQDLTMLDMC LYDGFNGNAI 
SYEIMLKDEG RPAAGRRDGY FSIYRQGGTT TDEGERIDYR VKMYNPETGG QIDVRNNENM 
VWNSINLKRV RPVVLPGIRY AVMCVPTPLT LAVDKFSVMD KQAGYYMGKL SVIFTPSLPT 
IN