Gene EcE24377A_1056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1056
Symbol
ID	5590208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1080457
End bp	1081527
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	49%
IMG OID	640924760
Product	putative fimbrial protein
Protein accession	YP_001462174
Protein GI	157156290
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3539] P pilus assembly protein, pilin FimA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000000398514
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATAA TCTTTGGAGA AAAATGCGTG TTATTACTAC GACTATTTTT TGCCGCCGTC 
TTAATGCTAT GGTGCGCTCA AACTGCTGCT TATAGCGGGC AGTGTCATAC CACTCAGGGG 
AATCCGTATA TTGGCGTCAA TTTTGGCGTT AAAACCCTGG AGGAAGAAGA AAATACGGCT 
GGAGTAGTTA AAGACAAATT TTATCAGTGG AACGAATCGA ATGATTATTA TGTTTCCTGT 
GATTGCGATA AAGACAATGT CAGAAGTGGC CGATGGGCAT TCGCCGCGGA TTCACCGTTA 
GTCTATTTAG GCGACAACTG GTACAAAATT AATGACTATC TTGCCGCCAA AGTTTTATTG 
CAGGTTAAAG GCAGTTCTCC TACTGCGGTT CCTTTCGAAA ACGTGGGCAC AGGGGCAGAT 
ACACGATGGC ATATTTGCGA TCCCGGCGGT CAACGTTTAG GTGGCCAGGG GGCTAGCGGT 
AATAGCGGTA GCTTTTCCCT GAAAATATTG CAGCCGTTCG TTGGTTCGGT CGTCATTCCT 
CCTATGGCGC TGGCGCGATT ATTTGAATGC TACAACATAC CCGCAGGTGA TTCCTGCACG 
ACTACAGGTA CATCGGTTTT AGTGTATTAC CTGTCTGGTA CGATCAATTC ACTTGGCTCA 
TGTTCCGTCA ATGCCGGAGA GACTATCGAG GTCGATCTGG GCGACGTATT TGCGGCTAAC 
TTTCGTGTTG TAGGGCATAA ACCCCTTGGG GCCAGAACGG CAGAACTCGC AATTCCAGTC 
AGGTGTAACA CGGGAAACGC GGGGTTAGTT AACGTCAACC TGAGTCTGAC GGCAACCACA 
GACCCCAGCT ATCCCCAGGC GATTAAGACG TCACGTCCTG GCGTGGGCGT GGTGGTGACC 
GATAGCCAGA ACAACATTAT TTCCCCTGCT GGTGGAACAT TACCGCTCTC TATTCCTGAT 
GATGCAGACA GTATCGCGCG AATGAATGTC TATCCAGTCA GCACGACAGG TGTACCACCA 
GAAACCGGGC GATTTGAAGC CACGGCAACG GTGAGAATAA ATTTTGATTA A

Protein sequence

MQIIFGEKCV LLLRLFFAAV LMLWCAQTAA YSGQCHTTQG NPYIGVNFGV KTLEEEENTA 
GVVKDKFYQW NESNDYYVSC DCDKDNVRSG RWAFAADSPL VYLGDNWYKI NDYLAAKVLL 
QVKGSSPTAV PFENVGTGAD TRWHICDPGG QRLGGQGASG NSGSFSLKIL QPFVGSVVIP 
PMALARLFEC YNIPAGDSCT TTGTSVLVYY LSGTINSLGS CSVNAGETIE VDLGDVFAAN 
FRVVGHKPLG ARTAELAIPV RCNTGNAGLV NVNLSLTATT DPSYPQAIKT SRPGVGVVVT 
DSQNNIISPA GGTLPLSIPD DADSIARMNV YPVSTTGVPP ETGRFEATAT VRINFD