Gene EcolC_2655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2655
Symbol
ID	6064444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2907483
End bp	2908526
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	49%
IMG OID	641602062
Product	fimbrial protein
Protein accession	YP_001725612
Protein GI	170020658
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3539] P pilus assembly protein, pilin FimA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0263155
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0042534
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTCATTAC TACGACTATT TTTTGCCGCC GTCTTAATGC TATGGTGCGC TCAAACCGCT 
GCTTATAGCG GGCAGTGTCA TACTACTCAG GGGAATCCGT ATATTGGCGT CAATTTTGGC 
GTTAAAACCC TGGAGGAAGA AGCAAATACG GCAGGGGTAG TTAAAGACAA ATTTTATCAG 
TGGAACGAAT CGAATGATTA TTATGTTTCC TGTGATTGCG ATAAAGACAA TGTCAGAAGT 
GGCCGATGGG CATTCGCCGC GGATTCACCG TTAGTCTATT TAGGCGACAA CTGGTACAAA 
ATTAATGACT ATCTTGCCGC CAAAGTTTTA TTGCAGGTTA AAGGCAGTTC TCCTACTGCG 
GTTCCTTTCG AAAACGTGGG CACAGGGGGG GATACCCGAT GGCATATTTG CGACCCTGGC 
GGTCAACGTT TAGGTGGGCA GGGGGCAAGC GGTAATAGCG GTAGCTTTTC CCTGAAAATA 
TTGCAGCCGT TCGTTGGCTC GGTCGTCATT CCTCCTATGG CGCTGGCGCG ATTATATGAA 
TGCTACAACA TACCCGCAGG TGATTCCTGC ACGACTACAG GTTCACCGGT TTTAGTGTAT 
TACCTGTCTG GTACGATCAA TTCACTTGGC TCATGTTCCG TCAATGCCGG AGAGACAATT 
GAAGTTGATT TAGGTGATGT CTTCGCTGCC AATTTCCGTG TTGTAGGGCA TAAACCTCTT 
GGGGCCAGAA CAGCAGAACT TGCAATTCCA GTCAGGTGTA ACACGGGAAA CGCGGGATTA 
GTTAATGTCA ACCTGAGTCT GACGGCAACC ACAGACCCCA GCTATCCCCA GGCGATTAAG 
ACGTCACGTC CTGGCGTGGG CGTGGTGGTG ACCGATAGCC AGAACAACAT TATTTCCCCT 
GCTGGTGGAA CATTACCGCT CTCTATTCCT GATGATGCAG ACAGTATCGC GCGAATGAAT 
GTCTATCCAG TCAGCACGAC AGGTGTACCA CCAGAAACCG GGCGATTTGA AGCCACGGCA 
ACGGTGAGAA TAAATTTTGA TTAA

Protein sequence

MSLLRLFFAA VLMLWCAQTA AYSGQCHTTQ GNPYIGVNFG VKTLEEEANT AGVVKDKFYQ 
WNESNDYYVS CDCDKDNVRS GRWAFAADSP LVYLGDNWYK INDYLAAKVL LQVKGSSPTA 
VPFENVGTGG DTRWHICDPG GQRLGGQGAS GNSGSFSLKI LQPFVGSVVI PPMALARLYE 
CYNIPAGDSC TTTGSPVLVY YLSGTINSLG SCSVNAGETI EVDLGDVFAA NFRVVGHKPL 
GARTAELAIP VRCNTGNAGL VNVNLSLTAT TDPSYPQAIK TSRPGVGVVV TDSQNNIISP 
AGGTLPLSIP DDADSIARMN VYPVSTTGVP PETGRFEATA TVRINFD