Gene EcE24377A_3627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3627
Symbol
ID	5590358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3628522
End bp	3629613
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	48%
IMG OID	640927251
Product	putative fimbrial protein
Protein accession	YP_001464620
Protein GI	157156670
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3539] P pilus assembly protein, pilin FimA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAG CGCCTCTTAT AACAGGACTT TTGTTGATAT CCACATCCTG CGCTTATGCC 
TCCTCAGGAG GGTGTGGAGC TGACAGCACT AGCGGTGCGA CAAATTACAG CAGTGTGGTT 
GATGATGTTA CGGTGAACCA GACAGATAAC GTGACAGGAC GGGAGTTTAC CTCTGCCACG 
CTAAGTAGCA CTAACTGGCA ATACGCCTGT ACCTGCTCTG CGGGTAAGGC AGTTAAACTT 
GTCTATATGG TCAGCCCTGT ACTTACCACC ACTGGACATC AAGCAGGATA TTACAAACTC 
AATGATAGTC TGGATATTAA AACCACATTA CAGGCGAATG ACATTCCAGG ACTCGTGACT 
GACCAGACCG TTTCTGTTAA CACCCGATTC ACACAGATAA AAAGCAACAC CGTATATTCT 
GCTGCAACCC AAACGGGTGT TTGCCAGGGT GACACGTCTC GTTATGGACC CGTTAATATT 
GGTGCAAATA CCACCTTTAC CCTGTATGTC ACCAAGCCAT TTCTCGGCTC GATGACCATT 
CCGAAAACGG ATATTGCCGT CATTAAAGGC GCATGGGTCG ATGGAATGGG AAGCCCGTCT 
ACAGGTGACT TCCATGATTT AGTCAAGTTA TCGATTCAGG GAAATCTCAC CGCCCCACAG 
TCGTGCAAAA TTAATCAGGG CGATGTTATT AAGGTTAATT TTGGATTCAT CAATGGTCAG 
AAGTTTACCA CCCGCAATGC CATGCCAGAC GGTTTTACTC CAGTAGACTT TAATATCACT 
TATGACTGTG GTGATACTTC AAAGATTAAA AACTCGTTGC AAATGCGCAT CGACGGTACA 
ACTGGGGTAG TAGACCAGTA CAACCTGGTC GCCAGACGAA GAAGTTCAGA CAATGCGCCC 
GATGTCGGTA TTCGTATTGA AAATCTCGGC GGCGGAGTTG CAAATATTCC TTTTCAGAAC 
GGTATCCTTC CCGTTGATCC TTCCGGGCAT GGCACCATCA ACATGCGCGC CTGGCCAGTT 
AATCTGGTCG GTGGTGAGCT GGAAACAGGA AAATTTCAGG GCACCGCCAC CATTACCGTC 
ATCGTGCGGT AA

Protein sequence

MKRAPLITGL LLISTSCAYA SSGGCGADST SGATNYSSVV DDVTVNQTDN VTGREFTSAT 
LSSTNWQYAC TCSAGKAVKL VYMVSPVLTT TGHQAGYYKL NDSLDIKTTL QANDIPGLVT 
DQTVSVNTRF TQIKSNTVYS AATQTGVCQG DTSRYGPVNI GANTTFTLYV TKPFLGSMTI 
PKTDIAVIKG AWVDGMGSPS TGDFHDLVKL SIQGNLTAPQ SCKINQGDVI KVNFGFINGQ 
KFTTRNAMPD GFTPVDFNIT YDCGDTSKIK NSLQMRIDGT TGVVDQYNLV ARRRSSDNAP 
DVGIRIENLG GGVANIPFQN GILPVDPSGH GTINMRAWPV NLVGGELETG KFQGTATITV 
IVR