Gene EcHS_A3337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3337
Symbol
ID	5594850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3342267
End bp	3343358
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	48%
IMG OID	640922455
Product	putative fimbrial protein
Protein accession	YP_001459948
Protein GI	157162630
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3539] P pilus assembly protein, pilin FimA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	0.269442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAG CGCCTCTTAT AACAGGACTT TTGTTGATAT CCACATCCTG CGCTTATGCC 
TCCTCAGGAG GGTGTGGAGC CGATAGCACT AGCGGTGCGA CAAATTACAG CAGTGTGGTT 
GATGATGTTA CGGTGAACCA GACAGATAAC GTGACAGGAC GGGAGTTTAC CTCTGCAACG 
CTAAGTAGCA CTAACTGGCA ATACGCCTGT TCCTGCTCTG CGGGTAAGGC AGTTAAACTT 
GTCTATATGG TCAGCCCCGT ACTTACCACC ACTGGACATC AGACAGGATA TTACAAACTC 
AATGACAGCC TGGATATTAA AACCACATTA CAGGCAAACG ACATTCCAGG ACTCACAACC 
GACCAGGTTG TCTCTGTTAA CACCCGATTC ACACAGATAA AAAACAACAC GGTATATTCT 
GCTGCAACCC AAACGGGTGT TTGCCAGGGT GATACGTCTC GTTATGGACC CGTTAATATT 
GGTGCGAACA CCACCTTTAC CCTGTATGTC ACCAAGCCAT TTCTCGGCTC GATGACCATT 
CCGAAAACGG ATATTGCCGT CATTAAAGGC GCGTGGGTCG ATGGAATGGG AAGCCCGTCT 
ACAGGTGACT TCCATGATTT AGTCAAGTTA TCGATTCAGG GAAATCTCAC CGCCCCACAG 
TCGTGCAAAA TTAATCAGGG CGATGTTATT AAGGTTAATT TTGGATTCAT CAATGGTCAG 
AAGTTTACCA CCCGCAATGC CATGCCAGAC GGTTTTACTC CAGTAGACTT TGATATCACT 
TATGACTGTG GTGATACTTC AAAGATTAAA AACTCGTTGC AAATGCGCAT CGACGGTACA 
ACTGGGGTAG TAGACCAGTA CAACCTGGTC GCCAGGCGAA GAAGTTCAGA CAATGTGCCC 
GATGTCGGTA TTCGTATTGA AAATCTCGGC GGCGGAGTTG CAAATATTCC TTTTCAGAAC 
GGTATCCTTC CCGTTGATCC TTCCGGGCAT GGCACCGTCA ATATGCGCGC CTGGCCAGTT 
AATCTGGTCG GTGGTGAGCT GGAAACAGGA AAATTTCAGG GCACAGCCAC CATTACCGTC 
ATCGTGCGGT AA

Protein sequence

MKRAPLITGL LLISTSCAYA SSGGCGADST SGATNYSSVV DDVTVNQTDN VTGREFTSAT 
LSSTNWQYAC SCSAGKAVKL VYMVSPVLTT TGHQTGYYKL NDSLDIKTTL QANDIPGLTT 
DQVVSVNTRF TQIKNNTVYS AATQTGVCQG DTSRYGPVNI GANTTFTLYV TKPFLGSMTI 
PKTDIAVIKG AWVDGMGSPS TGDFHDLVKL SIQGNLTAPQ SCKINQGDVI KVNFGFINGQ 
KFTTRNAMPD GFTPVDFDIT YDCGDTSKIK NSLQMRIDGT TGVVDQYNLV ARRRSSDNVP 
DVGIRIENLG GGVANIPFQN GILPVDPSGH GTVNMRAWPV NLVGGELETG KFQGTATITV 
IVR