Gene EcolC_3552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3552
Symbol
ID	6067403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3882482
End bp	3883867
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	53%
IMG OID	641602969
Product	hypothetical protein
Protein accession	YP_001726493
Protein GI	170021539
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000180133
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATATTC CACAGCTCAC TGCCCTGTGT CTGCGTTATC ATGGAGTCTT GCTGGATGCC 
AGCGAAGAGG TGGTTCATGT TGCGGTAGTC GATGCACCTT CGCATGAGCT ACTGGACGCA 
TTGCATTTCG CTACCACCAA ACGTATTGAG ATCACCTGCT GGACGCGCCA ACAAATGGAA 
GGTCACGCCA GTCGCACACA ACAGACATTG CCCGTAGCTG TTCAGGAGAA GCATCAGCCC 
AAAGCAGAGT TGCTAACTCG AACGTTACAA TCTGCGCTGG AACAACGCGC GTCTGATATT 
CATATCGAAC CAGCGGACAA TGCCTACCGC ATCCGCTTGC GTATCGACGG CGTATTGCAT 
CCTTTACCGG ATGTTTCACC GGATGCCGGA GTCGCATTAA CCGCCAGATT AAAAGTGCTG 
GGAAACCTGG ATATTGCGGA ACATCGCCTG CCGCAGGACG GGCAATTCAC TGTCGAACTG 
GCAGGAAACG CCGTCTCATT TCGTATTGCG ACCTTACCAT GTCGGGGTGG TGAAAAGGTG 
GTATTAAGGT TGTTACAGCA GGTGGGTCAG GCACTGGATG TCAACACGCT TGGAATGCAG 
CCGTTACAAC TGGCGGACTT TGCTCATGCC TTGCAACAAC CACAGGGACT GGTGCTGGTA 
ACTGGCCCTA CCGGCAGCGG CAAAACGGTC ACGCTTTATA GTGCCCTGCA AAAGCTGAAT 
ACCGCTGACA TTAATATTTG TAGCGTCGAA GATCCAGTTG AGATCCCCAT AGCCGGACTA 
AACCAGACGC AAATCCATCC GCGTGCCGGA CTCACCTTTC AGGGCGTTTT GCGTGCGTTA 
TTGCGCCAGG ATCCTGACGT CATCATGATC GGAGAGATCC GCGATGGCGA AACAGCAGAG 
ATCGCTATTA AAGCGGCGCA AACTGGTCAC CTGGTGTTGT CTACCCTACA CACTAATTCC 
ACCTGCGAAA CGCTGGTACG TTTACAGCAA ATGGGGGTCG CCCGCTGGAT GCTATCATCG 
GCGCTTACGC TGGTAATAGC CCAGCGTCTG GTACGCAAAC TTTGCCCACA TTGTCGCCGG 
CAGCAAGGGG AGCCCATCCA CATTCCAGAC AATGTATGGC CATCGCCGCT GCCCCACTGG 
CAGGCACCCG GTTGTGTACA TTGCTACCAC GGTTTTTATG GTCGTACGGC CTTATTTGAA 
GTTCTGCCCA TAACGCCGGT CATTCGTCAG CTTATTTCCG CTAATACCGA CGTTGAATCG 
CTGGAAACGC ACGCACGACA GGCGGGTATG CGTACGCTTT TTGAAAACGG CTGCCTGGCC 
GTAGAGCAAG GCTTAACCAC CTTTGAAGAG TTAATCCGCG TACTGGGGAT GCCGCATGGC 
GAGTAA

Protein sequence

MNIPQLTALC LRYHGVLLDA SEEVVHVAVV DAPSHELLDA LHFATTKRIE ITCWTRQQME 
GHASRTQQTL PVAVQEKHQP KAELLTRTLQ SALEQRASDI HIEPADNAYR IRLRIDGVLH 
PLPDVSPDAG VALTARLKVL GNLDIAEHRL PQDGQFTVEL AGNAVSFRIA TLPCRGGEKV 
VLRLLQQVGQ ALDVNTLGMQ PLQLADFAHA LQQPQGLVLV TGPTGSGKTV TLYSALQKLN 
TADINICSVE DPVEIPIAGL NQTQIHPRAG LTFQGVLRAL LRQDPDVIMI GEIRDGETAE 
IAIKAAQTGH LVLSTLHTNS TCETLVRLQQ MGVARWMLSS ALTLVIAQRL VRKLCPHCRR 
QQGEPIHIPD NVWPSPLPHW QAPGCVHCYH GFYGRTALFE VLPITPVIRQ LISANTDVES 
LETHARQAGM RTLFENGCLA VEQGLTTFEE LIRVLGMPHG E