Gene EcolC_0387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0387
Symbol
ID	6066774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	435110
End bp	436591
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	52%
IMG OID	641599786
Product	general secretory pathway protein E
Protein accession	YP_001723392
Protein GI	170018438
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02533] general secretory pathway protein E

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0402565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATTC ACTCACCGTA CCCCGCCAGT TGGGCGCTGG CACAACGAAT TGGTTATCTC 
TATTCAGAGG GCGAGATTAT TTATCTCGCC GATACGCCAT TCGAGCGGTT ACTCGATATT 
CAACGTCAGG TTGGCCAGTG CCAGACCATG ACCAGCTTGT CACAGGCTGA TTTTGAAGCT 
CGGCTGGAAG CGGTATTCCA TCAGAATACC GGTGAGTCGC AACAGATTGC GCAGGATATC 
GATCAATCCG TCGATCTTCT CTCGCTTTCG GAAGAGATGC CCGCAAATGA AGATCTCCTG 
AATGAAGATT CAGCGGCACC GGTTATCCGC TTGATCAATG CGATTTTGAG TGAGGCCATC 
AAAGAAACCG CCTCTGATAT CCACATTGAA ACCTATGAAA AAACAATGTC GATCCGTTTT 
CGCATCGACG GCGTTTTGCG GACAATTTTA CAGCCAAACA AAAAACTGGC GGCACTGCTT 
ATCTCCCGAA TTAAGGTCAT GGCTCGTCTT GATATCGCCG AAAAACGTAT TCCACAGGAT 
GGAAGAATTA GTTTGCGTAT CGGGCGACGT AACATAGATG TCCGCGTATC CACACTGCCG 
TCCATCTATG GTGAACGCGC CGTACTCCGC CTGCTGGATA AAAACAGCCT CCAGCTTTCA 
TTGAACAACC TGGGGATGAC GGCAGCGGAT AAGCAGGATT TAGAAAATCT CATTCAGCTT 
CCGCACGGTA TTATCCTGGT GACAGGGCCG ACAGGCTCCG GTAAAAGCAC CACGCTCTAC 
GCCATCCTTT CGGCGCTGAA TACTCCCGGC CGCAATATTC TGACGGTAGA AGATCCCGTG 
GAATATGAGC TGGAAGGCAT TGGGCAAACG CAGGTGAATA CCCGTGTGGA TATGTCTTTC 
GCTCGCGGCC TGCGCGCCAT ACTTCGCCAG GACCCGGATG TCGTCATGGT GGGGGAAATT 
CGTGATACAG AAACCGCGCA GATTGCGGTT CAGGCCTCGC TCACCGGCCA TCTGGTACTC 
TCAACACTCC ACACTAACAG TGCATCAGGC GCAGTGACCC GGCTCCGCGA CATGGGCGTC 
GAATCATTCC TGCTTTCGTC TTCCCTGGCA GGGATTATCG CGCAACGTCT GGTTCGTCGC 
CTGTGTCCGC AATGCCGACA ATTCACGCCC GTATCACCCC AACAAGCGCA GATGTTTAAA 
TATCATCAGC TCGCGGTGAC AACAATTGGC ACTCCCGTAG GCTGCCCTCA TTGCCATCAA 
TCCGGCTATC AGGGGCGCAT GGCGATCCAC GAAATGATGG TGGTGACGCC GGAATTACGG 
GCCGCTATTC ATGAAAATGT GGATGAACAA GCACTGGAGC GACTAGTCCG GCAACAACAC 
AAGGCCTTAA TCAAAAATGG CCTGCAAAAA GTGATAAGCG GTGACACCTC CTGGGATGAG 
GTTATGCGCG TCGCCAGTGC CACGCTGGAG AGCGAAGCAT GA

Protein sequence

MRIHSPYPAS WALAQRIGYL YSEGEIIYLA DTPFERLLDI QRQVGQCQTM TSLSQADFEA 
RLEAVFHQNT GESQQIAQDI DQSVDLLSLS EEMPANEDLL NEDSAAPVIR LINAILSEAI 
KETASDIHIE TYEKTMSIRF RIDGVLRTIL QPNKKLAALL ISRIKVMARL DIAEKRIPQD 
GRISLRIGRR NIDVRVSTLP SIYGERAVLR LLDKNSLQLS LNNLGMTAAD KQDLENLIQL 
PHGIILVTGP TGSGKSTTLY AILSALNTPG RNILTVEDPV EYELEGIGQT QVNTRVDMSF 
ARGLRAILRQ DPDVVMVGEI RDTETAQIAV QASLTGHLVL STLHTNSASG AVTRLRDMGV 
ESFLLSSSLA GIIAQRLVRR LCPQCRQFTP VSPQQAQMFK YHQLAVTTIG TPVGCPHCHQ 
SGYQGRMAIH EMMVVTPELR AAIHENVDEQ ALERLVRQQH KALIKNGLQK VISGDTSWDE 
VMRVASATLE SEA