Gene ECD_01198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_01198
Symbol	ychP
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	1262073
End bp	1263326
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	51%
IMG OID
Product	predicted invasin
Protein accession	ACT43090
Protein GI	253977420
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACCTG AAAATCATGA TGGGGAAAAA CACTTTGCTG AAATTGTGAA AGATTTCGGC 
GAAACCAGTA TGAATGATAA CGGGCTGGAT ACTGGCGAGC AGGCAAAAGC TTTCGCATTG 
GGAAAAGTCC GCGACGCGCT TAGTCAACAG GTTAATCAGC ACGTAGAGTC CTGGCTATCA 
CCGTGGGGAA ATGCCAGTGT TGATGTCAAA GTGGATAACG AAGGTCATTT TACCGGCAGT 
CGTGGAAGCT GGTTTGTGCC GTTACAAGAT AATGATCGTT ATCTCACCTG GAGCCAGCTT 
GGTCTTACTC AGCAGGATGA TGGGTTGGTG AGCAATGTGG GCGTTGGGCA ACGCTGGGCG 
CGCGGCAACT GGCTGGTGGG TTATAACACT TTTTATGACA ACTTGCTGGA CGAAAATCTT 
CAGCGAGCGG GCTTTGGTGC CGAAGCGTGG GGCGAATATT TGCGACTATC GGCAAACTTT 
TATCAGCCAT TTGCTGCATG GCATGAACAG ACAGCCACGC AGGAACAACG GATGGCGCGC 
GGGTACGACC TGACAGCCCG GATGCGCATG CCGTTCTATC AACACCTCAA TACCAGTGTC 
AGCGTAGAAC AGTATTTTGG TGATCGTGTT GATTTGTTTA ACTCTGGTAC GGGTTATCAC 
AATCCCGTCG CGTTGAGTCT GGGATTAAAT TACACCCCTG TGCCATTAGT CACTGTGACG 
GCCCAGCATA AACAGGGTGA AAGTGGCGAG AATCAAAATA ACCTCGGGCT GAATCTTAAT 
TACCGCTTTG GTGTACCGCT CAAAAAACAA CTTTCTGCGG GCGAGGTTGC CGAAAGTCAG 
TCGTTACGTG GTAGTCGCTA TGATAATCCG CAGCGAAATA ATCTACCGAC TCTTGAGTAC 
CGACAGCGAA AAACGTTAAC GGTGTTTCTG GCGACACCGC CGTGGGATCT AAAACCTGGC 
GAAACAGTGC CGCTGAAATT ACAAATCCGC AGTCGTTACG GTATTCGGCA ACTGATTTGG 
CAGGGCGATA CGCAGATATT AAGTTTGACG CCAGGCGCAC AAGCCAACAG CGCGGAGGGC 
TGGACGCTGA TCATGCCTGA CTGGCAGAAC GGGGAAGGGG CGAGCAATCA CTGGCGATTG 
TCGGTGGTGG TGGAAGATAA CCAGGGGCAG CGTGTCTCCT CCAATGAGAT CACGCTAACG 
CTTGTCGAAC CGTTCGACGC ATTGTCAAAC GACGAACTGC GCTGGGAACC GTAA

Protein sequence

MAPENHDGEK HFAEIVKDFG ETSMNDNGLD TGEQAKAFAL GKVRDALSQQ VNQHVESWLS 
PWGNASVDVK VDNEGHFTGS RGSWFVPLQD NDRYLTWSQL GLTQQDDGLV SNVGVGQRWA 
RGNWLVGYNT FYDNLLDENL QRAGFGAEAW GEYLRLSANF YQPFAAWHEQ TATQEQRMAR 
GYDLTARMRM PFYQHLNTSV SVEQYFGDRV DLFNSGTGYH NPVALSLGLN YTPVPLVTVT 
AQHKQGESGE NQNNLGLNLN YRFGVPLKKQ LSAGEVAESQ SLRGSRYDNP QRNNLPTLEY 
RQRKTLTVFL ATPPWDLKPG ETVPLKLQIR SRYGIRQLIW QGDTQILSLT PGAQANSAEG 
WTLIMPDWQN GEGASNHWRL SVVVEDNQGQ RVSSNEITLT LVEPFDALSN DELRWEP