Gene EcHS_A0728 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0728
Symbol
ID	5593046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	738688
End bp	740094
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID	640919905
Product	OprD family outer membrane porin
Protein accession	YP_001457479
Protein GI	157160161
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.00197385
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTACGT TTAGTGGCAA ACGTAGTACG CTGGCGCTGG CTATCGCCGG TGTTACAGCA 
ATGTCGGGCT TTATGGCAAT GCCGGAGGCT CGCGCCGAAG GATTCATCGA CGATTCAACC 
TTAACCGGCG GTATATATTA CTGGCAGCGT GAACGCGACC GTAAAGATGT TACCGACGGC 
GACAAATACA AAACCAACCT TTCTCACTCC ACCTGGAATG CCAACCTCGA TTTTCAGTCT 
GGTTATGCTG CTGATATGTT CGGCCTTGAT ATTGCCGCGT TTACGGCGAT TGAAATGGCG 
GAAAACGGCG ACAGCTCTCA CCCGAACGAA ATCGCGTTTT CAAAAAGTAA TAAAGCCTAT 
GACGAAGACT GGTCCGGCGA CAAAAGCGGT ATAAGCCTGT ATAAAGCAGC GGCCAAATTT 
AAATACGGTC CGGTTTGGGC GAGGGCAGGT TATATTCAGC CAACCGGTCA GACGCTGTTA 
GCGCCTCACT GGAGCTTTAT GCCGGGTACT TATCAGGGTG CGGAAGCCGG AGCGAATTTT 
GATTACGGCG ATGCCGGTGC GTTGAGTTTC TCCTACATGT GGACCAACGA ATACAAAGCG 
CCGTGGCATC TGGAAATGGA TGAGTTTTAT CAGAACGATA AAACCACCAA AGTTGATTAT 
CTGCACTCCC TTGGGGCGAA ATACGACTTC AAAAATAACT TCGTACTGGA AGCGGCTTTT 
GGTCAGGCGG AAGGGTATAT CGATCAATAT TTTGCCAAAG CCAGCTACAA ATTTGATATC 
GCCGGTAGCC CGTTAACCAC CAGCTACCAG TTCTACGGTA CCCGCGATAA AGTTGACGAT 
CGCAGCGTCA ACGACCTTTA TGACGGCACC GCCTGGCTGC AGGCGTTGAC CTTTGGTTAC 
CGGGCGGCTG ACGTAGTGGA TTTGCGCCTC GAAGGCACCT GGGTTAAGGC TGACGGTCAG 
CAGGGATACT TCCTGCAACG TATGACTCCA ACCTACGCTT CCTCAAACGG TCGCCTGGAT 
ATCTGGTGGG ACAACCGTTC TGACTTCAAC GCCAACGGCG AAAAAGCAGT CTTCTTCGGT 
GCGATGTATG ACCTGAAAAA CTGGAATCTT CCAGGCTTCG CCATCGGCGC TTCCTACGTT 
TACGCATGGG ATGCTAAACC TGCGACCTGG CAGAGCAATC CGGATGCGTA CTACGACAAA 
AACCGGACTA TTGAAGAGTC TGCATACAGC CTGGATGCGG TCTATACCAT TCAGGACGGT 
CGCGCCAAAG GCACGATGTT CAAACTGCAC TTCACCGAAT ACGACAACCA CTCCGACATC 
CCAAGCTGGG GCGGTGGTTA CGGCAACATC TTCCAGGATG AGCGTGACGT AAAATTTATG 
GTAATCGCAC CATTCACCAT CTTCTGA

Protein sequence

MRTFSGKRST LALAIAGVTA MSGFMAMPEA RAEGFIDDST LTGGIYYWQR ERDRKDVTDG 
DKYKTNLSHS TWNANLDFQS GYAADMFGLD IAAFTAIEMA ENGDSSHPNE IAFSKSNKAY 
DEDWSGDKSG ISLYKAAAKF KYGPVWARAG YIQPTGQTLL APHWSFMPGT YQGAEAGANF 
DYGDAGALSF SYMWTNEYKA PWHLEMDEFY QNDKTTKVDY LHSLGAKYDF KNNFVLEAAF 
GQAEGYIDQY FAKASYKFDI AGSPLTTSYQ FYGTRDKVDD RSVNDLYDGT AWLQALTFGY 
RAADVVDLRL EGTWVKADGQ QGYFLQRMTP TYASSNGRLD IWWDNRSDFN ANGEKAVFFG 
AMYDLKNWNL PGFAIGASYV YAWDAKPATW QSNPDAYYDK NRTIEESAYS LDAVYTIQDG 
RAKGTMFKLH FTEYDNHSDI PSWGGGYGNI FQDERDVKFM VIAPFTIF