Gene EcHS_A1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1744
Symbol
ID	5591253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1766895
End bp	1768151
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	52%
IMG OID	640920892
Product	hypothetical protein
Protein accession	YP_001458448
Protein GI	157161130
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3468] Type V secretory pathway, adhesin AidA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0000000153793
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATCTG ATGCGAAAAA CTTGATGAGC GACGGGAATG TGCAAATTGT TAAGACCGGC 
GAGGTCATTG GCGCGACGCA ACTTACTGAA GGCGAGTTGA TTGTTGAAGC TGGCGGAAGA 
GCCGAAAATA CCGTGGTCAC GGGGGCTGGC TGGTTGAAAG TGGCAACCGG TGGGATCGCC 
AAATGCACAC AGTACGGTAA CAATGGCACG CTATCGGTCA GCGACGGTGC CATTGCCACA 
GATATTGTTC AGTCCGAGGG AGGCGCAATT AGTCTCTCTA CGCTCGCTAC GGTTAATGGC 
CGCCATCCCG AAGGTGAATT CAGCGTTGAT AAAGGTTATG CCTGCGGTTT GTTGCTGGAA 
AATGGCGGTA ACCTGCGTGT ACTGGAAGGC CATCGCGCGG AAAAAATCAT TCTCGATCAA 
GAGGGCGGCC TGTTGGTTAA TGGGACAACC TCAGCGGTCG TGGTAGATGA AGGTGGTGAA 
TTGTTGGTGT ATCCAGGTGG GGAAGCCAGC AATTGTGAGA TTAATCAGGG CGGCGTTTTT 
ATGCTGGCCG GGAAAGCCAG TGATACGTTG CTTGCTGGTG GCACCATGAA TAATCTCGGT 
GGTGAAGACT CTGACACTAT TGTTGAGAAT GGATCCATTT ATCGTCTGGG GACGGATGGC 
CTTCAGCTCT ACAGTTCCGG TAAGACGCAA AACCTGTCCG TGAATGTGGG TGGTCGGGCT 
GAAGTGCATG CCGGTACGCT GGAAAATGCG GTAATACAAG GTGGAACAGT GATCCTGTTG 
TCACCCACCA GCGCGGACGA AAATTTTGTC GTAGAGGAAG ATCGCGCACC GGTTGAACTG 
ACCGGGAGTG TTGCATTACT GGACGGCGCT TCAATGATTA TTGGTTATGG CGCAGAGCTG 
CAACAATCAA CGATTACTGT ACAGCAGGGC GGTGTGTTGA TTCTCGACGG CAGTACGGTA 
AAAGGTGACA GTGTCACTTT CAGTGTTGGT AACATCAATC TGAATGGCGG AAAACTGTGG 
CTGATCACTG GTGCGGCAAC GCATGTGCAA CTGAAAGTGA AACGCCTGCG CGGAGAGGGA 
GCGATTTGCC TGCAAACCAG TGCGAAAGAA ATTTCACCTG ACTTCATCAA TGTGAAAGGG 
GAAGTTACCG GTGATATACA CGTTGAGATA ACAGATGCCA GTCGGCAAAC TCTGTGTAAC 
GCACTGAAAC TACAGCCAGA CGAAGACGGG ATTGGCGCAA CGCTCCAGCC TGCGTAA

Protein sequence

MGSDAKNLMS DGNVQIVKTG EVIGATQLTE GELIVEAGGR AENTVVTGAG WLKVATGGIA 
KCTQYGNNGT LSVSDGAIAT DIVQSEGGAI SLSTLATVNG RHPEGEFSVD KGYACGLLLE 
NGGNLRVLEG HRAEKIILDQ EGGLLVNGTT SAVVVDEGGE LLVYPGGEAS NCEINQGGVF 
MLAGKASDTL LAGGTMNNLG GEDSDTIVEN GSIYRLGTDG LQLYSSGKTQ NLSVNVGGRA 
EVHAGTLENA VIQGGTVILL SPTSADENFV VEEDRAPVEL TGSVALLDGA SMIIGYGAEL 
QQSTITVQQG GVLILDGSTV KGDSVTFSVG NINLNGGKLW LITGAATHVQ LKVKRLRGEG 
AICLQTSAKE ISPDFINVKG EVTGDIHVEI TDASRQTLCN ALKLQPDEDG IGATLQPA