Gene EcolC_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1965
Symbol
ID	6068271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2170564
End bp	2171820
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	52%
IMG OID	641601379
Product	hypothetical protein
Protein accession	YP_001724938
Protein GI	170019984
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3468] Type V secretory pathway, adhesin AidA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.646442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000264601
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGATCTG ATGCGAAAAA CTTGATGAGC GACGGGAATG TGCAAATTGT TAAGACCGGC 
GAGGTCATTG GCGCGACGCA ACTTACTGAA GGCGAGTTGA TTGTTGAAGC TGGCGGAAGA 
GCCGAAAATA CCGTGGTCAC GGGGGCTGGC TGGTTGAAAG TGGCAACCGG TGGGATCGCC 
AAATGCACAC AGTACGGTAA CAATGGCACG CTATCGGTCA GCGACGGTGC CATTGCCACA 
GATATTGTTC AGTCCGAGGG AGGCGCAATT AGTCTCTCTA CGCTCGCTAC GGTTAATGGC 
CGCCATCCCG AAGGTGAATT CAGCGTTGAT AAAGGTTATG CCTGCGGTTT GTTGCTGGAA 
AATGGCGGTA ACCTGCGTGT ACTGGAAGGC CATCGCGCGG AAAAAATCAT TCTCGATCAA 
GAGGGCGGCC TGTTGGTTAA TGGGACAACC TCAGCGGTCG TGGTAGATGA AGGTGGTGAA 
TTGTTGGTGT ATCCAGGTGG GGAAGCCAGC AATTGTGAGA TTAATCAGGG CGGCGTTTTT 
ATGCTGGCCG GGAAAGCCAG TGATACGTTG CTTGCTGGTG GCACCATGAA TAATCTCGGT 
GGTGAAGACT CTGACACTAT TGTTGAGAAT GGATCCATTT ATCGTCTGGG GACGGATGGC 
CTTCAGCTCT ACAGTTCCGG TAAGACGCAA AACCTGTCCG TGAATGTGGG TGGTCGGGCT 
GAAGTGCATG CCGGTACGCT GGAAAATGCG GTAATACAAG GTGGAACAGT GATCCTGTTG 
TCACCCACCA GCGCGGACGA AAATTTTGTC GTAGAGGAAG ATCGCGCACC GGTTGAACTG 
ACCGGGAGTG TTGCATTACT GGACGGCGCT TCAATGATTA TTGGTTATGG CGCAGAGCTG 
CAACAATCAA CGATTACTGT ACAGCAGGGC GGTGTGTTGA TTCTCGACGG CAGTACGGTA 
AAAGGTGACA GTGTCACTTT CAGTGTTGGT AACATCAATC TGAATGGCGG AAAACTGTGG 
CTGATCACTG GTGCGGCAAC GCATGTGCAA CTGAAAGTGA AACGCCTGCG CGGAGAGGGA 
GCGATTTGCC TGCAAACCAG TGCGAAAGAA ATTTCACCTG ACTTCATCAA TGTGAAAGGG 
GAAGTTACCG GTGATATACA CGTTGAGATA ACAGATGCCA GTCGGCAAAC TCTGTGTAAC 
GCACTGAAAC TACAGCCAGA CGAAGACGGG ATTGGCGCAA CGCTCCAGCC TGCGTAA

Protein sequence

MGSDAKNLMS DGNVQIVKTG EVIGATQLTE GELIVEAGGR AENTVVTGAG WLKVATGGIA 
KCTQYGNNGT LSVSDGAIAT DIVQSEGGAI SLSTLATVNG RHPEGEFSVD KGYACGLLLE 
NGGNLRVLEG HRAEKIILDQ EGGLLVNGTT SAVVVDEGGE LLVYPGGEAS NCEINQGGVF 
MLAGKASDTL LAGGTMNNLG GEDSDTIVEN GSIYRLGTDG LQLYSSGKTQ NLSVNVGGRA 
EVHAGTLENA VIQGGTVILL SPTSADENFV VEEDRAPVEL TGSVALLDGA SMIIGYGAEL 
QQSTITVQQG GVLILDGSTV KGDSVTFSVG NINLNGGKLW LITGAATHVQ LKVKRLRGEG 
AICLQTSAKE ISPDFINVKG EVTGDIHVEI TDASRQTLCN ALKLQPDEDG IGATLQPA