Gene EcE24377A_2409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2409
Symbol
ID	5590273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	2390346
End bp	2391482
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	54%
IMG OID	640926071
Product	von Willebrand factor type A domain-containing protein
Protein accession	YP_001463466
Protein GI	157156675
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAC TGAACGATCT TCTGACCACC CGTGAGCTAC AACGCTGGCG ATTAATTCTT 
GGCGAAGCGG CAGAAACGAC GCTTTGTGGG CTGGATGACA ACGCCCGGCA GATAGATCAC 
GCGCTGGAGT GGCTGTATGG GCGCGATCCT GAACGGCTCC AGCGTGGTGA ACGCTCTGGT 
GGATTAGGTG GCTCAAATCT CACCACTCCT GAGTGGATCA ACAGTATCCA CACGCTGTTT 
CCGCAACAGG TGATTGAGCG GCTGGAAAGC GATGCCGTAC TGCGCTACGG CATTGAAGAT 
GTGGTGACAA ATCTCGACGT GCTGGAACGT ATGCAGCCTT CGGAAAGCCT GCTACGCGCC 
GTTTTGCACA CCAAACATCT GATGAATCCC GAAGTACTGG CTGCCGCCCG CCAGATAGTG 
CGCCAGGTTG TTGAAGAAAT TATGGCGCGA CTGGCAAAGG AAGTTCGTCA GGCTTTTTCT 
GGTGTCCGCG ATCGCCGTCG CCGTTCATTT ATTCCACTGG CGCGAAACTT TGATTTCAAA 
AGTACTCTGC GCGCCAACCT GCAACACTGG CACCCGCAAC ACGGCAAGTT GTATATCGAA 
TCCCCCCGCT TTAACAGCCG CATTAAACGC CAAAGCGAAC AATGGCAACT GGTCTTACTG 
GTTGATCAAA GCGGATCGAT GGTCGATTCG GTGATCCACT CTGCGGTGAT GGCGGCCTGT 
TTGTGGCAGT TACCCGGCAT TCGTACCCAT CTGGTGGCGT TTGACACAAG CGTCGATGAT 
CTCACGGCAG ACGTTGCCGA TCCGGTAGAG TTATTAATGA AAGTACAGTT GGGCGGCGGG 
ACCAATATCG CCAGTGCCGT GGAGTATGGT CGGCAACTTA TTGAACAACC AGCGAAAAGC 
GTCATTATCC TCGTGAGCGA TTTTTACGAA GGGGGTTCAT CATCATTACT GACGCATCAG 
GTGAAAAAGT GTGTCCAGAG CTGCATCAAA GTGCTGGGAC TGGCAGCGCT CGATAGCACA 
GCAACACCTT GCTATGACCA CGATACGGCC CAGGCGCTGG TAAATGTCGG CGCACAAATA 
GCCGCCATGA CACCGGGCGA GCTGGCATCA TGGCTTGCGG AGAATCTTCA GTCATGA

Protein sequence

MSELNDLLTT RELQRWRLIL GEAAETTLCG LDDNARQIDH ALEWLYGRDP ERLQRGERSG 
GLGGSNLTTP EWINSIHTLF PQQVIERLES DAVLRYGIED VVTNLDVLER MQPSESLLRA 
VLHTKHLMNP EVLAAARQIV RQVVEEIMAR LAKEVRQAFS GVRDRRRRSF IPLARNFDFK 
STLRANLQHW HPQHGKLYIE SPRFNSRIKR QSEQWQLVLL VDQSGSMVDS VIHSAVMAAC 
LWQLPGIRTH LVAFDTSVDD LTADVADPVE LLMKVQLGGG TNIASAVEYG RQLIEQPAKS 
VIILVSDFYE GGSSSLLTHQ VKKCVQSCIK VLGLAALDST ATPCYDHDTA QALVNVGAQI 
AAMTPGELAS WLAENLQS