Gene EcE24377A_2513 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2513
Symbol	apbE
ID	5588074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2496828
End bp	2497883
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	53%
IMG OID	640926171
Product	thiamine biosynthesis lipoprotein ApbE
Protein accession	YP_001463565
Protein GI	157156220
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00204686
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAATAA GCTTTACCCG CGTGGCACTG CTGGCTGCCG CGCTCTTCTT TGTTGGTTGC 
GATCAAAAAC CACAAACCGC CAAAACCCAC GCTACTGAAG TTACCGTTCT TGAAGGCAAA 
ACTATGGGTA CCTTCTGGCG TGCCAGCATC CCGGGCATTG ACGCCAAACG CAGTGCCGAA 
CTTAAAGAAA AGATTCAGAC CCAGCTGGAC GCCGACGATC AGCTGCTTTC GACCTATAAA 
AAAGATTCCG CGCTGATGCG CTTTAACGAT TCGCAAAGTT TATCGCCGTG GCCGGTAAGT 
GAAGCGATGG CCGATATCGT CACCACCTCG CTGCGCATTG GCGCAAGGAC CGATGGTGCG 
ATGGATATAA CCGTCGGGCC GCTGGTGAAT CTGTGGGGCT TTGGCCCGGA ACAACAGCCG 
GTTCAAATTC CGAGCCAGGA ACAGATCGAT GCGATGAAAG CCAAAACCGG CTTACAGCAC 
CTGACGGTCA TTAATCAGTC GCATCAGCAA TATCTGCAAA AAGACCTACC GGATTTATAT 
GTCGATCTCT CCACCGTCGG TGAAGGTTAT GCGGCGGATC ACCTGGCACG CTTGATGGAG 
CAGGAAGGGA TTTCCCGCTA TCTGGTGTCG GTGGGCGGCG CGCTGAACAG CCGTGGTATG 
AACGGTGAAG GCCTGCCGTG GCGGGTAGCG ATTCAAAAAC CAACCGATAA AGAAAACGCG 
GTTCAGGCTG TGGTGGATAT CAACGGTCAT GGTATTAGCA CCTCTGGCAG TTACCGTAAC 
TATTACGAAC TGGACGGCAA ACGTCTTTCT CATGTTATCG ATCCGCAAAC CGGGCGTCCC 
ATCGAACACA ATCTGGTATC CGTGACGGTG ATTGCTCCGA CGGCGCTGGA AGCCGATGCC 
TGGGATACTG GCTTGATGGT ACTCGGGCCG GAGAAAGCCA AAGAGGTTGT TCGCCGGGAA 
GGGCTGGCGG TTTATATGAT CACCAAAGAA GGCGATAGCT TTAAAACCTG GATGTCACCA 
CAGTTTAAAA GCTTCCTTGT CAGCGAAAAA AATTAA

Protein sequence

MEISFTRVAL LAAALFFVGC DQKPQTAKTH ATEVTVLEGK TMGTFWRASI PGIDAKRSAE 
LKEKIQTQLD ADDQLLSTYK KDSALMRFND SQSLSPWPVS EAMADIVTTS LRIGARTDGA 
MDITVGPLVN LWGFGPEQQP VQIPSQEQID AMKAKTGLQH LTVINQSHQQ YLQKDLPDLY 
VDLSTVGEGY AADHLARLME QEGISRYLVS VGGALNSRGM NGEGLPWRVA IQKPTDKENA 
VQAVVDINGH GISTSGSYRN YYELDGKRLS HVIDPQTGRP IEHNLVSVTV IAPTALEADA 
WDTGLMVLGP EKAKEVVRRE GLAVYMITKE GDSFKTWMSP QFKSFLVSEK N