Gene Ent638_2794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2794
Symbol
ID	5112746
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3021060
End bp	3022115
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	53%
IMG OID	640492982
Product	thiamine biosynthesis lipoprotein ApbE
Protein accession	YP_001177510
Protein GI	146312436
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.279837
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.884521
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATGA CTTTTTGGCG AGCCGGCATT TTGTCGGTAT TTTTCTTACT TTCGGCATGC 
GATTCTTTAT CCCCTACCAC GACAGAAAAT GCGCCAGCGG CAACCGTGCT GGAAGGCAAA 
ACCATGGGAA CGTCCTGGCG CGTGAGCGTC ATGAATATAG ATAAAAATCG CGTGGATGAA 
CTTCGCGGTA AAATCCAGTC CCAGCTTGAT GCTGACGATC AGCTGCTTTC TACCTATAAA 
AATGATTCTG CGCTAATGCG GTTCAACCTG TCGAACAGCA CATCGCTTTG GCCTGTGAGT 
GAGGCACTGG CCGATATCGT TACCGAGTCC CTGCATGTCG GCTATAAAAC TAACGGCGCA 
ATGGATATCA CCGTCGGGCC ACTGGTGAAT TTATGGGGCT TTGGACCAAC AAAACAGCCG 
GAGACGGTAC CGAGTCAGGA TCAGATTGAC GATGCGCGCG CGCGCACTGG ACTGCAACAT 
CTGAGCGTAT TGAATCAGTA TGGGCAGCAG TACTTGCAAA AAGACATTCC CGATCTGTTT 
GTCGACCTCT CCACTGTTGG CGAGGGGTAC GCGGCGGATC ATCTTGCCGC GCTGATGGCT 
CAGGAGGGGA TCTCTCGTTA TCTGGTTTCC GTCGGGGGCG CACTCGTGAG CCGCGGTCTC 
AATGCCAGCG ATCAATCCTG GCGTGTCGCT ATCCAAAAGC CAACAGATCA ACAAAATGCG 
GTGCAGGCCA TTGTGGATAT CAACGGTCAT GGCATCAGCA CATCTGGCAG CTATCGCAAC 
TATTACGAGC TGAACGGCAA GCGTCTTTCG CACGTGATCG ACCCCAGGAC GGGGCGCCCG 
ATCGCACACA ATCTGGTTTC CGTGACGGTG ATTGCCCCGA CGGCACTGGA GGCTGATGCC 
TGGGATACCG GACTGATGGT CCTCGGGCCG GAAAAGGCCA AAGAAGTGGT GCGTCAGGAA 
GGGTTGGCGG TCTACATGAT TACCAAAGAG GGGGAGAGTT TTAAAACCTG GATGTCGCCG 
CAGTTTCACG CTTTTCTGAT CGACGAACAA CATTAA

Protein sequence

MEMTFWRAGI LSVFFLLSAC DSLSPTTTEN APAATVLEGK TMGTSWRVSV MNIDKNRVDE 
LRGKIQSQLD ADDQLLSTYK NDSALMRFNL SNSTSLWPVS EALADIVTES LHVGYKTNGA 
MDITVGPLVN LWGFGPTKQP ETVPSQDQID DARARTGLQH LSVLNQYGQQ YLQKDIPDLF 
VDLSTVGEGY AADHLAALMA QEGISRYLVS VGGALVSRGL NASDQSWRVA IQKPTDQQNA 
VQAIVDINGH GISTSGSYRN YYELNGKRLS HVIDPRTGRP IAHNLVSVTV IAPTALEADA 
WDTGLMVLGP EKAKEVVRQE GLAVYMITKE GESFKTWMSP QFHAFLIDEQ H