Gene SeD_A2609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2609
Symbol
ID	6873157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2485429
End bp	2486481
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	57%
IMG OID	642785679
Product	thiamine biosynthesis lipoprotein ApbE
Protein accession	YP_002216336
Protein GI	198242105
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.425275
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGA CTTTTTGCCG GGCCGTGTGT CTGGCGGCGG CTTTTCTACT TATGGGCTGC 
GATGAGGCTC CCGAAACGAC AACAGCGTCA CCTGCCGCTC AGGTGCTGGA AGGTAAAACG 
ATGGGGACCC TCTGGCGGGT GAGCGTGGTT GGTATCGATG CGAAACGCGC CGCAGAGTTA 
CAGACTAAAA TCCAGACTCA GCTTGATGCT GATGATTGGT TGCTTTCTAC CTATAAAAAT 
GACTCCGCGC TGATGCGTTT TAACCATTCA CGCAGCCTTG CGCCCTGGCC GGTCAGCGAA 
GCCATGGCGG ATATCGTGAC CTCGGCGCTA CGTATTGGCG CGAAGACGGA CGGCGCGATG 
GATATCACCG TGGGCCCGCT GGTCAATCTG TGGGGGTTTG GGCCGGATCG GCAGCCGATG 
CATATCCCAA CACCAGCACA AATCGATGCG GCAAAAGCGA AAACAGGCCT GCAACATTTG 
CAGGTTATCG ACAGGGCTGG ACATCAGTTT TTGCAAAAAG ATCTGCCGGA TCTTTATGTT 
GATCTCTCCA CGGTCGGGGA GGGCTATGCG GCGGATCATC TGGCGCGACT GATGGAGCAG 
GAGGGCATTG CGCGTTATCT GGTCTCGGTG GGGGGCGCAT TAAGCAGCCG CGGGATGAAT 
GCGCAGGGGC AGCCGTGGCG CGTCGCGATT CAGAAGCCGA CCGACCGGGA AAACGCGGTG 
CAGGCGATTG TGGATATCAA CGGGCATGGC ATCAGCACCT CCGGCAGCTA CCGTAACTAT 
TATGAGCTGG ATGGCAAGCG TATCTCGCAC GTTATCGATC CGCAAACGGG GCGCCCCATT 
GAACACAACC TGGTATCGGT TACGGTCATC GCGCCAACGG CGCTGGAAGC GGACGGCTGG 
GACACCGGCC TGATGGTGCT CGGTACGCAA AAGGCGCAAG AGGTCGTGCG GCGGGAAGGG 
CTGGCGGTCT TTATGATCAT GAAAGAAGGT GAAGGCTTTA AAACCTGGAT GTCGCCGCAG 
TTCAAAACGT TCATGGTGAG CGATAAGAAT TAA

Protein sequence

MKMTFCRAVC LAAAFLLMGC DEAPETTTAS PAAQVLEGKT MGTLWRVSVV GIDAKRAAEL 
QTKIQTQLDA DDWLLSTYKN DSALMRFNHS RSLAPWPVSE AMADIVTSAL RIGAKTDGAM 
DITVGPLVNL WGFGPDRQPM HIPTPAQIDA AKAKTGLQHL QVIDRAGHQF LQKDLPDLYV 
DLSTVGEGYA ADHLARLMEQ EGIARYLVSV GGALSSRGMN AQGQPWRVAI QKPTDRENAV 
QAIVDINGHG ISTSGSYRNY YELDGKRISH VIDPQTGRPI EHNLVSVTVI APTALEADGW 
DTGLMVLGTQ KAQEVVRREG LAVFMIMKEG EGFKTWMSPQ FKTFMVSDKN