Gene SeD_A2005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2005
Symbol
ID	6874663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1937087
End bp	1938067
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	60%
IMG OID	642785120
Product	vtamin B12-transporter permease
Protein accession	YP_002215786
Protein GI	198244726
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4139] ABC-type cobalamin transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.509358
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACTT TTGCCCGCCA ACAACAGCGA CGAAACGTTC GCTGGCTTCT GAGCCTGTCA 
CTGCTGGTGC TACTGGCTAC ACTTCTGAGC TTATGCGCAG GCGAACAGTG GATTGCCCCC 
GGTGACTGGT TAAGCGCCCG GGGGGAACTG TTTGTCTGGC AAATTCGCCT TCCCCGCACG 
CTTGCGGTAT TGCTGGTTGG CGCTGCGCTG GCGCTATCTG GCGCCGTGAT GCAGGCGCTG 
TTTGAAAACC CACTTGCTGA ACCGGGTCTG CTCGGCGTTT CGAATGGGGC CGGTGTTGGG 
CTTATTGCCG CCGTCTTACT GGGGCAGGGG CAACTGCCAG GATGGGCGCT GGGACTGTGC 
GCTATAGCCG GCGCGCTCAT TATTACGTTA ATCCTGCTGC GTTTTGCGCG TCGCCATCTT 
TCTACCAGCC GCTTGTTGTT GGCGGGCGTC GCGCTGGGCA TTATCTGTAG CGCGCTGATG 
ACGTGGGCTA TCTATTTTTC CACCTCTTTC GATCTGCGGC AATTAATGTA CTGGATGATG 
GGAGGATTTG GCGGCGTTGA CTGGCAGCAG AGCTGGCTAA TGATTGCGCT CATCCCGGTA 
CTGATCTGGA TATGTTGCCA GTCGCAACCG CTGAATATGC TGGCGCTAGG GGAAACCTCG 
GCGCGGCAGC TTGGCCTGCC GCTGTGGTTC TGGCGCAATT TGTTGGTCGT CGCCACTGGC 
TGGATGGTGG GCGTCAGCGT GGCGATGGCG GGGGCGATTG GTTTTATCGG TCTGGTTATT 
CCGCACATCC TGCGCTTATG TGGTTTAACC GATCACCGGG TTTTACTTCC CGGCTGCGCG 
CTGGCCGGGG CTATCGCCCT GCTATTGGCT GATGTGGTCG CCCGGCTGGC GCTGGCGTCG 
GCTGAACTGC CTATCGGGGT GGTCACCGCC ACATTGGGGG CGCCAGTGTT TATCTGGCTG 
CTGCTCAAAT CCGCGCGTTA G

Protein sequence

MLTFARQQQR RNVRWLLSLS LLVLLATLLS LCAGEQWIAP GDWLSARGEL FVWQIRLPRT 
LAVLLVGAAL ALSGAVMQAL FENPLAEPGL LGVSNGAGVG LIAAVLLGQG QLPGWALGLC 
AIAGALIITL ILLRFARRHL STSRLLLAGV ALGIICSALM TWAIYFSTSF DLRQLMYWMM 
GGFGGVDWQQ SWLMIALIPV LIWICCQSQP LNMLALGETS ARQLGLPLWF WRNLLVVATG 
WMVGVSVAMA GAIGFIGLVI PHILRLCGLT DHRVLLPGCA LAGAIALLLA DVVARLALAS 
AELPIGVVTA TLGAPVFIWL LLKSAR