Gene SeD_A2563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2563
Symbol
ID	6875019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2442035
End bp	2443021
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	56%
IMG OID	642785638
Product	cobalamin synthesis protein, P47K
Protein accession	YP_002216296
Protein GI	198242709
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00261863
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.00000585707
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGACCAAAA CCAATCTTAT TACTGGATTT CTCGGTAGCG GAAAAACCAC CTCTATCCTT 
CATTTATTAG CTCATAAAGA TCCGGCTGAA AAGTGGGCCG TCCTGGTTAA TGAATTTGGT 
GAAGTGGGTA TTGACGGCGC GCTGCTTGCC GACAGCGGCG CACTGCTAAA AGAGATCCCC 
GGCGGCTGCA TGTGCTGCGT CAATGGATTG CCTATGCAGG TGGGGCTCAA CACGCTGCTG 
CGCCAGGGCA AACCTGACCG GTTGCTGATT GAACCAACCG GACTGGGGCA CCCAAAACAG 
ATTCTGGATT TATTAACTGC GCCGGTTTAT GAGCCGTGGA TTGATTTACG CGCCACGCTC 
TGCATCCTGG ACCCTCGCCT GCTACTGGAC CAACAGAGCG TCGCCAATGA AAATTTCCGC 
GATCAGCTCG CCTCAGCCGA TATTATCATC GCCAATAAAA CCGACCGCGC CACGGCGCAG 
AGCGATGCCG CCCTGCAACA GTGGTGGCGA CAGTACGGCG GCGATCGTCA ACTGATTCAT 
GCCGAACATG GACAGATAGA CGGTAAGCTT CTGGATTTAC CGCGACAAAA TCTGGCGGAA 
CTGCCGGCCA GCGCCGCGCA TTCTCACACT CATGCCAGTA AAAAAGGACT CGCCGCGCTA 
AATCTGCCCG CCCAGCAGCG CTGGCGACGC AGCTTCAATA GCGGACAGGG TCATCAGGCC 
TGCGGCTGGA TTTTCGATGC CGATACCGTG TTTGACACCA TTGGCCTCCT CGAATGGGCG 
CGTCTGGCGC CGGTGGGCCG GGTGAAAGGC GTTATGCGCA TACAAGAGGG GCTGGTACGC 
ATCAATCGCC AGGGCGATGA CCTGCACATC GAAACACAGA GTGTCGCGCC GCCGGATAGC 
CGGGTTGAAC TTATCTCAAA CACAGAAACC GACTGGAATA CGTTACAGAC GGCCTTGTTG 
AAGCTTCGTT TAGCGACGCA CGCGTAA

Protein sequence

MTKTNLITGF LGSGKTTSIL HLLAHKDPAE KWAVLVNEFG EVGIDGALLA DSGALLKEIP 
GGCMCCVNGL PMQVGLNTLL RQGKPDRLLI EPTGLGHPKQ ILDLLTAPVY EPWIDLRATL 
CILDPRLLLD QQSVANENFR DQLASADIII ANKTDRATAQ SDAALQQWWR QYGGDRQLIH 
AEHGQIDGKL LDLPRQNLAE LPASAAHSHT HASKKGLAAL NLPAQQRWRR SFNSGQGHQA 
CGWIFDADTV FDTIGLLEWA RLAPVGRVKG VMRIQEGLVR INRQGDDLHI ETQSVAPPDS 
RVELISNTET DWNTLQTALL KLRLATHA