Gene SeD_A3115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3115
Symbol	proV
ID	6870960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3000612
End bp	3001814
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	50%
IMG OID	642786139
Product	glycine betaine transporter ATP-binding subunit
Protein accession	YP_002216785
Protein GI	198245385
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	0.405398
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTA AATTAGAAGT GAAGAATCTG TATAAAATAT TTGGAGAGCA TCCGCAGCGT 
GCCTTCAAAT ATATTGAAAA GGGACTATCG AAAGAGCAAA TACTGGAAAA AACGGGGCTA 
TCGCTTGGCG TTAAAGACGC CAGTCTGGCC ATTGAAGAAG GCGAGATATT TGTCATCATG 
GGATTATCCG GCTCGGGTAA ATCCACAATG GTACGCCTTC TCAATCGCCT GATTGAACCC 
ACCCGCGGAC AGGTACTGAT TGACGGCGTT GATATTGCCA AAATATCAGA CGCTGAGCTT 
CGCGAGGTGC GCAGGAAAAA GATTGCGATG GTCTTCCAGT CATTTGCGCT CATGCCGCAT 
ATGACCGTGC TGGATAATAC GGCATTCGGT ATGGAATTAG CGGGCATCGC GGCGCAAGAG 
CGTCGCGAAA AAGCGCTGGA CGCCTTGCGT CAGGTGGGGC TTGAAAATTA CGCTCATGCC 
TATCCGGATG AACTTTCCGG TGGGATGCGT CAGCGTGTTG GACTTGCCCG CGCGCTGGCA 
ATCAACCCTG ATATCTTATT AATGGACGAA GCGTTTTCCG CCCTCGATCC ATTAATTCGT 
ACCGAAATGC AGGATGAACT GGTGAAATTA CAGGCGAAAC ATCAGCGCAC CATTGTCTTT 
ATTTCCCACG ATCTTGATGA GGCTATGCGT ATTGGCGACA GGATTGCCAT TATGCAAAAT 
GGCGAGGTCG TACAGGTTGG TACGCCGGAT GAGATCCTGA ATAATCCGGC AAATGATTAT 
GTCCGCACGT TCTTCCGTGG CGTGGATATT AGTCAGGTCT TTAGCGCCAA AGATATTGCC 
CGTCGCAGTC CGGTCGGCTT AATTCGTAAA ACGCCAGGTT TCGGTCCCCG TTCGGCACTG 
AAATTATTAC AGGACGAAGA CCGTGAATAT GGTTACGTCA TTGAGCGTGG CAATAAATTC 
GTGGGCGTCG TGTCCATCGA CTCATTAAAA GCGGCATTAA GCCAGGCGCA AGGGATTGAA 
GCGGCGCTTA TCGACGACCC TTTAGTTGTT GATGCGCAAA CCCCACTCAG CGAGTTGCTC 
TCTCACGTCG GCCAGGCGCC CTGCGCGGTG CCGGTTGTCG ATGAAGAACA CCAGTATGTT 
GGCATTATTT CAAAACGTAT GTTGCTACAG GCTTTAGATC GCGAGGGGGG TAACAATGGC 
TGA

Protein sequence

MAIKLEVKNL YKIFGEHPQR AFKYIEKGLS KEQILEKTGL SLGVKDASLA IEEGEIFVIM 
GLSGSGKSTM VRLLNRLIEP TRGQVLIDGV DIAKISDAEL REVRRKKIAM VFQSFALMPH 
MTVLDNTAFG MELAGIAAQE RREKALDALR QVGLENYAHA YPDELSGGMR QRVGLARALA 
INPDILLMDE AFSALDPLIR TEMQDELVKL QAKHQRTIVF ISHDLDEAMR IGDRIAIMQN 
GEVVQVGTPD EILNNPANDY VRTFFRGVDI SQVFSAKDIA RRSPVGLIRK TPGFGPRSAL 
KLLQDEDREY GYVIERGNKF VGVVSIDSLK AALSQAQGIE AALIDDPLVV DAQTPLSELL 
SHVGQAPCAV PVVDEEHQYV GIISKRMLLQ ALDREGGNNG