Gene SNSL254_A3009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3009
Symbol	proV
ID	6483012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2932592
End bp	2933794
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	50%
IMG OID	642738325
Product	glycine betaine transporter ATP-binding subunit
Protein accession	YP_002042054
Protein GI	194442245
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.0115571
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTA AATTAGAAGT GAAGAATCTG TATAAAATAT TTGGAGAGCA TCCGCAGCGT 
GCCTTCAAAT ATATTGAAAA GGGACTATCG AAAGAGCAAA TACTGGAAAA AACGGGGCTA 
TCGCTTGGCG TTAAAGACGC CAGTCTGGCC ATTGAAGAAG GCGAGATATT TGTCATCATG 
GGATTATCCG GCTCGGGTAA ATCCACAATG GTACGCCTTC TCAATCGCCT GATTGAACCC 
ACCCGCGGAC AGGTACTGAT TGACGGCGTT GATATTGCCA AAATATCAGA CGCTGAGCTT 
CGCGAGGTGC GCAGGAAAAA GATTGCGATG GTCTTCCAGT CATTTGCGCT CATGCCACAT 
ATGACCGTGC TGGATAATAC GGCATTCGGT ATGGAATTAG CGGGCATCGC GGCGCAAGAG 
CGTCGCGAAA AAGCGCTGGA CGCCTTGCGT CAGGTGGGGC TTGAGAATTA CGCTCATGCC 
TATCCGGATG AACTTTCCGG TGGGATGCGT CAGCGTGTTG GACTTGCCCG CGCGCTGGCA 
ATCAACCCTG ATATCTTATT AATGGATGAA GCGTTTTCCG CCCTCGATCC ATTAATTCGT 
ACCGAAATGC AGGATGAGCT GGTGAAATTA CAGGCGAAAC ATCAGCGCAC CATTGTCTTT 
ATTTCCCACG ATCTTGATGA GGCTATGCGT ATTGGCGACA GGATTGCCAT TATGCAAAAT 
GGCGAGGTCG TACAGGTTGG TACGCCGGAT GAGATCCTGA ATAATCCGGC AAATGATTAT 
GTCCGCACGT TCTTCCGTGG CGTGGATATT AGTCAGGTCT TTAGCGCCAA AGATATTGCC 
CGTCGCAGTC CGGTCGGATT AATTCGTAAA ACGCCAGGTT TTGGTCCCCG TTCGGCACTG 
AAATTATTAC AGGATGAAGA CCGTGAATAT GGTTACGTCA TTGAGCGTGG CAATAAATTC 
GTGGGCGTCG TGTCCATCGA CTCATTAAAA GCGGCATTAA GCCAGGCGCA AGGGATTGAA 
GCGGCGCTTA TCGACGACCC TTTAGTCGTT GATGCGCAAA CCCCACTCAG CGAGTTGCTC 
TCTCACGTCG GCCAGGCGCC CTGCGCGGTG CCGGTTGTCG ATGAAGAACA CCAGTATGTT 
GGCATTATTT CAAAACGTAT GTTGCTACAG GCTTTAGATC GCGAGGGGGG TAACAATGGC 
TGA

Protein sequence

MAIKLEVKNL YKIFGEHPQR AFKYIEKGLS KEQILEKTGL SLGVKDASLA IEEGEIFVIM 
GLSGSGKSTM VRLLNRLIEP TRGQVLIDGV DIAKISDAEL REVRRKKIAM VFQSFALMPH 
MTVLDNTAFG MELAGIAAQE RREKALDALR QVGLENYAHA YPDELSGGMR QRVGLARALA 
INPDILLMDE AFSALDPLIR TEMQDELVKL QAKHQRTIVF ISHDLDEAMR IGDRIAIMQN 
GEVVQVGTPD EILNNPANDY VRTFFRGVDI SQVFSAKDIA RRSPVGLIRK TPGFGPRSAL 
KLLQDEDREY GYVIERGNKF VGVVSIDSLK AALSQAQGIE AALIDDPLVV DAQTPLSELL 
SHVGQAPCAV PVVDEEHQYV GIISKRMLLQ ALDREGGNNG