Gene SeHA_C2992 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2992
Symbol	proV
ID	6487961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	2930462
End bp	2931664
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	50%
IMG OID	642743148
Product	glycine betaine transporter ATP-binding subunit
Protein accession	YP_002046772
Protein GI	194450407
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.718604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.0138097
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTA AATTAGAAGT GAAGAATCTG TATAAAATAT TTGGAGAGCA TCCACAGCGT 
GCCTTCAAAT ATATTGAAAA GGGACTATCG AAAGAGCAAA TACTGGAAAA AACGGGGCTA 
TCGCTTGGCG TTAAAGACGC CAGTCTGGCC ATTGAAGAAG GCGAGATATT TGTCATCATG 
GGATTATCCG GCTCGGGTAA ATCCACAATG GTACGCCTTC TCAATCGCCT GATTGAACCC 
ACCCGCGGAC AGGTACTGAT CGACGGCGTT GATATTGCCA AAATATCAGA CGCTGAGCTT 
CGCGAGGTGC GCAGGAAAAA GATTGCGATG GTCTTCCAGT CATTTGCGCT CATGCCGCAT 
ATGACCGTGC TGGATAATAC GGCATTCGGT ATGGAATTAG CGGGCATCGC GGCGCAAGAG 
CGTCGCGAAA AAGCGTTGGA CGCCTTGCGT CAGGTGGGGC TTGAAAATTA CGCTCATGCC 
TATCCGGATG AACTTTCCGG TGGGATGCGT CAGCGTGTTG GACTTGCCCG CGCGCTGGCA 
ATCAACCCTG ATATCTTATT AATGGATGAA GCGTTTTCCG CCCTCGATCC ATTAATTCGT 
ACCGAAATGC AGGATGAGCT GGTGAAATTA CAGGCGAAAC ATCAGCGCAC CATTGTCTTT 
ATTTCCCACG ATCTTGATGA GGCTATGCGT ATTGGCGACA GGATTGCCAT TATGCAAAAT 
GGCGAGGTCG TACAGGTTGG TACGCCGGAT GAGATCCTGA ATAATCCGGC AAATGATTAT 
GTCCGCACGT TCTTCCGTGG CGTGGATATT AGTCAGGTCT TTAGCGCCAA AGATATTGCC 
CGTCGCAGTC CGGTCGGCTT AATTCGTAAA ACGCCAGGTT TCGGTCCCCG TTCGGCACTG 
AAATTATTAC AGGACGAAGA CCGTGAATAT GGTTACGTCA TTGAGCGTGG CAATAAATTC 
GTGGGCGTCG TGTCCATCGA CTCATTAAAA GCGGCATTAA GCCAGGCGCA AGGGATTGAA 
GCGGCGCTTA TCGACGACCC TTTAGTCGTT GATGCGCAAA CCCCACTCAG CGAGTTGCTC 
TCTCACGTCG GCCAGGCGCC CTGCGCGGTG CCGGTTGTCG ATGAAGAACA CCAGTATGTT 
GGCATTATTT CAAAACGTAT GTTGCTACAG GCTTTAGATC GCGAGGGGGG TAACAATGGC 
TGA

Protein sequence

MAIKLEVKNL YKIFGEHPQR AFKYIEKGLS KEQILEKTGL SLGVKDASLA IEEGEIFVIM 
GLSGSGKSTM VRLLNRLIEP TRGQVLIDGV DIAKISDAEL REVRRKKIAM VFQSFALMPH 
MTVLDNTAFG MELAGIAAQE RREKALDALR QVGLENYAHA YPDELSGGMR QRVGLARALA 
INPDILLMDE AFSALDPLIR TEMQDELVKL QAKHQRTIVF ISHDLDEAMR IGDRIAIMQN 
GEVVQVGTPD EILNNPANDY VRTFFRGVDI SQVFSAKDIA RRSPVGLIRK TPGFGPRSAL 
KLLQDEDREY GYVIERGNKF VGVVSIDSLK AALSQAQGIE AALIDDPLVV DAQTPLSELL 
SHVGQAPCAV PVVDEEHQYV GIISKRMLLQ ALDREGGNNG