Gene SeHA_C1661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1661
Symbol
ID	6489629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	1615663
End bp	1616811
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	53%
IMG OID	642741884
Product	choline transport ATP-binding protein OpuBA
Protein accession	YP_002045529
Protein GI	194451108
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.853927
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAAAC TGGAAAATCT CACCAAACAA TTTGTACAGA AAAAGGGTCA GCCGCTAAAA 
GCCGTCGACA ACGTCAACCT GAACGTGCCG GAAGGCGAAA TGTGCGTCTT GCTCGGTCCC 
TCCGGCTGCG GCAAAACCAC CACGTTAAAG ATGATCAACC GGCTGATCGC GCCCAGCAGC 
GGTAATATTC TTATCAACGG CGAGAATACC AACGATATGG ATACGGTAAC GCTACGCCGC 
AATATTGGGT ATGTTATCCA GCAGATCGGC CTGTTTCCTA ATATGACGAT TGAAGAAAAT 
ATTACCGTTG TGCCGCGCAT GTTGGGTTGG GACAAAGCGC GCTGCAAGCA ACGCGCCGAA 
GAGTTGATGG ACATGGTGGC GCTGGATGCC AGAAAATTTC TGCATCGCTA TCCAAAGGAG 
ATGTCCGGGG GACAGCAACA GCGTATTGGC GTGATCCGCG CTCTGGCCGC CGATCCGCCG 
GTACTGCTGA TGGATGAGCC CTTCGGCGCG GTGGACCCCA TTAACCGCGA AGTGATCCAG 
AACCAGTTTC TGGATATGCA GCGTAAGCTA AAAAAGACCG TGATGCTGGT CAGCCATGAT 
ATCGACGAAG CGCTAAAACT CGGCGACCGT ATCGCCGTGT TCCGTCAGGG GCGAATTGTA 
CAGTGCGCCA GTCCTGATGA ACTGCTGGCC AAACCGGCTA ACGAGTTTGT CGGGTCGTTT 
GTCGGTCAGG ACAGAACGTT AAAGCGTTTG CTACTGGTCT CCGCAGGCGA TGTGACCGAC 
CAACAGCCAA CCATTACCGC GCGGCCTTCC ACGCCGCTAA GCGAGGCGTT CGGCATTATG 
GATGATCACG ATATTCGCGC CATTACCGTC ATTGACAACG ACGGTAAGCC ACTGGGATTT 
GTGAAGCGCC GGGAAGCGCG GAACGCCAGC GGAACCTGCG CCGATATCAC CCATCCTTTC 
CGTATTACGG GCAAAGCGGA AGATAACCTG CGTATTGTGC TGTCCAGATT GTACGAAAGT 
AATACTAGCT GGATGCCGAT CGTTGATGAA GACGGACGCT ATAACGGTGA AATCTCTCAG 
GATTACATCG CCGATTATCT CAGCTCAGGC CGCACGCGTC GGGCGTTAAA TATTCACGAA 
AACAGCTAA

Protein sequence

MIKLENLTKQ FVQKKGQPLK AVDNVNLNVP EGEMCVLLGP SGCGKTTTLK MINRLIAPSS 
GNILINGENT NDMDTVTLRR NIGYVIQQIG LFPNMTIEEN ITVVPRMLGW DKARCKQRAE 
ELMDMVALDA RKFLHRYPKE MSGGQQQRIG VIRALAADPP VLLMDEPFGA VDPINREVIQ 
NQFLDMQRKL KKTVMLVSHD IDEALKLGDR IAVFRQGRIV QCASPDELLA KPANEFVGSF 
VGQDRTLKRL LLVSAGDVTD QQPTITARPS TPLSEAFGIM DDHDIRAITV IDNDGKPLGF 
VKRREARNAS GTCADITHPF RITGKAEDNL RIVLSRLYES NTSWMPIVDE DGRYNGEISQ 
DYIADYLSSG RTRRALNIHE NS