Gene SeHA_C4991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4991
Symbol
ID	6490030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4868495
End bp	4870162
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	58%
IMG OID	642745033
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_002048602
Protein GI	194448109
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.170616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTCAAT TCGTTTATAC CATGCATCGT GTCGGCAAAG TGGTTCCGCC GAAACGTCAT 
ATTCTGAAAA ACATCTCGCT GAGCTTCTTC CCTGGCGCCA AAATCGGCGT GCTGGGCCTT 
AACGGCGCCG GTAAGTCTAC CCTGCTGCGC ATCATGGCGG GTCTCGATAA AGATATCGAG 
GGCGAAGCGC GCCCGCAGCC CGGCATTAAG ATTGGCTACC TGCCGCAGGA ACCTCAGCTA 
AACCCGGAAC ACACGGTACG CGAGTCGATT GAAGAGGCCG TTTCGGAAGT GGTTAACGCC 
CTCAAACGTC TGGATGAAGT GTACGCGCTG TACGCCGATC CGGATGCCGA CTTCGACAAG 
CTGGCCGCAG AGCAGGGCCG GCTTGAAGAG ATTATCCAGG CGCACGACGG TCATAATCTG 
AACGTGCAGC TTGAGCGCGC TGCTGACGCC CTGCGTCTGC CGGACTGGGA TGCCAAAGTC 
GAAAAACTGT CCGGCGGCGA GCGCCGCCGC GTGGCGCTGT GCCGTCTGTT GCTGGAAAAG 
CCGGACATGC TGCTGCTCGA CGAACCCACC AACCACCTGG ATGCCGAATC TGTTGCGTGG 
CTGGAACGTT TCCTGCACGA CTTCGAAGGC ACCGTCGTGG CGATTACCCA CGACCGTTAC 
TTCCTCGATA ACGTCGCCGG CTGGATTCTG GAACTTGACC GCGGCGAAGG TATTCCGTGG 
GAAGGCAACT ACTCCTCCTG GCTGGAGCAG AAAGATCAGC GTCTGGCGCA GGAAGCGTCT 
GCCGAAGCGG CGCGCCGTAA ATCCATTGAG AAAGAGCTGG AGTGGGTGCG TCAGGGCGCG 
AAAGGCCGTC AGTCGAAAGG TAAGGCGCGT CTGGCTCGCT TTGAAGAACT GAACAGCGTT 
GAGTATCAGA AACGTAACGA AACCAACGAA CTGTTTATTC CACCAGGACC GCGTCTGGGC 
GACAAAGTCA TTGAAGTCAG CAACCTGCGT AAATCCTACG GCGACCGCGT ACTGATCGAC 
GACCTGAGCT TCTCGGTGCC GAAAGGCGCT ATCGTCGGGA TCATCGGGCC AAACGGCGCG 
GGTAAATCGA CCCTGTTCCG CATGATGTCC GGTCAGGAGC AGCCTGATAG CGGCACCATT 
ACGCTGGGTG AAACCGTCAA GCTGGCCTCG GTCGATCAGT TCCGCGACGC AATGGACAAC 
AGCAAAACCG TCTGGGAAGA AGTGTCCGGC GGGCTGGATA TCATGAGGAT CGGCAACACT 
GAAATGCCAA GCCGCGCCTA TGTAGGCCGC TTCAACTTCA AAGGCGTCGA TCAGGGCAAA 
CGCGTTGGCG AACTGTCCGG CGGTGAGCGT GGTCGTTTGC ATCTGGCGAA GCTGCTGCAG 
GTGGGCGGCA ACGTCCTGCT GCTTGACGAA CCGACGAACG ACCTGGATAT CGAAACCCTG 
CGCGCGCTGG AAAACGCCCT GCTGGAGTTC CCTGGCTGCG CGATGGTTAT CTCGCACGAC 
CGTTGGTTCC TCGACCGTAT CGCCACCCAC ATTCTGGATT ATCAGGATGA AGGTAAGGTG 
GAATTCTTCG AAGGCAACTT TACCGAATAC GAAGAGTACA AGAAACGCAC GCTGGGCGCC 
GAGGCGCTGG AGCCGAAGCG TATCAAGTAC AAGCGTATTG CCAAATAA

Protein sequence

MAQFVYTMHR VGKVVPPKRH ILKNISLSFF PGAKIGVLGL NGAGKSTLLR IMAGLDKDIE 
GEARPQPGIK IGYLPQEPQL NPEHTVRESI EEAVSEVVNA LKRLDEVYAL YADPDADFDK 
LAAEQGRLEE IIQAHDGHNL NVQLERAADA LRLPDWDAKV EKLSGGERRR VALCRLLLEK 
PDMLLLDEPT NHLDAESVAW LERFLHDFEG TVVAITHDRY FLDNVAGWIL ELDRGEGIPW 
EGNYSSWLEQ KDQRLAQEAS AEAARRKSIE KELEWVRQGA KGRQSKGKAR LARFEELNSV 
EYQKRNETNE LFIPPGPRLG DKVIEVSNLR KSYGDRVLID DLSFSVPKGA IVGIIGPNGA 
GKSTLFRMMS GQEQPDSGTI TLGETVKLAS VDQFRDAMDN SKTVWEEVSG GLDIMRIGNT 
EMPSRAYVGR FNFKGVDQGK RVGELSGGER GRLHLAKLLQ VGGNVLLLDE PTNDLDIETL 
RALENALLEF PGCAMVISHD RWFLDRIATH ILDYQDEGKV EFFEGNFTEY EEYKKRTLGA 
EALEPKRIKY KRIAK