Gene SeHA_C4220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4220
Symbol
ID	6490131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4107399
End bp	4108826
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	52%
IMG OID	642744314
Product	inner membrane transport protein YieO
Protein accession	YP_002047918
Protein GI	194449681
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0177316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCA AAAAAGCGCG CAGTATGGCT GGCCTGCCGT GGATCGCGGC GATGGCCTTC 
TTTATGCAGG CGCTAGACGC CACCATTTTG AATACCGCTT TACCGGCTAT TGCGCATAGT 
CTTAACCGTT CACCACTCGC CATGCAGTCC GCTATTATCA GTTATACCCT GACAGTAGCT 
ATGTTAATTC CGGTAAGCGG CTGGCTGGCT GACCGCTTTG GTACGCGTCG CGTTTTTATG 
GTTGCCGTAA GTCTGTTTAC GTTAGGCTCG CTGGCCTGCG CGCTCTCCAG TTCACTATCT 
GAATTGGTTA TTTTTCGCGT CGTACAAGGC GTCGGCGGAG CGATGATGAT GCCAGTGGCG 
CGGCTGGCGT TATTGCGAGC CTATCCGCGT AGTGAGCTGC TGCCCGTTCT TAACTTTGTC 
ACTATGCCGG GGCTGGTAGG TCCGATTCTG GGGCCGGTAT TAGGCGGCGT ACTGGTGACC 
TGGGCAAGCT GGCACTGGAT CTTCCTGATT AATATTCCCA TTGGTGTTGC AGGCATTCTG 
TATGCCCGCA AATATATGCC CAACTTCACC ACGCCGCGTC GCAAGTTTGA CATGACCGGC 
TTCTTTCTTT TTGGGTTAAG TCTGGTTTTA TTTTCCAGCG GAATGGAACT GTTTGGCGAA 
AAGATTGTGG CGACATGGAT CGCATCCGCC ATTATTTTTT GCAGTATCGT TCTACTATTG 
GCCTATATCC GCCACGCCCG CCGTCATCCG ACACCGTTAA TATCACTATC GCTGTTTAAG 
ACACGCACAT TTTCCGTCGG TATTGCCGGC AACCTCGCCA CGCGTCTGGG GACAGGCTGC 
GTACCTTTTT TGATGCCGTT AATGCTACAG GTTGGTTTTG GCTACCCGGC TCTGATCGCC 
GGCTGCATGA TGGCGCCGAC GGCTTTGGGT TCTATTATCG CGAAATCGAC CGTAACGCAG 
GTTTTACGAC GTTTGGGATA CCGGAAGACT CTGGTCGGCA TTACGGTATT TATCGGTCTG 
ATGATTGCCC AGTTTTCGTT TCAATCTCCC GCCATGCCGA TCTGGATGCT CGTGCTGCCG 
CTATTCATTC TTGGAATGGC GATGTCCACT CAATTTACGG CAATGAATAC GATTACTCTT 
GCGGATCTGA CGGACGATAA TGCCAGCAGC GGCAACAGCG TTCTGGCGGT TACGCAGCAA 
TTGTCTATCA GTTTAGGCGT GGCGATCAGC GCGGCGGTGT TACGTATTTA TGAAGGTTTT 
GCGGGCACCA GTACCGTGGA ACAGTTCCAC TGTACCTTTA TCACGATGGG GGCGATCACT 
ATCGTGTCCG CGCTGATGTT TATGCTGCTA AGAGCCAAAG ACGGCAACAA TCTGATTAAA 
GAACGGCATA AATCTAAACC GACCCACGCA CCGTCAAAAC CGGAGTAA

Protein sequence

MTSKKARSMA GLPWIAAMAF FMQALDATIL NTALPAIAHS LNRSPLAMQS AIISYTLTVA 
MLIPVSGWLA DRFGTRRVFM VAVSLFTLGS LACALSSSLS ELVIFRVVQG VGGAMMMPVA 
RLALLRAYPR SELLPVLNFV TMPGLVGPIL GPVLGGVLVT WASWHWIFLI NIPIGVAGIL 
YARKYMPNFT TPRRKFDMTG FFLFGLSLVL FSSGMELFGE KIVATWIASA IIFCSIVLLL 
AYIRHARRHP TPLISLSLFK TRTFSVGIAG NLATRLGTGC VPFLMPLMLQ VGFGYPALIA 
GCMMAPTALG SIIAKSTVTQ VLRRLGYRKT LVGITVFIGL MIAQFSFQSP AMPIWMLVLP 
LFILGMAMST QFTAMNTITL ADLTDDNASS GNSVLAVTQQ LSISLGVAIS AAVLRIYEGF 
AGTSTVEQFH CTFITMGAIT IVSALMFMLL RAKDGNNLIK ERHKSKPTHA PSKPE