Gene SeAg_B4710 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4710
Symbol
ID	6795537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	4603521
End bp	4604687
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	61%
IMG OID	642778783
Product	major facilitator superfamily transporter
Protein accession	YP_002149345
Protein GI	197247375
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.019834
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGCTC TCACACAACA TTCCACATCG ATCACGCTGT TTCGCATCAG CGCCGCGATG 
TTTCTCAACT ATCTGACTAT TGGCATCCCG TTAGTCATGC TGCCGCTGTA CGTTCAGCAG 
CAGTTGCATC TGAGCGATCT GTTGATCGGT ATCGCGGTAG GCAGCCAGTT TATCGCCACC 
TTGCTTACCC GGGGCGCCGC GGGTCGAAAA GCCGACACGT CAGGCGGACG TCGGACGGTT 
ATCACCGGTC AGTTCTACTG CGCCGCATCA GGTCTGCTGA TGCTGGTCAG TCTAATCGCT 
CACCCGGTTC CGCTGCTCGC ATGGGCCATA CTGATTGTTG GTCGTGTGCT GCTGGGCATC 
GGTGAAAGTT TCATTTTGAC CGGTAATTTA ACCTGGGGGA TGTGGCTGGC GGGCTCGACC 
CACGCGGGTC AGGTTATTTC CTGGAACGGC ATGGCGACCT ACGGTGCGCT GGCTATCGGC 
GCGCCGCTGG GGCTGTCGCT TTACGCCAGG GCCGGCCTGG CGCTTCCGGC GCTCCTCGTC 
GTGCTGTTGC CGATCATCGC CAGCGGAGTC ATCTATGGCA TTCCGGGGAA TATCCCAACA 
GCCCGTCCCC GCGTGCCAGT GCTACGGGTC GTCGGCCTGG TGTGGCGGCC CGGAACAGGG 
CTTGTGCTCC AGGGCATTGG TTTTGCCACC CTAAGCGCGT TTACCGCCCT CTGGTTCAAC 
GAGCGTCACT GGGATAACAC CGGTTTTGCG ATGACGCTGT TTGGCATTGC GTTTATCGCT 
GTCCGCTTTT TCTGCGCCAA ATTTCCCGAC CGTTACGGCG GCGCCACGGT CGCAACCTTT 
TCACTACTGG TAGAGGGGAC CGGACTGGCG GTAATGTGGG CCGCTCCGTC AGCAGGCGCT 
GCGCTGATTG GCGCGGCGAT TACCGGCTGC GGCTGTTCGC TGATGTTCCC ATCGCTGGGC 
GTAGAGGTTG TGCGCAGAGT GCCACCGGAG ATTCGTGGTA CGGCCCTCGG CGTCTGGTCA 
GCGTTTCAGG ATCTGGCCTA CGGATTTACC GGACCAATAG CGGGCCTGCT GACGCCGTTT 
ATCGGCTATC AGCAGGTCTT TCTTCTGGCC GCGGCCTGCG CGCTGCTGGG CGCGGCGGTT 
GTCCATCTCC TGCTGCGGCA ACATTAA

Protein sequence

MPALTQHSTS ITLFRISAAM FLNYLTIGIP LVMLPLYVQQ QLHLSDLLIG IAVGSQFIAT 
LLTRGAAGRK ADTSGGRRTV ITGQFYCAAS GLLMLVSLIA HPVPLLAWAI LIVGRVLLGI 
GESFILTGNL TWGMWLAGST HAGQVISWNG MATYGALAIG APLGLSLYAR AGLALPALLV 
VLLPIIASGV IYGIPGNIPT ARPRVPVLRV VGLVWRPGTG LVLQGIGFAT LSAFTALWFN 
ERHWDNTGFA MTLFGIAFIA VRFFCAKFPD RYGGATVATF SLLVEGTGLA VMWAAPSAGA 
ALIGAAITGC GCSLMFPSLG VEVVRRVPPE IRGTALGVWS AFQDLAYGFT GPIAGLLTPF 
IGYQQVFLLA AACALLGAAV VHLLLRQH