Gene SNSL254_A2187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2187
Symbol
ID	6485443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2101175
End bp	2102935
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	58%
IMG OID	642737536
Product	arsenical pump-driving ATPase
Protein accession	YP_002041278
Protein GI	194443345
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGATGC TTCGGCAGGT GCCCCCCTTT TTGTTTTTTA CCGGTAAAGG CGGTGTGGGT 
AAAACATCGC TGGCCTGTGC TACCGCGATT CATCTGACCG CCTCTGGCAA ACGTGTACTG 
TTGGTCAGCA CCGATCCGGC TTCCAATGTG GCGCAGGTAT TTGAACAGAC TATCGGTCAT 
CAGATAACCC CGATTGCAGC GGTCAACGGA CTGGCTGCGC TGGAAGTCGA TCCGTCCGCT 
GCCGCAGCGG CATACCGTGA GCGCATTGTT GGACCGGTGC GTGGAATTCT GCCGGACGAC 
ATCGTAGCGG GTATTGAGGA GCAGCTTTCC GGTGCCTGTA CCACCGAAAT AGCCGCCTTT 
GACGAATTCA CCGCGCTGCT GACTAATCAG CAACTGCGCG ATGAGTACGA TCATATTGTG 
TTCGACACCG CGCCAACCGG GCATACGCTA CGAATGCTGC AACTGCCCGG CGCGTGGAGC 
GGTTATCTCG ACAACAGCCA GCACGGTGCG TCCTGTCTCG GACCGCTGGC CGGGCTGGAA 
AAACAGCGCA GCCAGTATCG TGCCGCCGTA GACGCACTGG CGAATGCGGA ACTGACGCGA 
ATGGTGCTGG TCGCCAGAGC GCAAACCGCA ACATTGAAGG AAGTATCGCG CACTTATGAC 
GAACTAGCCG CCATCGGCCT GACGCAGCAG TATCTGGTCA TTAACGGCCT GTTGCCTGAG 
CAGGAAACCG CACGCGATAA GCTGGCGCAG GCACTGTATC AGCGTGAACA ACAGGCGCTG 
CAACATTTAC CTGATAACCT GCGCGCATTG CCCTGCGATC GCCTGCCGTT AAAACCGTTC 
AATATGGTAG GGCTGGCGGC ATTACGGGGT CTGTTGGACG ACAGTTCAAC TGGCTCCCCG 
GCGGAAGTCG GAGATATCTC CCCCGTAGAT CTTCCTTCAT TGTCATCACT AATCGACGGG 
TTCGCATCTC AGGGACATGG CCTGATCATG TTGATGGGCA AAGGCGGCGT GGGGAAAACC 
ACGCTGGCGG CGGCTATTGC CGTTGAACTG GCCCGTCGCG GTTATTCGGT TCACCTGTCC 
ACATCCGATC CGGCGGCGCA CCTGACCGAC ACGCTGGACG GCTCATTCGA CGGTCTGACC 
GTCAGTCGTA TCGATCCGCA GGCCGAAACC GAGCGTTACC GGCAGCAGGT AATAGCTGAA 
CAGGGTAAAA ACCTCGACGA ACAGGGGCGT GCCGTTCTTG AAGAGGATCT GCGTTCTCCC 
TGTACGGAAG AAATTGCCGT GTTTCAGGCT TTTTCACGCA TCATTCAGGA AGCGGGTAAG 
CAGTTTGTCG TTATGGATAC AGCGCCAACC GGCCATACAT TGCTACTGCT TGACGCCACT 
GGCGCTTACC ACCGTGAGAT TGCCCGACTG GCCGGGGAAC ACGGTCAGCC CGTACTGACG 
CCCATGATGC GCCTACAGGA CAGCGAGCAG ACGAAAGTTC TCATCGCCAC GCTGGCGGAA 
ACCACGCCGG TGCTGGAAGC CGCTCATTTG CAGGACGACC TGCGTCGCGC GGGGATTGAA 
CCGTGGGGCT GGGTCATTAA TAACAGCCTG ATCAATACGC CGACTACATC GCCGCTGCTG 
CGCCAGCGGG CCGAACGCGA ACGGTCGCAG ATTGATGCCG TCTGTACCCA CCATGCCCGA 
CGCTGTGCGC TGGTGCCGCT ACAGGCGGAA GAGCCTGTCG GCGTTGAGCG TTTACTACAA 
CTGAGCACAA CGGGAAAATA A

Protein sequence

MLMLRQVPPF LFFTGKGGVG KTSLACATAI HLTASGKRVL LVSTDPASNV AQVFEQTIGH 
QITPIAAVNG LAALEVDPSA AAAAYRERIV GPVRGILPDD IVAGIEEQLS GACTTEIAAF 
DEFTALLTNQ QLRDEYDHIV FDTAPTGHTL RMLQLPGAWS GYLDNSQHGA SCLGPLAGLE 
KQRSQYRAAV DALANAELTR MVLVARAQTA TLKEVSRTYD ELAAIGLTQQ YLVINGLLPE 
QETARDKLAQ ALYQREQQAL QHLPDNLRAL PCDRLPLKPF NMVGLAALRG LLDDSSTGSP 
AEVGDISPVD LPSLSSLIDG FASQGHGLIM LMGKGGVGKT TLAAAIAVEL ARRGYSVHLS 
TSDPAAHLTD TLDGSFDGLT VSRIDPQAET ERYRQQVIAE QGKNLDEQGR AVLEEDLRSP 
CTEEIAVFQA FSRIIQEAGK QFVVMDTAPT GHTLLLLDAT GAYHREIARL AGEHGQPVLT 
PMMRLQDSEQ TKVLIATLAE TTPVLEAAHL QDDLRRAGIE PWGWVINNSL INTPTTSPLL 
RQRAERERSQ IDAVCTHHAR RCALVPLQAE EPVGVERLLQ LSTTGK