Gene SNSL254_A3372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3372
Symbol
ID	6485299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3271728
End bp	3272912
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	50%
IMG OID	642738663
Product	arylsulfatase-activating protein AtsB
Protein accession	YP_002042383
Protein GI	194443597
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAATC TCAACACATT ACGGCAACAA CAAATCCCCG TAATGACGGA ATATCGCGCG 
CAGATACCCT TTCATATATT GGCAAAACCC ATAGGCCCTG CATGTAATCT GGCCTGCCGC 
TATTGTTATT ACCCACAGGG CGAAACGCCC GTAGAAAAAA TGAATGAATC AACGCTGGAG 
GTTTTTATTT GTCGCTATAT TGCGGCGCAA CCTGCCAGTG CGCGTGAAAT TAATTTTGTC 
TGGCAAGGCG GTGAACCGCT TTTAGCCGGA ATCGGTTTTT ATAAAAAGGT AATAGCGCTT 
CAACAACGAT ATGCGCCTGA CGGCGTGACG ATCAGTAATA GTCTGCAAAC GAATGCGACG 
TTGTTAAACG ATGCCTGGTG CCGTCTGTTT CGCGACAATA ATTTTACTAT TGGCATCAGT 
CTTGAGGGCA GTGAAGACTT GCAAAATCAT CATCGTCCGG GCAAACGCGG CGAGGCCAGC 
TATCCGGCGG TGTTGCGGGG AATCACATTG TTACAACACT ATCGAGTCGA TTTTAATGTA 
CTGATTGTCG TGCATGATGA CATGGCTCGC CATGCGGCAG CCATCTACGA TCATGTTGTT 
AGCCTTGGCG CTCGTTATCT GCAATTTCAG CCACTGATGG ACGAAGGCAA CGCCCTACAG 
CAACGTTACC AATTGAGTGC GGATAACTGG GGACGTTTCA TGATTGATAT CTGGCGTCAA 
TGGCGCAAAC GCGGTGATAT GGGACGGGTT TTTGTGATCA ACATTGAACA GGCATGGGCA 
CAATATTTTA CGCATATCAG CGCCACCTGT GTCCATTCCG CCCGCTGCGG CACGAATCTG 
GTCATGGAGC CGGACGGCAA ACTCTATGCC TGCGATCATC TGATTAATAG CCAGCATTAC 
CTGGGACAGC TTTCTAATAA TACGTTAGCG CCAGCCGTAG ATTCCGCAAC CCGGCTTCCC 
TTTGGTATTA AGAAAAGCCA GCGCCGGGAG TGTCAACGGT GTTCTGTGAA AATAGTCTGC 
CAGGGAGGCT GCCCCGCACA TATCAACAGT GCCGGCTACA ACCGACTTTG TAGCGGCTAT 
TACTCTTTTT TCACGGAGAT TCTGGCTCCG CTACGCGCCT GGCCCCGGAA TCTGAATGGA 
CTGAAGGCCT GGCGTGCTGA CGTTATGGGC AGATTTTCGG GCTGA

Protein sequence

MLNLNTLRQQ QIPVMTEYRA QIPFHILAKP IGPACNLACR YCYYPQGETP VEKMNESTLE 
VFICRYIAAQ PASAREINFV WQGGEPLLAG IGFYKKVIAL QQRYAPDGVT ISNSLQTNAT 
LLNDAWCRLF RDNNFTIGIS LEGSEDLQNH HRPGKRGEAS YPAVLRGITL LQHYRVDFNV 
LIVVHDDMAR HAAAIYDHVV SLGARYLQFQ PLMDEGNALQ QRYQLSADNW GRFMIDIWRQ 
WRKRGDMGRV FVINIEQAWA QYFTHISATC VHSARCGTNL VMEPDGKLYA CDHLINSQHY 
LGQLSNNTLA PAVDSATRLP FGIKKSQRRE CQRCSVKIVC QGGCPAHINS AGYNRLCSGY 
YSFFTEILAP LRAWPRNLNG LKAWRADVMG RFSG