Gene SeD_A4498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4498
Symbol
ID	6871275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4333841
End bp	4335631
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	48%
IMG OID	642787413
Product	arylsulfotransferase
Protein accession	YP_002218024
Protein GI	198242860
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTATTTA CAAGGAAAGT CTTACCTGTA TTATGCTGCC TGTGTTTGAG CGGCAGCGTT 
TTGGCCTCAG GCGTTTTAGA CCCAAACAGG CCAATGGTCG CATCAGCAGA TGTCATTCCA 
GTCCATGAGG GGCCATTAGG TATGGTCGAT GTCGCTCCCT ACGGCGGCGT TTTCCCATTA 
ACAGCAATCA TTAATAAAGC CAATCATAAT GTACAGGACG TGAAGGTTAC CGTTTTAGGG 
AAAGGGGAAA AAGGTATCCC GATCAGTTAT GATGTCGGCC CGCAGGCTAT AAATACCCAT 
GACGGCATAC CTGTATTTGG CTTGTATCCA GATTATGTCA ATAAGGTTAA AGTTGACTGG 
ACTGAAGAAG GTAAAAAACA AACTTATACG TGGTCCATTT ACGCCGCACC GGTATCATTA 
CCCTCTACTA CCGGGCAAAC TGCCGTTCTT CCTACGGTAG AACCGGTTAA AGTCGATAGC 
TCGCTTAAAA ATCGCTTATA TCTTTTTAAC CATATAACGG GGATGCCAAG AGCCGGCCAC 
ATTATGCATG TCGCAGGCGG CGCGGCGAAC TGGGATTATA CCGGTATCAA CTGGATTAGC 
GATACGAATG GCGATGTTCG TGGCTATATG AATATTGATA AATTCCGTAA CCAGGATGAT 
ATAACGCGTT TTGGTTCCAT GATGAGCTTC CATCAGGTTA ACGATGGCAA TCTTATTTTT 
GGCCAGGGTC AACGTTACTT TAAATATGAT TTCTTAGGCC GCGTTATTTC TGATAAACGA 
CTGCCAAAAG GATTTATTGA TTTTTCGCAC GCCATTACCG AAACGCCGAA AGGCACCTAC 
CTGCTGCGTG TCGCAAAAGA AAATTATCCA TTAAATGGTA AATACACCAT CAATACTGTG 
CGTGATCATA TTCTTGAAGT TGACCAGAAC GGCGATACCG TCGATTACTG GGATCTGCCA 
AAAATCCTCG ACCCCTATCG TGACGACGTT ATTCTGGCGA TGGATCAGGG AGCGGTATGT 
TTGAGCGTCG ATGCCGAACA TTCCGGTCAG GTCATGACCA AAGAGCAGCT TGCAAAACAA 
CCCTTCGGCG ATATCGCGGG CTCCGGCCCG GGCCGCAACT GGGCGCATGT TAACTCCGTC 
AGCTACGATC CTCGCGACGA CAGCATTATC ATTAGCTCGC GCCACCAGTC TGCCATCATC 
AAAATTGGCC GCGATAAAAA AGTGAAATGG ATACTTTCCG ATCCATCCGG CTGGAAAGGC 
GAACTGGCGA AAAAAGTGCT GAAACCCGTA GACAGCAACG GTAAACCGCT AACCTGCGAA 
GCTCACCACT GCGACGGTGG ATTTGACTGG ACATGGACAC AACATACCGG TTGGTTAGTG 
CCATCCAAAA GCACCGGAGG TAAAACCGTC GTGACCGCCT TTGATAACGG CGATGCGCGC 
GGCATGGAAC AACCGGCCAT GCCGTCAATG AAATATTCCC GCGGCGTGGA ATATCAGATT 
GACGAAAAAA ATATGACGGT TTCCCAAATG TGGGAATATG GTAAAGAGCG CGGTTTTGAC 
TGGTACAGCG CCATTACTTC CGTCACGGAA TATCGCCCGG AAACCAAAAC GATGTTCATG 
TACTCGGCCA CAGCGGGAAT GAGCGGTACA AAACCGATCG TTTCCGTTCT GGATGAAGTC 
AAAGACGGTA CTCAGGATGT GATGCTGGAG CTAAAAGTAC ACAGTAACCG TGCCGGTATG 
CTGGGTTATC GGGCGCTGAT TATCGATCCA GAGCAGATGT TTAAAAAATA A

Protein sequence

MLFTRKVLPV LCCLCLSGSV LASGVLDPNR PMVASADVIP VHEGPLGMVD VAPYGGVFPL 
TAIINKANHN VQDVKVTVLG KGEKGIPISY DVGPQAINTH DGIPVFGLYP DYVNKVKVDW 
TEEGKKQTYT WSIYAAPVSL PSTTGQTAVL PTVEPVKVDS SLKNRLYLFN HITGMPRAGH 
IMHVAGGAAN WDYTGINWIS DTNGDVRGYM NIDKFRNQDD ITRFGSMMSF HQVNDGNLIF 
GQGQRYFKYD FLGRVISDKR LPKGFIDFSH AITETPKGTY LLRVAKENYP LNGKYTINTV 
RDHILEVDQN GDTVDYWDLP KILDPYRDDV ILAMDQGAVC LSVDAEHSGQ VMTKEQLAKQ 
PFGDIAGSGP GRNWAHVNSV SYDPRDDSII ISSRHQSAII KIGRDKKVKW ILSDPSGWKG 
ELAKKVLKPV DSNGKPLTCE AHHCDGGFDW TWTQHTGWLV PSKSTGGKTV VTAFDNGDAR 
GMEQPAMPSM KYSRGVEYQI DEKNMTVSQM WEYGKERGFD WYSAITSVTE YRPETKTMFM 
YSATAGMSGT KPIVSVLDEV KDGTQDVMLE LKVHSNRAGM LGYRALIIDP EQMFKK