Gene SeD_A0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0041
Symbol
ID	6874230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	44310
End bp	46025
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	50%
IMG OID	642783299
Product	arylsulfotransferase
Protein accession	YP_002213993
Protein GI	198244177
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.0089989
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATACGT TAACTACAAC GTCTGTTGTC CTTCCTGCGC CGCGTCCGGC GATTAATCAG 
GGTATCGATA TCAATAATGA AATGGTGCTT AACCATACCG CTATTTATGA AAATTGCCTT 
GCGCAGGTCA CGCAAGAGAA TACGGTAGAA AATGCGCTCA TGTTGTTAGA CCCTTACGGC 
ACGGCGCCTT TAAGCGCTTA TGCCGGGGTC TGGAGTCTGG AACCGGCTGA GATCATAGTC 
ACGGTCCAGG ATGCGGCAAA AACGGCGATG CCGGTAGAAC ATCTTTACAC CCTTACGGCA 
GGCGCAAATC TGTTGCCGGT TCTGGGGCTG GTAGCGGATA CTGAAAACCG TATTGTCTTT 
TCTCAGGCAG ATACGCCGCT TGCCGTCTAT ACGCTCATCA CACAGCCATT ACCGCCGGTA 
GATTCCGCGG AGGTCGTATT AGGTTTTCCG ATTATCAACG TGACGCAACC TGCTACCGAT 
GCGGACAAGA TGGCGCCAGG GTTTTATTTT ATTACGCATT TCGATCGCTA TAATTACGCA 
TTAGATCAGA ATGGTCTGGT GCGCTGGTAC GTTACTCAGG ATTATCCGTC TTATAATTTT 
GTTCGAATTG ATAATGGCCA TTTCCTCACT ACTTCAGAAG CGAAAAATAC CTATCTGGAT 
ATGTATGAGT TCGACATGAT GGGGCGTCTT CACACATTCT ATAATCTCGA TAATCAATTT 
CACCATTCTA TCTGGCCGTG GGATAGCAAT ACCATTGTTG CGCCCTCTGA ATATACCTCG 
GGTCGGCCCG ACGATTTGAA AACCAATGAA GACGGCGTAT CGGTTGTCGA TCTGACTACC 
GGACTGGAGA CGGCTTACTA CGATATGGCG AAGGTGCTGG ATACGACGCG GGTTTCCCGT 
CCTTCAGGTA CGGCGCCGGG AGAAGACCCG ACGGTTAAAG ACTGGCTGCA TATAAACCAG 
AGCTACGTGA ATGAGACGAA TCAGTTGTTA ATTGCGTCCG GGCGTCATCA GAGCGCGGTG 
TTTGGCGTCG ATCTGCAAAC GCAAGCGCTA CGCTTTATTT TGTCAACGCA TGAAGACTGG 
GACGACGCTT ATCAGCCTTA TCTTTTAACC CCGGTCGACA GTGAAGGTGT GGCGCTTTAT 
GACTTTAGCA AACAGGAGGA TATCGACGCG GCCGACCGTG ACTTTTGGAC TTGGGGCCAG 
CATAACGTCG TTGAAATCGC CAATAATACG CCGGGTATAG TGGAGTTTAT GGTATTTGAT 
AACGGTAACT ACCGTTCGCG TGATGACAGC AAAAGCCTGT TACCGCCGGA TAACTACAGC 
CGCATTGTCC ATTTCGTGGT GAATATGAAT GAGATGACCG TTATGCGGCC ATTTGAATAC 
GGCAAGGAGC TGGGCGCGCG TGGCTACAGT AGCTGCGTTA GCGCGAAAGC GATCCAGCAG 
AATGGCAATA TTGTGGTGCA TTTTGCCGAC TGCACGTTTG ATGAAAATGG CCGCGCCATC 
TCTTGCCAGC CTGGCGAGAG CGATATTATC GATCCGCAGG CGGGCAGCGA GGCGATGGGG 
CTGCTAATTT TACAGGAGAT TGCGCCTACG GAGAAAACCG TGCTTTTTGA AGCGACCATG 
ACGTCAGGTT ACTACAAAAA CGCGGAAACG AACGGGGAAG GCTATCGCTA CGATATTACC 
AGTTTCCGGG TGTATAAAAT GGATCTGTAC GCGTAG

Protein sequence

MNTLTTTSVV LPAPRPAINQ GIDINNEMVL NHTAIYENCL AQVTQENTVE NALMLLDPYG 
TAPLSAYAGV WSLEPAEIIV TVQDAAKTAM PVEHLYTLTA GANLLPVLGL VADTENRIVF 
SQADTPLAVY TLITQPLPPV DSAEVVLGFP IINVTQPATD ADKMAPGFYF ITHFDRYNYA 
LDQNGLVRWY VTQDYPSYNF VRIDNGHFLT TSEAKNTYLD MYEFDMMGRL HTFYNLDNQF 
HHSIWPWDSN TIVAPSEYTS GRPDDLKTNE DGVSVVDLTT GLETAYYDMA KVLDTTRVSR 
PSGTAPGEDP TVKDWLHINQ SYVNETNQLL IASGRHQSAV FGVDLQTQAL RFILSTHEDW 
DDAYQPYLLT PVDSEGVALY DFSKQEDIDA ADRDFWTWGQ HNVVEIANNT PGIVEFMVFD 
NGNYRSRDDS KSLLPPDNYS RIVHFVVNMN EMTVMRPFEY GKELGARGYS SCVSAKAIQQ 
NGNIVVHFAD CTFDENGRAI SCQPGESDII DPQAGSEAMG LLILQEIAPT EKTVLFEATM 
TSGYYKNAET NGEGYRYDIT SFRVYKMDLY A