Gene SeHA_C4307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4307
Symbol
ID	6489644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4194493
End bp	4196316
Gene Length	1824 bp
Protein Length	607 aa
Translation table	11
GC content	47%
IMG OID	642744396
Product	arylsulfotransferase
Protein accession	YP_002047990
Protein GI	194451107
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTTA AATATGCTTT AACTTCTCTC GCATTATCTG TTGCAATTTT GTCATCAGTA 
CCTTCTACTG CTTTCGCCAT CGGCGGCGCC AGCGGCGCTA AAGTGGACTA TCAGGTCCAG 
GGAAAAATTG GCGAAGTTGT TATGAACCCC TATGATATCG CGCCGCTAAC CGCCGTTATT 
CGTAATGGCG GTTACCAGTT ACGTGACGTG CATGTACGGA TTGTCCCCAA AGAAAATGGC 
CAGGAGATCG CGTATAAAGT TAATAATAAA TACCTTTTAA CGTATGGCGG TATCCCCGTC 
TTTGGTCTTT ACCCAGATTA TGTCAATACC GTTGAAGTTG AATATACAAG GATCCAGGGT 
AGTAAAACCG AAAATGTAAA AGAAAGCTAT AAAATGTATG CGCCGCCTGC CTATATTGAA 
TCGGCGGGTA CAAAAGAAGA ACAATCAGCA CTCTTTACTA TCGATGTTAA AAAGGTTTCC 
CCAGAATTTA AAGATCGCTT GTATCTTTTG AATAATACGA AAGATAAGTC TGGGAATGGA 
ACGCGTACTG TCTGGAACAA CCCTACTGGG GGTGCATTAG AATGGAACTT CACTACAGCT 
AACGCTATTA TCGACACCTC CGGTGATATT CGTTGGTTTA TGAATCCAAG TTCAATTTAT 
GATTTAAAGT CAATTTATCG TGCTGGCGTT ATGATGGGCT TTAAACAAAA CCAGGATGGC 
GCACTATCGT GGGGCTACGG TCAGCGTTAT GTGAAATACG ATATCATGGG GCGTGAAATC 
TTTAACCGCC GTCTGCCGGA TAATTATAAC GATTTTTCAC ACTCAATGGA TAACGCGGCC 
AACGGTCACT ACTTCCTGCG TGTAGCCAGC TCTAACTATA AACGCCCTGA TGGGAAAAAT 
GTTCGTACCG TGCGTGATGT GATTGCCGAA GTTGATCAGA ACGGCGTGGT AGTGGATGAA 
TGGCGTCTGT TTGATATCCT CGATCCTTAT CGTGATGTGA TAATGAAAAC CCTCGATCAG 
GGCGCTGTGT GCCTGAATAT CGACGCCAGC CAGTCCGGCC ATACGTTGAG CGAAGAAGAT 
CTGGCGGCGC TGGACTCCTC CGACAAATTC GGGGATATCG TGGGTAGTGG GGCTGGCCGC 
AACTGGGCGC ATGTCAACAG CGTCGACTAT GACAGTGAAG ATGATTCCAT CATCATCAGC 
TCCCGCCACC AGAGTGCGAT TATCAAAATC GGCCGCGATA AGAAAGTGAA GTGGATACTG 
GGTACGCCTG CTGGCTGGAA AGCGCCATTT AATGCCGCAA TTCTGACGCC AGTGGATAGC 
AAAGGCCAAA AAATTGCTTG CCAGGACAGT GGCTGCGAGG GTGACTTCGA CTGGACATGG 
ACGCAACATA CGGCCTTTAA AATTGATAGT AAGAGTAAAG GCGATATCTT ATACCTTTCC 
GCTTTCGACA ATGGCGATGG CCGCGGCTTA GAACAGCCTG CTATGCAGAG TATGAAATAC 
AGCCGCTCCG TGATTTACAA AATCGACCAG AAAAACAAGA CAGTCCAACA GATCTGGCAA 
TACGGTAAAG AGCGCGGGAA CGAGTGGTTT AGCCCGGTAA CCTCTATCAC CGAGTACCAG 
ACTGACAAGA ATTCTGTGTT CGTGTATTCC GCAACAGCAG GTGGTGCGTT TGATTTGTCG 
GTAGGCGCAT TTACCAGCTT GCCTAATCCG TATCTGGAAG AGTTCAAATG GGGAGAAAAA 
GAGCCTGCGG TCGAAATGCA AATACATGGT GCGCGTGGAT ATCAGGCTAT GCCATTTAGC 
CTGACCAAAG CGCTTACTGA GTAG

Protein sequence

MKFKYALTSL ALSVAILSSV PSTAFAIGGA SGAKVDYQVQ GKIGEVVMNP YDIAPLTAVI 
RNGGYQLRDV HVRIVPKENG QEIAYKVNNK YLLTYGGIPV FGLYPDYVNT VEVEYTRIQG 
SKTENVKESY KMYAPPAYIE SAGTKEEQSA LFTIDVKKVS PEFKDRLYLL NNTKDKSGNG 
TRTVWNNPTG GALEWNFTTA NAIIDTSGDI RWFMNPSSIY DLKSIYRAGV MMGFKQNQDG 
ALSWGYGQRY VKYDIMGREI FNRRLPDNYN DFSHSMDNAA NGHYFLRVAS SNYKRPDGKN 
VRTVRDVIAE VDQNGVVVDE WRLFDILDPY RDVIMKTLDQ GAVCLNIDAS QSGHTLSEED 
LAALDSSDKF GDIVGSGAGR NWAHVNSVDY DSEDDSIIIS SRHQSAIIKI GRDKKVKWIL 
GTPAGWKAPF NAAILTPVDS KGQKIACQDS GCEGDFDWTW TQHTAFKIDS KSKGDILYLS 
AFDNGDGRGL EQPAMQSMKY SRSVIYKIDQ KNKTVQQIWQ YGKERGNEWF SPVTSITEYQ 
TDKNSVFVYS ATAGGAFDLS VGAFTSLPNP YLEEFKWGEK EPAVEMQIHG ARGYQAMPFS 
LTKALTE