Gene SeAg_B4344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4344
Symbol
ID	6795359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	4233273
End bp	4235063
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	48%
IMG OID	642778447
Product	arylsulfotransferase
Protein accession	YP_002149026
Protein GI	197249056
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATTTA CAAGGAAAGT CTTACCTGTA TTATGCTGCC TGTGTTTGAG CGGCAGCGTT 
TTGGCCTCAG GCGTTTTAGA CCCAAACAGG CCAATGGTCG CATCAGCAGA TGTCATTCCA 
GTACATGAAG GGCCATTAGG TATGGTCGAT GTCGCTCCCT ACGGCGGCGT TTTCCCATTA 
ACAGCAATCA TTAATAAAGC CAATCATAAT GTACAGGACG TGAAGGTTAC CGTTTTAGGG 
AAAGGGGAAA AAGGTATCCC GATCAGTTAT GATGTCGGCC CGCAGGCTAT AAATACCCAT 
GACGGCATAC CTGTATTTGG CTTGTATCCA GATTATGTCA ATAAGGTTAA AGTTGACTGG 
ACTGAAGAAG GTAAAAAACA AACTTATACG TGGTCCATTT ACGCCGCACC GGTATCATTA 
CCCTCTACTA CCGGGCAAAC TGCCGTTCTT CCTACAGTAG AACCGGTTAA AGTCGATAGC 
TCGCTTAAAA ATCGCTTATA TCTTTTTAAC CATATAACAG GGATGCCAAG AGCCGGCCAC 
ATTATGCATG TCGCAGGCGG CGCGGCGAAC TGGGATTATA CCGGTATCAA CTGGATTAGC 
GATACGAATG GCGATGTTCG CGGCTATATG AATATTGATA AATTCCGTAA CCAGGATGAT 
ATAACGCGCT TTGGTTCCAT GATGAGCTTC CATCAGGTTA ACGATGGCAA TCTTATTTTT 
GGCCAGGGTC AACGTTACTT TAAATATGAT TTCTTAGGCC GCGTTATTTC CGATAAACGA 
CTGCCAAAAG GATTTATTGA TTTTTCGCAC GCCATTACCG AAACGCCGAA AGGCACCTAC 
CTGCTGCGTG TCGCAAAAGA AAATTATCCA TTAAATGGTA AATACACCAT CAATACGGTG 
CGTGATCATA TTCTTGAAGT TGACCAGAAC GGCGATACCG TCGATTACTG GGATCTGCCA 
AAAATCCTCG ACCCCTATCG TGACGACGTT ATTCTGGCGA TGGATCAGGG AGCGGTATGT 
TTGAGCGTCG ATGCCGAACA TTCCGGTCAG GTCATGACCA AAGAGCAGCT TGCAAAACAA 
CCCTTCGGCG ATATCGCGGG TTCCGGCCCG GGCCGCAACT GGGCGCATGT TAACTCCGTC 
AGCTACGATC CTCGCGACGA CAGCATTATC ATTAGCTCGC GCCACCAGTC TGCCATCATC 
AAAATTGGCC GCGATAAAAA AGTGAAATGG ATACTTTCCG ATCCATCCGG CTGGAAAGGC 
GAACTGGCGA AAAAAGTGCT GAAACCCGTA GACAGCAATG GTAAACCGCT AACCTGCGAA 
GCGCACCACT GCGACGGTGG ATTTGACTGG ACATGGACAC AACATACCGG TTGGTTAGTG 
CCATCCAAAA GCACCGGAGG TAAAATCGTC GTGACCGCCT TTGATAACGG CGATGCGCGC 
GGCATGGAAC AACCGGCCAT GCCATCAATG AAATATTCCC GCGGCGTGGA ATATCAAATT 
GACGAAAAAA ATATGACGGT TTCCCAAATG TGGGAATATG GTAAAGAGCG CGGTTTTGAC 
TGGTACAGCG CCATTACTTC CGTCACGGAA TATCGCCCGG AAACCAAAAC GATGTTCATG 
TACTCGGCTA CAGCGGGAAT GAGCGGTACA AAACCGATCG TTTCCGTTCT GGATGAAGTC 
AAAGACGGCA CTCAGGATGT GATGCTGGAG CTAAAAGTAC ACAGTAACCG TGCCGGTATG 
CTGGGTTATC GGGCGCTGAT TATCGATCCA GAGCAGATGT TTAAAAAATA A

Protein sequence

MLFTRKVLPV LCCLCLSGSV LASGVLDPNR PMVASADVIP VHEGPLGMVD VAPYGGVFPL 
TAIINKANHN VQDVKVTVLG KGEKGIPISY DVGPQAINTH DGIPVFGLYP DYVNKVKVDW 
TEEGKKQTYT WSIYAAPVSL PSTTGQTAVL PTVEPVKVDS SLKNRLYLFN HITGMPRAGH 
IMHVAGGAAN WDYTGINWIS DTNGDVRGYM NIDKFRNQDD ITRFGSMMSF HQVNDGNLIF 
GQGQRYFKYD FLGRVISDKR LPKGFIDFSH AITETPKGTY LLRVAKENYP LNGKYTINTV 
RDHILEVDQN GDTVDYWDLP KILDPYRDDV ILAMDQGAVC LSVDAEHSGQ VMTKEQLAKQ 
PFGDIAGSGP GRNWAHVNSV SYDPRDDSII ISSRHQSAII KIGRDKKVKW ILSDPSGWKG 
ELAKKVLKPV DSNGKPLTCE AHHCDGGFDW TWTQHTGWLV PSKSTGGKIV VTAFDNGDAR 
GMEQPAMPSM KYSRGVEYQI DEKNMTVSQM WEYGKERGFD WYSAITSVTE YRPETKTMFM 
YSATAGMSGT KPIVSVLDEV KDGTQDVMLE LKVHSNRAGM LGYRALIIDP EQMFKK