Gene SeSA_A0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A0041
Symbol
ID	6515709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	41722
End bp	42912
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	50%
IMG OID	642745216
Product	chondroitin sulfate/heparin utilization regulation protein
Protein accession	YP_002113048
Protein GI	194735938
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0795005
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTTTG GGAAAAGTTG TCAGGTCATG GTTAAACCAA CCGGATCGGT GTGTAACCTT 
GACTGCAAGT ACTGTTTTTA TCTGGAGAAA GAAAAGCTCT ATCCGGATCG AAAAAACCAT 
TACAAAATGT CGGAAGAGAC CCTCGAACTC TTCATCAGGC AGCAGATTGC CGCACAGGAT 
ATTGATGAGG TCATTTTTGC GTGGCAGGGC GGGAAACCCA CATTAATGGG CATCCCGTTT 
TATCGTAAAG CCGTTGAATT TCAGCAGCGC TATTGTGGCG GCAAAACCAT CGTCAATACC 
TTCCAGACTA ACGGCATCCT GATCAACGAC GACTGGGCGA CCTTCTTCCG GGAGCATGAT 
TTTCTGGTTG GCGTCTCTAT TGATGGCGAT GCCGCGTTAC ACGATGAATG GCGAGTGACG 
CGCTCCGGAA AGCCGACGCA TGAAAAAGTA GAAAATGCGG TGCGTTGTCT GGCGCAGCAC 
GACGTAGAAT TTAATACCCT CACGGTGGTT AACCGTACCA ATATGCACCA TCCTGTTCAG 
GTCTATCGCT ACCTGAAAAG CATTGGTAGT CGCTATATGC AATTTATCCC TTTAGTTGAA 
CGCTGTGGGG AAAATGGGCT GGCGCAGCCG CAGGATAAAC ATATCGCGAT GACGCCGTGG 
TCGGTCGATA GCCTGCAATT TGGCCAGTTT CTGAATGCGG TATTTGATAT CTGGATCCGT 
GAGGATATCG GCGATATCGG CATCCAGCTA TTTGAACAGA CGCTGGCGGC CTGGTGCGGC 
CTGCCGCCGC AGGTTTGCGT TTTTGCTCCC ACCTGCGGCA GCGCGTTTGC GATGGAAATG 
AACGGCGATG TTTATAACTG CGATCACTTC GTATATCCGC AATTTAAACT GGGGAATATC 
CACCAGAAGA CGCTGCGTCA AATGAATCAG GGCGAACAAA ATCGCCAGTT CGGCAGCGAT 
AAACAGCATT CAATGGCGCA GGAGTGCCAT CGCTGTCAAT GGAAGTTTGC CTGCTATGGC 
GGCTGTCCGA AACATCGTTT TTTACCCTCC GCGTCAGGCG CAACCAATCA TAACTATCTG 
TGTGCAGGTT ATCAGGCTTT TTTCTCGCAT ACCGCGACGG CGATGAGTGC CATGCGAACC 
CTGTATGAAA AAGGCATCTC ACCTGCAGAA ATAAAGTCAA TATTTGTTTG A

Protein sequence

MMFGKSCQVM VKPTGSVCNL DCKYCFYLEK EKLYPDRKNH YKMSEETLEL FIRQQIAAQD 
IDEVIFAWQG GKPTLMGIPF YRKAVEFQQR YCGGKTIVNT FQTNGILIND DWATFFREHD 
FLVGVSIDGD AALHDEWRVT RSGKPTHEKV ENAVRCLAQH DVEFNTLTVV NRTNMHHPVQ 
VYRYLKSIGS RYMQFIPLVE RCGENGLAQP QDKHIAMTPW SVDSLQFGQF LNAVFDIWIR 
EDIGDIGIQL FEQTLAAWCG LPPQVCVFAP TCGSAFAMEM NGDVYNCDHF VYPQFKLGNI 
HQKTLRQMNQ GEQNRQFGSD KQHSMAQECH RCQWKFACYG GCPKHRFLPS ASGATNHNYL 
CAGYQAFFSH TATAMSAMRT LYEKGISPAE IKSIFV