Gene SeSA_A4174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4174
Symbol
ID	6519377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	4050751
End bp	4052094
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	54%
IMG OID	642749140
Product	chondroitin sulfate/heparin utilization regulation protein
Protein accession	YP_002116892
Protein GI	194734759
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCTCATG GCGCTGGTGA ACCTTATTTT TTAACGGAGA TGTCTGACAT GGCGGTAGCA 
GGTTGTCACG TAATGACCAA ACCCGGCGGC GCGATCTGCA ATATTGATTG CACATATTGC 
TTCTATCTTG AAAAAGAGGC GCTGTACCCG GAACGCAATA AAAACTGGCG AATGTCGGAC 
GAGACGCTGG AACAGTTTAT ACGCCAGCAT ATTGCCGCGC AGAGTGGCGA CCGCATTGAC 
TTTGCCTGGC AGGGCGGCGA ACCGACCATG ATGGGGCTAC CGTTTTTCCG CCGGGTTGTC 
GCATTATGTG AAAAGTACGG CGATGGGCGA AAAATCACTC ATGCGTTGCA GACGAACGGC 
ATCCTGGTGA ATGACGAGTG GGCGCGCTTT TTCGCTGAAC AGCATTTTCT CATCGGTCTC 
TCTATCGACG GCCCGGCGTC GTTACACAAC CACTATCGGC TTAATCGTGC TGGAAAAGGA 
ACTCATGAAC AGGTCGTCGC AGCAATGGCG CGGCTTAAAG CGCACCATGT CGACTTTAAT 
ACCTTAACCG TCGTGGGAAA ACATAACGTC GGTCATGCAG CAGACGTCTA CGAATTTCTT 
CTGGCGGCGG GATCGCGTTT TATTCAGTTT ATCCCGCTGG TGGAGCGAAT GAGCACCGAT 
AACTCATCGG TACTTAATCT GGTGATGCCC GGCGAAAGCG CGGCGACGCT GGCGCCATGG 
ACGGTACCGT CGTGGCAATA TGGCGAATTT CTCAACCAGA TCTTTGATAT CTGGGTTCGT 
CGCGACGTAG ACCGCGTCTA TGTGCAGATG TTTGACGTGG CGTTAGCCGC CTGGACGGCG 
CAGAAGCCGA TACTGTGTGT GCATTCCGAG ACTTGTGGAC ATGCCTTCGC GTTGGAGTCG 
AACGGCGATC TCTACAACTG CGACCACTTT GTCTACCCGG AGCATCTGCT GGGGAATATC 
CACCAGCACA GCATCAAAAC CTTAAATAAT AGCGAGCGGG CTATTGCGTT TGGCGAGGCC 
AAGCGGGAGA CCCTGACCGC CGATTGTCGT CGCTGTGACT ACCGCTTTGC GTGTCATGGC 
GGCTGTCCGA AGCATCGCTT TGCCGTCTCG CCGTCCGGTC ATCCTGCGCA TAATTACTTG 
TGTGCGGGCT ATAAGCATTT TTTCCAGCAC GTTACGCCGT ATATGAATGT CTGGCGGGAG 
CTGCTGGCGC AAGGCTATCC GATGGCATCG ATCATGCGCT GGCTGGCGCA GGACGCGCGT 
AAAGATACAG GAGCCGTCAG TCGTAACCAT CTCTGTCCCT GCGGCAGCGG CAAAAAATAT 
AAAAAATGCT GTGGTAAAGC ATAG

Protein sequence

MSHGAGEPYF LTEMSDMAVA GCHVMTKPGG AICNIDCTYC FYLEKEALYP ERNKNWRMSD 
ETLEQFIRQH IAAQSGDRID FAWQGGEPTM MGLPFFRRVV ALCEKYGDGR KITHALQTNG 
ILVNDEWARF FAEQHFLIGL SIDGPASLHN HYRLNRAGKG THEQVVAAMA RLKAHHVDFN 
TLTVVGKHNV GHAADVYEFL LAAGSRFIQF IPLVERMSTD NSSVLNLVMP GESAATLAPW 
TVPSWQYGEF LNQIFDIWVR RDVDRVYVQM FDVALAAWTA QKPILCVHSE TCGHAFALES 
NGDLYNCDHF VYPEHLLGNI HQHSIKTLNN SERAIAFGEA KRETLTADCR RCDYRFACHG 
GCPKHRFAVS PSGHPAHNYL CAGYKHFFQH VTPYMNVWRE LLAQGYPMAS IMRWLAQDAR 
KDTGAVSRNH LCPCGSGKKY KKCCGKA