Gene SeSA_A1381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A1381
Symbol
ID	6517543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	1331904
End bp	1333100
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	50%
IMG OID	642746499
Product	chondroitin sulfate/heparin utilization regulation protein
Protein accession	YP_002114304
Protein GI	194736621
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.238344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAG TATTCAATAC CGTAGCCAAG CCCAGCGGCA GTCTGTGTAA CTTATCCTGC 
AAGTACTGTT TCTATCTTGA TAAACCCCGG GGCCAGCGCG TCATGTCTGA CGATGTGCTG 
GAGACGTATA TCCGCCGGGT AATTGATGAT ACGCCATCCT CAGAGGTCTC GTTTTGTTGG 
CAGGGGGGAG AGCCGACGCT ATGCGGTCTT TCTTTTTACC AAAAAGTGGT GCGCTTGCAG 
CAACGCTATG CCAACGGCAA AACTATTTAC AACAGTCTGC AAACCAATGG CGTATTAATC 
AATGAAGAAT GGGCGGCTTT CTTTGCGCAG CACCAGTTCC TGATTGGTAT ATCGATTGAT 
GGGCCGCAAG TCGTTCATGA TAATTACCGG AAAACGCCGT CAGGGCGGGC GTCTTTTTCC 
CGTGTCGTTA ATGCTATCCG CCTTCTGCAG GCAAATGATG TCGAGTTCAA CACGCTCACT 
GTCGTGAATG ATGTGTCATG CCGTCATGGC AACGCTATTT ATCATTTTTT GACGCAGGAA 
TTGGAAAGTA AACACCTGCA ATTTATTCCC ATTGTTGAGC CGCTCGCGCA AAAAACGCAG 
CGTTCTTTGA CGTTATCTGA CAATGAGGAT TCGCCTTCGC TGATGCCCTT TTCCGTCACG 
CCTGAAGGGT GGGGCGCCTT TATGTGCGAT GTTTTTGATC AATGGATACG TCACGATGTC 
GGACGCATAT TCGTACAGCT TTTTGACAAC TTACTTGGCG TCTGGATGGG GGAGCCCGCC 
ACGCTTTGTA CGATGCAGTC GACCTGCGGG CAAAGTTTGC TGGTGGAGCA GAATGGCGAC 
GTGTTTAGCT GTGACCATTT TGTTTTTCCC GCCTATAAAC TGGGCAATCT GCAGCAACAC 
TCTTTAGAAG AAATGGCGGC TTCTTCTTTT CAGCAGCAGT TTGGCGCGGC TAAAGCAAAC 
CTTTCCTCAC GCTGCCAGAA CTGTACGTGG CGCTTTGCCT GTCACGGCGG TTGTCCGAAA 
CATCGAATTT GCATGGACGG CGGCGAACGG CAAAATTATC TCTGTAAAGG ATATCTGGAG 
TTCTTTCAAC ATGTGACGCC CTATATGAAT GTGATGCGTC AATTATTACT GAATCAGCGA 
CCCGCCGCGC ATATTACCCG CATCGTCGAC ATGATTGCGG ATGACGTTCG TCAGTGA

Protein sequence

MSIVFNTVAK PSGSLCNLSC KYCFYLDKPR GQRVMSDDVL ETYIRRVIDD TPSSEVSFCW 
QGGEPTLCGL SFYQKVVRLQ QRYANGKTIY NSLQTNGVLI NEEWAAFFAQ HQFLIGISID 
GPQVVHDNYR KTPSGRASFS RVVNAIRLLQ ANDVEFNTLT VVNDVSCRHG NAIYHFLTQE 
LESKHLQFIP IVEPLAQKTQ RSLTLSDNED SPSLMPFSVT PEGWGAFMCD VFDQWIRHDV 
GRIFVQLFDN LLGVWMGEPA TLCTMQSTCG QSLLVEQNGD VFSCDHFVFP AYKLGNLQQH 
SLEEMAASSF QQQFGAAKAN LSSRCQNCTW RFACHGGCPK HRICMDGGER QNYLCKGYLE 
FFQHVTPYMN VMRQLLLNQR PAAHITRIVD MIADDVRQ