Gene SeHA_C1414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1414
Symbol
ID	6487657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	1370270
End bp	1371466
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	50%
IMG OID	642741646
Product	chondroitin sulfate/heparin utilization regulation protein
Protein accession	YP_002045293
Protein GI	194448320
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.634455
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	0.453788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAG TATTCAATAC CGTAGCCAAG CCCAGCGGCA GTCTGTGTAA CTTATCCTGC 
AAGTACTGTT TCTATCTTGA TAAACCCCGG GGGCAGCGCG TCATGTCTGA CGATGCGCTG 
GAGACGTATA TCCGCCGGGT AATTGATGAT ACGCCATCCT CAGAGGTCTC GTTTTGCTGG 
CAGGGGGGAG AGCCGACGCT ATGCGGTCTT TCTTTTTACC AAAAAGTGGT GCGCTTGCAG 
CAACGCTATG CCAACGGCAA AACTATCTAC AACAGTCTGC AAACCAATGG CGTATTAATC 
AATGAAGAGT GGGCGGCTTT CTTTGCGCAG CACCAGTTCC TGATTGGTAT ATCGATTGAT 
GGGCCGCAAG TCGTTCATGA TAATTACCGG AAAACGCCGT CAGGGCGGGC GTCTTTTTCC 
CGAGTCGTTA ATGCTATCCG CCTTCTGCAG GCAAATGATG TCGAGTTCAA CACGCTCACT 
GTCGTGAATG ATGCGTCATG CCGTCATGGC AACGCTATTT ATCATTTTTT GACGCAGGAA 
CTGGAAAGTA AACACCTGCA ATTTATTCCC ATTGTTGAGC CGCTCGCACA AAAAGCGCAG 
CGTTCTTTGA CGTTATCTGA CAATGAGGAT TCGCCTTCGC TGATGCCCTT TTCCGTCACG 
CCTGAAGGGT GGGGGGCCTT TATGTGCGAT GTTTTTGATC AATGGATACG TCACGATGTC 
GGACGCATAT TCGTACAGCT TTTTGATAAC TTACTTGGCG TCTGGATGGG GGAGCCCGCC 
ACGCTTTGTA CGATGCAGTC GACCTGCGGG CAAAGTTTGC TGGTGGAGCA GAATGGCGAC 
GTGTTTAGCT GCGACCATTT TGTTTTTCCC GCCTATAAAC TGGGCAATCT GCAGCAACAC 
TCTTTAGAAG AAATGGCGGC CTCTCCTTTT CAGCAGCAGT TTGGCGCGGC TAAAGCAAAC 
CTTTCCTCAC GCTGCCAGAA CTGTACGTGG CGCTTTGCCT GTCACGGCGG TTGTCCGAAA 
CATCGAATTT GTATGGACGG CGGCGAACGG CAAAATTATC TCTGTAAAGG ATATCTGGAG 
TTCTTTCAAC ATGTGACGCC CTATATGAAT GTGATGCGTC AATTATTACT GAATCAGCGA 
CCCGCCGCGC ATATTACCCG CATCGTCGAC ATGATTGCGG ATGACGTTCG TCAGTGA

Protein sequence

MSIVFNTVAK PSGSLCNLSC KYCFYLDKPR GQRVMSDDAL ETYIRRVIDD TPSSEVSFCW 
QGGEPTLCGL SFYQKVVRLQ QRYANGKTIY NSLQTNGVLI NEEWAAFFAQ HQFLIGISID 
GPQVVHDNYR KTPSGRASFS RVVNAIRLLQ ANDVEFNTLT VVNDASCRHG NAIYHFLTQE 
LESKHLQFIP IVEPLAQKAQ RSLTLSDNED SPSLMPFSVT PEGWGAFMCD VFDQWIRHDV 
GRIFVQLFDN LLGVWMGEPA TLCTMQSTCG QSLLVEQNGD VFSCDHFVFP AYKLGNLQQH 
SLEEMAASPF QQQFGAAKAN LSSRCQNCTW RFACHGGCPK HRICMDGGER QNYLCKGYLE 
FFQHVTPYMN VMRQLLLNQR PAAHITRIVD MIADDVRQ