Gene SNSL254_A1398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1398
Symbol
ID	6483745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1367195
End bp	1368391
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	50%
IMG OID	642736790
Product	chondroitin sulfate/heparin utilization regulation protein
Protein accession	YP_002040544
Protein GI	194444460
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.00310802
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCATAG TATTCAATAC CGTAGCCAAG CCCAGCGGCA GTCTGTGTAA CTTATCCTGC 
AAGTACTGTT TCTATCTTGA TAAACCCCGG GGGCAGCGCG TCATGTCTGA CGATGCGCTG 
GAGACGTATA TCCGCCGGGT AATTGATGAT ACGCCATCCT CAGAGGTCTC GTTTTGCTGG 
CAGGGGGGAG AGCCGACGCT ATGCGGTCTT TCTTTTTACC AAAAAGTGGT GCGCTTGCAG 
CAACGCTATG CCAACGGCAA AACTATCTAC AACAGTCTGC AAACCAATGG CGTATTAATC 
AATGAAGAGT GGGCGGCTTT CTTTGCGCAG CACCAGTTCC TGATTGGTAT ATCGATTGAT 
GGGCCGCAAG TCGTTCATGA TAATTACCGG AAAACGCCGT CAGGGCGGGC GTCTTTTTCC 
CGAGTCGTTA ATGCTATCCG CCTTCTGCAG GCAAATGATG TCGAGTTCAA CACGCTCACT 
GTCGTGAATG ATGCGTCATG CCGTCATGGC AACGCTATTT ATCATTTTTT GACGCAGGAA 
CTGGAAAGTA AACACCTGCA ATTTATTCCC ATTGTTGAGC CGCTCGCACA AAAAGCGCAG 
CGTTCTTTGA CGTTATCTGA CAATGAGGAT TCGCCTTCGC TGATGCCCTT TTCCGTCACG 
CCTGAAGGGT GGGGGGCCTT TATGTGCGAT GTTTTTGATC AATGGATACG TCACGATGTC 
GGACGCATAT TCGTACAGCT TTTTGATAAC TTACTTGGCG TCTGGATGGG GGAGCCCGCC 
ACGCTTTGTA CGATGCAGTC GACCTGCGGG CAAAGTTTGC TGGTGGAGCA GAATGGCGAC 
GTGTTTAGCT GCGACCATTT TGTTTTTCCC GCCTATAAAC TGGGCAATCT GCAGCAACAC 
TCTTTAGAAG AAATGGCGGC CTCTCCTTTT CAGCAGCAGT TTGGCGCGGC TAAAGCAAAC 
CTTTCCTCAC GCTGCCAGAA CTGTACGTGG CGCTTTGCCT GTCACGGCGG TTGTCCGAAA 
CATCGAATTT GTATGGACGG CGGCGAACGG CAAAATTATC TCTGTAAAGG ATATCTGGAG 
TTCTTTCAAC ATGTGACGCC CTATATGAAT GTGATGCGTC AATTATTACT GAATCAGCGA 
CCCGCCGCGC ATATTACCCG CATCGTCGAC ATGATTGCGG ATGACGTTCG TCAGTGA

Protein sequence

MSIVFNTVAK PSGSLCNLSC KYCFYLDKPR GQRVMSDDAL ETYIRRVIDD TPSSEVSFCW 
QGGEPTLCGL SFYQKVVRLQ QRYANGKTIY NSLQTNGVLI NEEWAAFFAQ HQFLIGISID 
GPQVVHDNYR KTPSGRASFS RVVNAIRLLQ ANDVEFNTLT VVNDASCRHG NAIYHFLTQE 
LESKHLQFIP IVEPLAQKAQ RSLTLSDNED SPSLMPFSVT PEGWGAFMCD VFDQWIRHDV 
GRIFVQLFDN LLGVWMGEPA TLCTMQSTCG QSLLVEQNGD VFSCDHFVFP AYKLGNLQQH 
SLEEMAASPF QQQFGAAKAN LSSRCQNCTW RFACHGGCPK HRICMDGGER QNYLCKGYLE 
FFQHVTPYMN VMRQLLLNQR PAAHITRIVD MIADDVRQ