Gene SeAg_B4197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4197
Symbol
ID	6794550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	4092154
End bp	4093449
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	54%
IMG OID	642778308
Product	chondroitin sulfate/heparin utilization regulation protein
Protein accession	YP_002148892
Protein GI	197251257
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGTAG CAGGTTGTCA CGTAATGGCC AAACCCGGCG GCGCGATCTG CAATATTGAT 
TGCACATATT GCTTCTATCT TGAAAAAGAG GCGCTGTACC CGGAACGCAA TAAAAACTGG 
CGGATGTCGG ACGAGACGCT GGAACAATTT ATACGCCAGC ATATTGCCGC GCAGAGTGGC 
GACCGCATTG ACTTTGCCTG GCAGGGCGGC GAACCGACCA TGATGGGACT ACCGTTTTTC 
CGTCGGGTTG TCGCATTATG TGAAAAGTAC GGCGATGGGC GAAAAATCAC TCATGCGTTG 
CAGACGAACG GCATCCTGGT GAATGACGAG TGGGCGCGCT TTTTCGCTGA ACAGCATTTT 
CTCATCGGTC TCTCTATCGA CGGTCCGGCG TCGTTACACA ACCACTATCG GCTTAATCGC 
GCTGGAAAAG GAACTCATGA ACAGGTCGTC GCAGCCATGG CGCGGCTTAA AGCGCACCAT 
GTCGACTTTA ATACCTTAAC CGTCGTGGGA AAACATAACG TCGGTCATGC AGCAGACGTC 
TACGAATTTC TTCTGGCGGC GGGATCGCGT TTTATTCAGT TTATCCCGCT GGTAGAGCGA 
ATGAGCACCG ATAACTCATC GGTACTTAAT CTGGTGATGC CCGGCGAAAG CGCGGCAAAG 
CTGGCGCCAT GGACGGTACC GTCGTGGCAA TATGGCGAAT TTCTCAACCA GATCTTTGAT 
ATCTGGGTTC GTCGCGACGT AGACCGCGTC TATGTGCAGA TGTTTGACGT GGCGTTAGCC 
GCCTGGACGG CGCAGCAGCC GGTACTGTGT GTACATTCCG AGACTTGTGG ACATGCCTTC 
GCGTTGGAGT CGAACGGCGA TCTCTACAAC TGCGACCACT TTGTCTACCC GGAACATCTG 
CTGGGGAATA TCCACCAGCA CAGCATCAAA ACCTTAAATA ATAGCGAGCG GGCTATTGTG 
TTTGGCGAGG CCAAGCGGGA GACCCTGACC GCCGATTGTC GTCGCTGTGA CTACCGCTTT 
GCGTGTCATG GCGGCTGTCC GAAGCATCGC TTTGCCGTCT CGCCGTCCGG TCATCCTGCG 
CATAATTACT TGTGTGCGGG CTATAAGCAT TTTTTCCAGC ACGTTACGCC GTATATGAAT 
GTCTGGCGGG AGCTGCTGGC GCAAGGCTAT CCGATGGCAT CGATCATGCG CTGGCTGGCG 
CAGGACGCGC GTAAAGACAC AGGAGCCGTC AGTCGTAACC ATCTCTGTCC CTGCGGCAGC 
GGCAAAAAAT ATAAAAAATG CTGTGGTAAA GCATAG

Protein sequence

MAVAGCHVMA KPGGAICNID CTYCFYLEKE ALYPERNKNW RMSDETLEQF IRQHIAAQSG 
DRIDFAWQGG EPTMMGLPFF RRVVALCEKY GDGRKITHAL QTNGILVNDE WARFFAEQHF 
LIGLSIDGPA SLHNHYRLNR AGKGTHEQVV AAMARLKAHH VDFNTLTVVG KHNVGHAADV 
YEFLLAAGSR FIQFIPLVER MSTDNSSVLN LVMPGESAAK LAPWTVPSWQ YGEFLNQIFD 
IWVRRDVDRV YVQMFDVALA AWTAQQPVLC VHSETCGHAF ALESNGDLYN CDHFVYPEHL 
LGNIHQHSIK TLNNSERAIV FGEAKRETLT ADCRRCDYRF ACHGGCPKHR FAVSPSGHPA 
HNYLCAGYKH FFQHVTPYMN VWRELLAQGY PMASIMRWLA QDARKDTGAV SRNHLCPCGS 
GKKYKKCCGK A