Gene SeHA_C0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0039
Symbol
ID	6490093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	38492
End bp	39688
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	49%
IMG OID	642740330
Product	chondroitin sulfate/heparin utilization regulation protein
Protein accession	YP_002044004
Protein GI	194451770
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGGA AAAGCTGTCA GGTAATGATC AAACCGACCG GGTCGGTGTG TAATCTTGAT 
TGTAAATATT GCTTCTATCT GGAAAAGGAA ATGCTCTATC CCGATAGAAA AAACCATTAC 
AAGATGACGG AAGAAACGCT GGCGTTGTTT GTGCAACAGC ATATTGCGGC GCAGGACGTG 
GATGAAGTGA TTTTTGCGTG GCAGGGTGGG GAACCGACGC TGATGGGGCT GCCATTTTAC 
CGCCAGGCTG TAGCGCTCCA GCAACGTTAT GCTAATGGAA AAGCCATCGT TAATACTTTT 
CAGACCAATG GCATTCTGAT TGATGATGAA TGGGCGAGAT TCTTCAGGGC GCATGACTTT 
CTGGTTGGTA TTTCGATTGA TGGCGATGCG GCGCTGCACG ACGAATGGCG AGTAACTCGC 
GCAGGGCAAC CTACCCATCA TAAAGTTGAA CAGGCGATAA AATGCCTGGC GAGTCATGGC 
GTTGAATTTA ATACTCTCAC GGTGGTGAGT CAGAGCAATA TGCTGCACCC GCAGCGGGTT 
TATGCGTATC TGAAATCTAT CGGCAGCCGC TATATGCAGT TTATTCCGCT AGTGGAAAGA 
GCGGCAAATA AAGACGGAAT GCTGGCGCAT CCGCAGGACG AGCAAACCGC AGTAACCCCC 
TGGTCAGTGG ACGGATTACA GTTTGGAAAG TTCCTGAATG CCATTTTTGA TATCTGGATC 
CGCGAAGATA TTGGTGATAT CGGCATTCAA CTCTTTGAAC AAACGCTGGC GGCATGGTGT 
GGACTCCCCC CTCAGGTTTG CGTTTTTGCG CCCGTTTGCG GTAGCGCTTT TGCAATGGAA 
ATGAATGGCG ATGTGTATAA CTGCGATCAT TTCGTTTACC CGCAATATAA GCTCGGCAAT 
ATTAACGACA CGCCGCTGCG TCAGATGAAT AATAGCGCGC AAAACCAGCA GTTTGGTCTC 
GATAAAAGCC GCACGATGGC GCAGGAATGC CATACCTGCC CGTGGCAATT CGCCTGTTAT 
GGCGGTTGCC CTAAACACCG CTTTTTGCCT TCGGCTTGCG GACCGATGAA GCAAAACTAT 
CTTTGTGCCG GCTATCAGTG CTTTTTCTCT CATACCGCGC CAATGATGAA AGCGATGAAA 
ACCCTTTACG TAAATAACCT GTCACCGGCG GAGATCCGGT CTGTTTTTTT TAAGTAA

Protein sequence

MQRKSCQVMI KPTGSVCNLD CKYCFYLEKE MLYPDRKNHY KMTEETLALF VQQHIAAQDV 
DEVIFAWQGG EPTLMGLPFY RQAVALQQRY ANGKAIVNTF QTNGILIDDE WARFFRAHDF 
LVGISIDGDA ALHDEWRVTR AGQPTHHKVE QAIKCLASHG VEFNTLTVVS QSNMLHPQRV 
YAYLKSIGSR YMQFIPLVER AANKDGMLAH PQDEQTAVTP WSVDGLQFGK FLNAIFDIWI 
REDIGDIGIQ LFEQTLAAWC GLPPQVCVFA PVCGSAFAME MNGDVYNCDH FVYPQYKLGN 
INDTPLRQMN NSAQNQQFGL DKSRTMAQEC HTCPWQFACY GGCPKHRFLP SACGPMKQNY 
LCAGYQCFFS HTAPMMKAMK TLYVNNLSPA EIRSVFFK