Gene SeSA_A3859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3859
Symbol
ID	6515479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	3726346
End bp	3727524
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	53%
IMG OID	642748832
Product	xylose operon regulatory protein
Protein accession	YP_002116595
Protein GI	194736118
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators [COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.897217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGATA AACGTCACCG CATCACTCTG TTATTTAACG CGAATAAAGC CTATGACCGT 
CAGGTAGTGG AGGGGGTGGG TGAATATTTA CAAGCCTCGC AATCCGAATG GGATATATTT 
ATTGAGGAAG ATTTCCGTGC CCGTATCGAT AACATTAAAG AGTGGTTAGG CGACGGCGTT 
ATTGCCGATT ACGATGATGA CGATATCGCG CAATTATTGG CCGATGTCGA CGTACCCATT 
GTCGGGGTCG GCGGTTCTTA CCATCTTGCT GAAAATTATC CCGCCGTTCA TTACATCGCC 
ACCGATAATC ATGCGCTCGT TGAAAGCGCT TTCCTGCATT TAAAAGAAAA AGGCGTTAAC 
CGCTTCGCGT TTTACGGTTT GCCCGACTCC AGCCGCAAAC ATTGGGCGGC GGAACGGGAA 
TACGCCTTTC GCCAGCTGGT CGCCGAGGAA AAATACCGCG GCGTAGTCTA TCAGGGGCTG 
GAAACCGCGC CGGAAAACTG GCAGCACGCG CAAAATCGCC TCGCCGACTG GCTTCAGACG 
CTGCCGCCGC AAACCGGCAT CATTGCCGTA ACGGATGCCC GCGCCCGTCA CGTATTGCAG 
GCCTGTGAAC ACCTGCATAT TCCGGTGCCG GAAAAACTTT GCGTTATCGG TATTGATAAC 
GAAGAGTTAA CCCGTTATCT GTCGCGCGTC GCGCTTTCCT CCGTCGCGCA GGGGGCGCGG 
CAAATGGGCT ATCAGGCGGC GAAGCTGCTG CACCGTTTGC TGGCGCGCGA AGAGATGCCG 
TTACAGCGCA TTCTGGTGCC GCCGGTGCGC GTCATTGCGC GCCGCTCGAC AGACTATCGC 
TCCCTGACCG ATCCGGCGGT TATCCAGGCG ATGCACTTTA TTCGTAACCA TGCCTGTAAG 
GGCATTAAAG TCGAGCAGGT GCTGGATGCG GTTGGGATTT CACGTTCAAA CCTGGAAAAA 
CGTTTTAAGG AAGAAGTTGG CGAGACGATA CATGCGCTGA TCCACGCCGA AAAGCTGGAA 
AAAGCGCGTA GTTTGTTGAT TTCTACCACG TTGGCGATAA ACGAAATTTC GCAAATGTGC 
GGCTACCCGT CACTGCAATA TTTCTATTCG GTGTTTAAAA AGGAGTACGT CACTACGCCT 
AAGGAGTATC GCGACCAGCA TAGTGAAGCG TTGTTGTAG

Protein sequence

MFDKRHRITL LFNANKAYDR QVVEGVGEYL QASQSEWDIF IEEDFRARID NIKEWLGDGV 
IADYDDDDIA QLLADVDVPI VGVGGSYHLA ENYPAVHYIA TDNHALVESA FLHLKEKGVN 
RFAFYGLPDS SRKHWAAERE YAFRQLVAEE KYRGVVYQGL ETAPENWQHA QNRLADWLQT 
LPPQTGIIAV TDARARHVLQ ACEHLHIPVP EKLCVIGIDN EELTRYLSRV ALSSVAQGAR 
QMGYQAAKLL HRLLAREEMP LQRILVPPVR VIARRSTDYR SLTDPAVIQA MHFIRNHACK 
GIKVEQVLDA VGISRSNLEK RFKEEVGETI HALIHAEKLE KARSLLISTT LAINEISQMC 
GYPSLQYFYS VFKKEYVTTP KEYRDQHSEA LL