Gene SeSA_A4069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4069
Symbol
ID	6517104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	3943105
End bp	3944895
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	56%
IMG OID	642749038
Product	HTH-type transcriptional regulator SgrR
Protein accession	YP_002116800
Protein GI	194735618
COG category	[R] General function prediction only
COG ID	[COG4533] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTCATTC CCGTTCGGGA AATTTCACCT TTTATGACAA CCCGGCACAC TGAACAAAAA 
TATTTAAAGC TACTCCAGCA CTATGGCGAC AAGCCTGTTA GCGTGACATT ACAGGAGCTG 
GCGGATGTGT TGTTCTGCAC CCGGCGGCAT ATGCGTAATC TGTTGCTTCA GATGCAGGAG 
GCAAAGTGGC TCATCTGGCA ATCACAGGCC GGACGTGGGC ATCGCGCCCG GCTTCACCTG 
CGCTATAAAC CAGAACAGCT GTTAAGCGAA AAGGCGGAGC AGTTGCTGGA GTCTGGTCAT 
GTTGATCAGG CCATTCAACT GCTGGGTAAA AATAAGCACC AGGTGGCGCA ACTGTTGCGT 
TCAAAGCTGG GCTATAGCGT GCGGGCAGAC TATCAGCGGC TGTGCATCCC CTATTACCGG 
ACAATGCCGT CGCTATGCCC CGGCATACCG TTGCGTCGCT CTGAGCAGCA TCTGGTCAGG 
CAGATTTTTA GCGGCCTGAC GCGCATAAAT GAGGAAAAAG GTGAAATCGA AGCCGATCTT 
GCCCACCACT GGCGGCAGAT TGATCCACTG CGCTGGCGTT TTTATCTGCG CCCCGCCGTC 
CTCTGGCATG ATGGTCAGGA GCTGACGATC GACGCGGTTA TCGCTTCACT GACCCGCAGC 
GCTAAGCTGC CGTTGTTCTC GCACTTGCAG ACCATTCAGG CCACCGGGCC GCTGAGTCTT 
GAAATTACGC TGGCGCACCC GGATAACCGA CTGCCGCTGC TGCTCAGTCA TATTGATGCC 
ATGATCCTAC CGCCTGATCA TACACAACGC GCTGATTTCC CGGCACATCC TGTGGGGACT 
GGCCCTTATG AGGTGGTGGA AAACAATGGC TTTCATCTGC AAATGAAGGC CTTTGACCAC 
TACTTTGGTC TGCGCGGGCT GCTGGATGAA GTGGAGGTCT TTATCTGGCC GAATTTAACG 
GAGACAGACA ACCTGGCGGA ATCGCTGTCG GATAACGACA CGGCAGCCTG GCTCAGCTCC 
AGCCTGAGCG ATGAGGATTA CGTTTCCGGA CGGCTTAGCC AGGTAGCGGG CAAACCTTCT 
GACAACCTGC GCGAGATGTT TCTTGAGCGT GGAGGCTATT TTTTATTATG CGACAGCCGC 
TCCCCGCACT GGCATACCGC CGAACATCGC CGCTGGCTGC GGGAAACACT CAGCCCTTAC 
GCCATACTCC AGCATCTGAG TGAGGCAATT CGCCCCTTCT GGGTACCGGG CGGCAGCCTG 
CTGTCCTCCT GGTTTCATAC TATTGAGGCG GGCCCGGCCT GTTCACCTTT TATCTCGTCG 
TCGCCCTACG CGAAACTGCG TCTGGCCTAT CACGATCAGC ACCCTGAATT TCCAATGCTT 
CTGGATATCA TGCAAAAGAT CATGCGCCAG CAGGGCATTT TACTTGAGGG CGTTGCACTG 
AATTATGATG ACTGGGCAAG CGGCAAGGCC GAGGTTGATC TCTGGCTGGG GACAGTTAAT 
TTCCCCATTC CCGAAGAGTG GAACGTCGGT ACATGGCTGC TGGGCTCCCC TTTACTGCGC 
CACGCCATCA GCGGTGGGGA TGATGCGCTG CTGGCCCAAT GGGAAACCCA GTGGCATGCC 
GAAACCATCA GCGCGGAACA ACTGGTCAGG GAAACCACCC GTTCAGGCTG GCTACAACCG 
CTTTTTCACC ACTGGATGCG ACTCAAAGGC CCCGACCGGG CCAGGGGGAT CCACCTGAAT 
AACCTGGGGT GGTTTGATTT CCGATCCACC TGGATTGAGC CAGGGCCTTA A

Protein sequence

MLIPVREISP FMTTRHTEQK YLKLLQHYGD KPVSVTLQEL ADVLFCTRRH MRNLLLQMQE 
AKWLIWQSQA GRGHRARLHL RYKPEQLLSE KAEQLLESGH VDQAIQLLGK NKHQVAQLLR 
SKLGYSVRAD YQRLCIPYYR TMPSLCPGIP LRRSEQHLVR QIFSGLTRIN EEKGEIEADL 
AHHWRQIDPL RWRFYLRPAV LWHDGQELTI DAVIASLTRS AKLPLFSHLQ TIQATGPLSL 
EITLAHPDNR LPLLLSHIDA MILPPDHTQR ADFPAHPVGT GPYEVVENNG FHLQMKAFDH 
YFGLRGLLDE VEVFIWPNLT ETDNLAESLS DNDTAAWLSS SLSDEDYVSG RLSQVAGKPS 
DNLREMFLER GGYFLLCDSR SPHWHTAEHR RWLRETLSPY AILQHLSEAI RPFWVPGGSL 
LSSWFHTIEA GPACSPFISS SPYAKLRLAY HDQHPEFPML LDIMQKIMRQ QGILLEGVAL 
NYDDWASGKA EVDLWLGTVN FPIPEEWNVG TWLLGSPLLR HAISGGDDAL LAQWETQWHA 
ETISAEQLVR ETTRSGWLQP LFHHWMRLKG PDRARGIHLN NLGWFDFRST WIEPGP