Gene SeAg_B4085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4085
Symbol
ID	6793652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	3984762
End bp	3986552
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	56%
IMG OID	642778201
Product	HTH-type transcriptional regulator SgrR
Protein accession	YP_002148795
Protein GI	197251135
COG category	[R] General function prediction only
COG ID	[COG4533] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTCATTC CCGTTCGGGA AATTTCACCT TTTATGACAA CCCGGCACAC TGAACAAAAA 
TACTTAAAGC TACTCCAGCA CTATGGCGAC AAGCCTGTTA GCGTGACGCT ACAGGAGCTG 
GCGGATGTGT TGTTCTGCAC CCGGCGGCAT ATGCGTAATC TGTTGCTTCA GATGCAGGAG 
GCAAAGTGGC TCATCTGGCA ATCACAGGCC GGACGTGGGC ATCGCGCCCG GCTTCACCTG 
CGCTATAAAC CAGAACAGCT GTTAAGCGAA AAGGCGGAGC AGTTGCTGGA GTCTGGTCAT 
GTTGATCAGG CCATTCAACT GCTGGGTAAA AATAAGCACC AGGTGGCGCA ACTGCTGCGT 
TCAAAGCTGG GCTATAGCGT GCGGGCAGAC TATCAGCGGC TGTGCATCCC CTATTACCGG 
ACAATGCCGT CACTGTGCCC CGGCATACCG TTGCGTCGCT CTGAGCAGCA TCTGGTCAGG 
CAGATTTTTA GCGGCCTGAC GCGCATAAAT GAGGAAAAAG GTGAAGTCGA AGCCGATCTT 
GCCCACCACT GGCGGCAGAT TGATCCACTG CGCTGGCGTT TTTATCTGCG CCCCGCCGTC 
CTCTGGCATG ATGGTCAGGA GCTGACGATC GACGCGGTTA TCGCTTCACT GACCCGCAGC 
GCTAAGCTGC CGTTGTTCTC GCACTTGCAG ACCATTCAGG CCACCGGGCC GCTGAGCCTT 
GAAATTACGC TGGCGCACCC GGATAACCGA CTGCCGCTGC TGCTCAGCCA TATTGATGCC 
ATGATCCTAC CGCCTGACCA TACACAACGC GCTGATTTCC CGGCACATCC TGTGGGGACT 
GGCCCTTATG AGGTGGTGGA AAACAATGGC TTTCATCTGC AAATGAAGGC CTTTGACCAC 
TATTTCGGCC TGCGCGGGCT GCTGGATGAA GTGGAGGTCT TTATCTGGCC GAATTTAACG 
GAGACAGACA ACCTGGCGGA ATCGCTGTCG GATAACGACA CGGCAGCCTG GCTCAGCTCC 
AGCCTGAGCG ATGAGGATTA CGTTTCCGGA CGGCTTAGCC AGGTATCAGG CAAACCTTCT 
GACAACCTGC GCGAGATGTT TCTTGAGCGT GGAGGATATT TTTTATTATG CGACAGCCGC 
TCCCCGCACT GGCATACCGC CGAACATCGC CGCTGGCTAC GGGAAACACT CAGCCCTTAC 
GCCATACTCC AGCATCTGAG TGAGGCAATT CGCCCCTTCT GGGTACCGGG CGGCAGCCTG 
CTGTCCTCCT GGTTTCATAC TATTGAGGCG GGCCCGGCCT GTTCACCTTT TATCTCGTCG 
TCGCCCTACG CAAAACTGCG TCTGGCCTAT CACGATCAGC ACCCTGAATT TCCAATGCTC 
CTGGATATCA TGCAAGAGAT CATGCGCCAG CAGGGCATTT TACTTGAGGG CGTTGAGCTG 
AATTATGATG ACTGGGCGAA TGGCAAAGCC AATGTGGATC TCTGGCTGGG GACGGTCAAT 
TTCCCCATTC CCGAAGAGTG GAACGTCGGT ACATGGCTAC TGGGCTCCCC TTTACTGCGC 
CATGCCATCA GCGGTGGGGA TGATGCGCTG CTGGCCCAAT GGGAAACCCA GTGGCATGCC 
GAAACCATCA GCGCGGAACA ACTGGTCAGG GAAACCACCC GTTCAGGCTG GCTACAGCCG 
CTGTTTCACC ACTGGATGCG ACTCAAAAGC CCCGACCGGG CCAGGGGGAT CCACCTGAAT 
AACCTGGGAT GGTTTGATTT CCGATCCACC TGGATTGAGC CAGGGCCTTA A

Protein sequence

MLIPVREISP FMTTRHTEQK YLKLLQHYGD KPVSVTLQEL ADVLFCTRRH MRNLLLQMQE 
AKWLIWQSQA GRGHRARLHL RYKPEQLLSE KAEQLLESGH VDQAIQLLGK NKHQVAQLLR 
SKLGYSVRAD YQRLCIPYYR TMPSLCPGIP LRRSEQHLVR QIFSGLTRIN EEKGEVEADL 
AHHWRQIDPL RWRFYLRPAV LWHDGQELTI DAVIASLTRS AKLPLFSHLQ TIQATGPLSL 
EITLAHPDNR LPLLLSHIDA MILPPDHTQR ADFPAHPVGT GPYEVVENNG FHLQMKAFDH 
YFGLRGLLDE VEVFIWPNLT ETDNLAESLS DNDTAAWLSS SLSDEDYVSG RLSQVSGKPS 
DNLREMFLER GGYFLLCDSR SPHWHTAEHR RWLRETLSPY AILQHLSEAI RPFWVPGGSL 
LSSWFHTIEA GPACSPFISS SPYAKLRLAY HDQHPEFPML LDIMQEIMRQ QGILLEGVEL 
NYDDWANGKA NVDLWLGTVN FPIPEEWNVG TWLLGSPLLR HAISGGDDAL LAQWETQWHA 
ETISAEQLVR ETTRSGWLQP LFHHWMRLKS PDRARGIHLN NLGWFDFRST WIEPGP