Gene SeD_A3344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3344
Symbol
ID	6871406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3219413
End bp	3220432
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	58%
IMG OID	642786348
Product	HTH-type transcriptional regulator AscG
Protein accession	YP_002216987
Protein GI	198243955
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.718161
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.0271899
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAA TGCTGGATGT TTCCCGCCAT GCGGGCGTAT CAAAGGCCAC CGTCTCACGA 
GTGCTGAATG GGACGGGGCA GGTAAAAGAA AGCACGCGCC AGAAAGTGTT TACGGCGATG 
CAGGCTCTGG GCTATCGCCC CAACCTGCTG GCACGCTCGC TGGCGAATCG CACCAGCAAC 
AGCATCGGTC TGGTCGTCTC TACGTTTGAC GGCTTCTATT TCGGCAGTTT GTTGCGCCGG 
GCGTCGCGCC AGGCGGAGTT TCATAACAAG CAGTTGATCG TCACCGATGG TCACGATACG 
CCGGAACGAG AGCAGAAAGC CGTACAAATG TTGGCCGACA GACAGTGCGA CGCTATTATT 
CTTTACACTC GCTATATGGA TGAGCCGGCG ATTTTGTCGT TGATTGACGC CACGGAAATG 
CCGCTTGTGA TTATTAATCG CAACGTCACT CAGGCCCGCG ATCGCGCTAT TTTCTTCGAG 
CAGGAGACGG CGGCATTCCA GGCGGTGGAA TACCTGATTA CGCAGGGCCA TCGCGATATC 
GCCTGTATTA CGCTGCCTGT TCATACTCCC ACTGGCACAT CACGCGTAGC GGGTTATCGC 
AAGGCGCTGG AAAAGTATGG TATTCCCTGG CAACCGGCAA AAGTGAAATA CGGCGATTAC 
ACGCTGACGC GCGGCTATGA CGCCTGCCGG GAATTACTGG AGGAAGGCGT CACGTTTAGC 
GCGCTATTCG CCTGTAATGA TGACACGGCG CTGGGCGCGG CAAAAGCGCT GCGCCAGGCC 
GGATTACGCA TCCCGCAGGA TGTGTCGCTG TTTGGTTTTG ACGATGCGCC GGGCGCAACC 
TGGCTTGAAC CGGGGCTTTC AACAGTCTAT TTACCCATCG AGGATATGAT AGCCACCGCG 
ATCGATCAGG CCGTTCGCCT GGCGAACAGC GAGCCGGTCG CCCCGATCCC GCCCTTTACC 
GGCACGCTGA TTCTGCGCGA GTCCGTCGCC GCAGGCCCGT TTTTTCAACG TCCGGCCTAA

Protein sequence

MATMLDVSRH AGVSKATVSR VLNGTGQVKE STRQKVFTAM QALGYRPNLL ARSLANRTSN 
SIGLVVSTFD GFYFGSLLRR ASRQAEFHNK QLIVTDGHDT PEREQKAVQM LADRQCDAII 
LYTRYMDEPA ILSLIDATEM PLVIINRNVT QARDRAIFFE QETAAFQAVE YLITQGHRDI 
ACITLPVHTP TGTSRVAGYR KALEKYGIPW QPAKVKYGDY TLTRGYDACR ELLEEGVTFS 
ALFACNDDTA LGAAKALRQA GLRIPQDVSL FGFDDAPGAT WLEPGLSTVY LPIEDMIATA 
IDQAVRLANS EPVAPIPPFT GTLILRESVA AGPFFQRPA