Gene SeD_A1851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1851
Symbol	mic
ID	6873679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1791778
End bp	1792998
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	52%
IMG OID	642784981
Product	transcriptional regulator Mic
Protein accession	YP_002215649
Protein GI	198245602
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTGCTG ATAGTCAGCC TGGGCATATC GATCAAATTA AGCAGACCAA TGCTGGCGCA 
GTGTATCGCC TGATTGATCA GCTCGGACCG GTATCGCGAA TTGACCTGTC TCGTCTGGCG 
CAGTTGGCGC CTGCCAGTAT TACGAAAATT GTTCGCGAAA TGCTGGAAGC GCATTTGGTT 
CAGGAACTTG AAATTAAAGA GGCGGGCAGT CGCGGACGTC CCGCCGTCGG GCTGATGGTG 
GAAACGGAAG CCTGGCACTA TTTATCTATT CGTATTAGCC GTGGCGAAAT TTTCCTTGCA 
CTGCGCGATC TTAGCAGCAA ACTGGTGGTA GAAGAGTGTC TGGCGCTGCC GTTAAACGAA 
GCTACGCCGT TGCTTGAGCG AATTATTACG CACGTTGATC GGTTTTTTAC CCGCCATCAG 
CAGAAACTGG AGCGTCTGAC CTCCATTGCC ATTACGTTAC CGGGCATTAT CGATACCGAA 
AACGGCGTTG TGCACCGGAT GCCGTATTAC GAAGATGTCA AAGAGATGCC TTTGGGAGAT 
GCGCTGGAGC GGCACACCGG CGTACCGGTT TACATTCAGC ATGATATTAG CGCCTGGACG 
ATGGCAGAGG CGCTTTTTGG CGCCTCACGC GGCGCGCGCG ACGTTATCCA GGTGGTGATT 
GATCATAATG TGGGGGCGGG CGTTATCACC GACGGTCATT TGCTTCATGC GGGTAGTAGC 
AGTCTGGTAG AGATTGGGCA TACCCAGGTC GATCCTTATG GTAAGCGCTG TTATTGCGGT 
AATCATGGCT GTCTGGAGAC CATCGCCAGC GTCGATAGCG TGCTGGAACT TACGCAGCTT 
CGGCTTAATC AGTCGATGAG TTCAATGTTG CACGGCCAGC CGTTAACGGT AGATTCACTG 
TGTCAGGCGG CGATGCAGGG AGATCTATTA GCAAAAGATA TTATTAGCGG CGTTGGCGCG 
CATGTCGGAC GCATTCTGGC TATCATGGTG AATTTATTTA ATCCGCAAAA AATTCTTATT 
GGTTCGCCGC TAAGTAAAGC GGCTGATATC CTTTTTCCAG CCATTGCTGA CAGTATCCGT 
CAACAGGCGC TGCCCGCCTA CAGCAGGAAT ACGGTTGTGG AAAGCACGCA GTTTACCAAC 
CAGGGTACGA TGGCCGGGGC GGCGTTGGTA AAAGACGCGA TGTATAACGG CTCTTTGTTG 
ATTCGTCTAT TACAGGGTTA A

Protein sequence

MVADSQPGHI DQIKQTNAGA VYRLIDQLGP VSRIDLSRLA QLAPASITKI VREMLEAHLV 
QELEIKEAGS RGRPAVGLMV ETEAWHYLSI RISRGEIFLA LRDLSSKLVV EECLALPLNE 
ATPLLERIIT HVDRFFTRHQ QKLERLTSIA ITLPGIIDTE NGVVHRMPYY EDVKEMPLGD 
ALERHTGVPV YIQHDISAWT MAEALFGASR GARDVIQVVI DHNVGAGVIT DGHLLHAGSS 
SLVEIGHTQV DPYGKRCYCG NHGCLETIAS VDSVLELTQL RLNQSMSSML HGQPLTVDSL 
CQAAMQGDLL AKDIISGVGA HVGRILAIMV NLFNPQKILI GSPLSKAADI LFPAIADSIR 
QQALPAYSRN TVVESTQFTN QGTMAGAALV KDAMYNGSLL IRLLQG