Gene SeSA_A4747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4747
Symbol
ID	6518584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	4613401
End bp	4614825
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	45%
IMG OID	642749679
Product	DNA cytosine methylase
Protein accession	YP_002117411
Protein GI	194736513
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.209155
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.300797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAT TCGATTTATT TGCGCAGGAA CTGCTAGAAA AAGCAGAAGC AGAAGAAAAA 
CAACAACAAG AGCGCGACAG GAAGCTGATT GATCGGGTGC TTGAAATTTA CGACCAGAAG 
TATGTCGCAG AACTACTAAG AAAAATAGGT AAAAATGAGT GGAGCCGCGA AACACTTAAC 
CGTTGGGTAA ATGGCAAGTG TGAGCCAAAA TCGCTCACCA TGGCTGAAGA AGCGCTGTTA 
CGGAAAATGC TGCCGGAGCA ACCCGCTCAT CATCCTGACT ATGATTTCCG CTTTATTGAC 
CTGTTTGCCG GTATTGGTGG TATCCGTAAA GGATTCGAGG CCATCGGCGG GCAATGCGTT 
TTTACCAGTG AATGGAATAA AGAAGCGGTA CGTACCTACA AAGCAAACTG GTACAACGAT 
GAAGATGCGC ACACATTCAA TCTGGATATC CGCGAAGTCA CGCTAAGCGG AGAAGAAGGC 
ATCTCAGAAG AGAAAGCCTA CGCTCATATC GATCAACATA TCCCGGATCA TGACGTCCTG 
CTGGCCGGTT TTCCCTGCCA GCCATTCAGT CTGGCTGGGG TAAGTAAGAA AAACTCGCTC 
GGACGCGCAC ATGGATTCGA ATGTGAAGCG CAGGGCACTC TGTTTTTCGA TGTCGCCCGC 
ATAATCAAGG CAAAGCAACC AGCCATTTTT GTGCTGGAAA ACGTGAAAAA CCTTAAGAGC 
CATGACAAAG GCAAAACGTT TAAAGTCATT ATGGATACCC TTGATGAATT AGGCTATGAA 
GTCGCTGATG CCAATATCAC AGGGAAAGAT GATCCTAAAA TTATTGATGG TAAAAATTTC 
CTGCCACAAC ATCGTGAGCG TATTGTTCTG GTCGGATTCC GCCGTGACCT TAATATCCAT 
CAGGGATTCA CATTAAAGAA TATTGATAAA TTCTACCCTG AGAAAAGACC AACATTTGGT 
CAGCTTCTGG ACTCTGTGGT TGACAGTAAA TATATACTGA GCCCTAAGTT ATGGGAATAT 
CTCTATAACT ATGCTAAAAA GCATGCTGCC AAAGGTAATG GATTCGGTTT TGGTCTGGTT 
GATCCGAATA ATGAAAATAG CGTCGCGAGA ACATTATCCG CTCGTTACCA TAAAGATGGC 
TCTGAAATTC TCATCGACAG AGGATGGGAT AAAGAACTCG GCGAAATCGA TTTCTCTAAT 
CCAGAGAATC AGGAACAAAG GCCAAGAAGA CTGACGCCCC ATGAATGCGC AAGATTAATG 
GGATTTGAAC AACCCGGAGG CAAGCCATTC CGAATCCCCG TTTCCGATAC TCAGGCCTAT 
CGCCAGTTTG GGAACTCAGT GGTCGTTCCC GTTTTTGAAG CCGTGGCAAA ACTGCTTCAG 
CCTTATATTA TGAAAGCCGC TGCTAGTAAG GTGACCAAAA AATAA

Protein sequence

MSEFDLFAQE LLEKAEAEEK QQQERDRKLI DRVLEIYDQK YVAELLRKIG KNEWSRETLN 
RWVNGKCEPK SLTMAEEALL RKMLPEQPAH HPDYDFRFID LFAGIGGIRK GFEAIGGQCV 
FTSEWNKEAV RTYKANWYND EDAHTFNLDI REVTLSGEEG ISEEKAYAHI DQHIPDHDVL 
LAGFPCQPFS LAGVSKKNSL GRAHGFECEA QGTLFFDVAR IIKAKQPAIF VLENVKNLKS 
HDKGKTFKVI MDTLDELGYE VADANITGKD DPKIIDGKNF LPQHRERIVL VGFRRDLNIH 
QGFTLKNIDK FYPEKRPTFG QLLDSVVDSK YILSPKLWEY LYNYAKKHAA KGNGFGFGLV 
DPNNENSVAR TLSARYHKDG SEILIDRGWD KELGEIDFSN PENQEQRPRR LTPHECARLM 
GFEQPGGKPF RIPVSDTQAY RQFGNSVVVP VFEAVAKLLQ PYIMKAAASK VTKK