Gene SNSL254_A2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2449
Symbol
ID	6486362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2364897
End bp	2365955
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	61%
IMG OID	642737786
Product	regulatory protein ada
Protein accession	YP_002041527
Protein GI	194444615
COG category	[F] Nucleotide transport and metabolism [L] Replication, recombination and repair
COG ID	[COG0350] Methylated DNA-protein cysteine methyltransferase [COG2169] Adenosine deaminase
TIGRFAM ID	[TIGR00589] O-6-methylguanine DNA methyltransferase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.0458356
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAG CGTTACTTAC CGATGATGAA TGCTGGCTGC GGGTGCAGGC GCGCGATGCC 
AGCGCGGATG GGCGTTTCGT TTTTGCGGTG CGAACCACCG GCGTTTTTTG CCGCCCTTCT 
TGTCGCTCGA AGCGGGCGTT ACGTAAAAAT GTTCGCTTTT TTGCCAACGC GCAGCAGGCG 
CTGGACGCCG GTTTTCGCCC CTGCAAGCGC TGTCAGCCGG ATAATGCGCG CGCGCAGCAA 
CGGCGGTTGG ATAAGATTGC CTGCGCCTGC CGTTTACTTG AGCAGGAGAC GCCGGTAACG 
CTGGCGTCTC TGGCGCAGGC GGTGGCGATG AGCCCGTTTC ATCTGCACCG TTTGTTTAAA 
GCGAGCACCG GTATGACGCC GAAAGGGTGG CAGCAGGCGT GGCGCGCCCG GCGGCTGCGT 
GAGGCGTTGG CGAAAGGAGA GCCGATCACG GCGGCTATTT ATCGCGCCGG CTTCCCGGAT 
AGCAGTAGCT ACTACCGTCA TGCCGACCAG ACGCTGGGCA TGACGGCAAA ACAGTTTCGC 
AAAGGCGGCG ATAATGTCTC CGTTCGCTAT GCGCTGACGG ACTGGGTTTA CGGACGGTGC 
CTGGTGGCGG AGAGCGAGCG GGGGATTTGC GCGATTCTCC CCGGTGATAG CGACGACGCG 
CTACTGGCTG AATTACACAC CCTGTTCCCG GCGGCCCGCC ACGAACCTGC TGACGCGCTT 
TTTCAGCAAC GGGTGCGGCA GGTTGTCGCG GCTATCAACA CACGCGATGT GCTGCTCTCG 
TTGCCGCTGG ATATCCAGGG AACCGCGTTT CAACAGCAGG TCTGGCAGGC GTTATGCGCG 
ATTCCCTGCG GCGAAACCGT AAGCTATCAA CAGCTTGCCG CGACTATCGG CAAACCCACG 
GCAGTACGCG CGGTCGCCAG CGCGTGCGGC GCGAATAAAC TGGCGATGGT GATCCCGTGT 
CATCGGGTCG TGCGTCGCGA TGGCGCGCTC TCCGGTTATC GTTGGGGCGT GCGTCGAAAA 
GCGCAGCTAT TAAAGCGAGA AGCACAAAAA GAGGAGTAG

Protein sequence

MKKALLTDDE CWLRVQARDA SADGRFVFAV RTTGVFCRPS CRSKRALRKN VRFFANAQQA 
LDAGFRPCKR CQPDNARAQQ RRLDKIACAC RLLEQETPVT LASLAQAVAM SPFHLHRLFK 
ASTGMTPKGW QQAWRARRLR EALAKGEPIT AAIYRAGFPD SSSYYRHADQ TLGMTAKQFR 
KGGDNVSVRY ALTDWVYGRC LVAESERGIC AILPGDSDDA LLAELHTLFP AARHEPADAL 
FQQRVRQVVA AINTRDVLLS LPLDIQGTAF QQQVWQALCA IPCGETVSYQ QLAATIGKPT 
AVRAVASACG ANKLAMVIPC HRVVRRDGAL SGYRWGVRRK AQLLKREAQK EE