Gene SNSL254_A1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1989
Symbol	yebU
ID	6485439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1946841
End bp	1948382
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	55%
IMG OID	642737354
Product	rRNA (cytosine-C(5)-)-methyltransferase RsmF
Protein accession	YP_002041104
Protein GI	194444109
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.00458134
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGGTACC GCTCTGCCAC GTTAAACACC CGGCTCCGGC GTACTCGCGC CGGAGCGTTT 
TATGCTACAC TGCGCGCCTG TTTTTTTGCC GGCGATACAC CTGTGGCTCA ACACGCTGTC 
TATTTTCCTG ACGCTTTTCT GACGCAAATG CGTGAAGCAA TGCCTTCCAC GCTCTCTTTT 
GATGAATTTA TTTCGGCCTG CCAACGCCCG TTGCGCCGCA GTATACGCAT CAATACGCTT 
AAAATCTCCG TGGCTGATTT CCTTGCCCTA ATCGCGCCCT ACGGCTGGTC GCTCACGCCA 
ATTCCGTGGT GTCATGAAGG ATTCTGGATC GAGCGCGATG ATGAAGAGGC ATTGCCGCTT 
GGCAGTACCG CTGAGCATTT AAGCGGCCTA TTTTACATTC AGGAGGCCAG TTCGATGCTG 
CCGGTCGCGG CCCTGTTCGC CGATGATAAT CATCCGCAGC GGGTCATGGA TATGGCAGCG 
GCGCCTGGCT CCAAAACCAC GCAGATCGCT GCCCGCATGG GGAACCGCGG CGCCATTCTG 
GCCAACGAAT TTTCGGCCAG CCGCGTCAAA GTTCTGCACG CTAATATCAG CCGATGTGGA 
ATCGCCAATA CCGCACTGAC GCATTTCGAT GGCCGCGTAT TTGGCGCTGC GTTACCGGAG 
ATGTTTGACG CTATCCTGCT GGATGCGCCC TGCTCTGGCG AAGGCGTAGT ACGTAAAGAT 
CCTGATGCGC TAAAAAACTG GTCGCCAGAA AGCAATCTGG ATATCGCGGC GACACAGCGG 
GAACTGCTCG ACAGCGCTTT TCATGCTTTA CGACCCGGCG GCACGCTGGT CTACTCCACC 
TGCACGTTAA ATCGCCAGGA AAACGAAGCG GTCTGCCTCT GGCTGAAAGA GACCTACGCC 
GACGCCGTTG AATTTTTGCC GCTGGGTGAT CTGTTTCCTG ACGCTGACCG CGCCCTCACC 
CCGGAAGGCT TCCTGCACGT CTTCCCGCAA ATTTACGACT GCGAAGGATT CTTCGTCGCA 
CGTCTGCGTA AAATGTCATC CCTTCCAGCC ATGCCCGCGC CGGGGTATAA AGTGGGGGCG 
TTTCCTTTTA CCCCCCTCAA AGGCCGCGAA GCATTACACG TTACCCAGGC GGCCAACGCC 
GTCGGACTGT TATGGGATGA AAATCTCCAT CTTTGGCAGC GTGAAAAAGA GGTCTGGCTG 
TTCCCGGCAG AAATTGAATC ACTGATCGGA AAAGTCCGTT TTTCCCGGCT CGGCATTAAG 
CTGGCCGAAA GTCATAATAA AGGCTATCGC TGGCAACATG AGGCGACGAT AGCCCTTGCC 
TGCCCGACTC ATGCTCACGC GTTCGAACTT TCTGTGCAAG AGGCGGAGGA GTGGTATCGC 
GGTCGGGATA TTTATCCGCA AACACCCCCT GCCGCTGATG ATGTCCTGGT GACGTTCCAG 
CATCAGCCGC TTGGTCTGGC AAAACGTATC GGCTCAAGAA TAAAGAACAG TTACCCGCGT 
GAACTGGTAC GTGATGGCAA ACTCTTTACT GGTAATAGTT AA

Protein sequence

MGYRSATLNT RLRRTRAGAF YATLRACFFA GDTPVAQHAV YFPDAFLTQM REAMPSTLSF 
DEFISACQRP LRRSIRINTL KISVADFLAL IAPYGWSLTP IPWCHEGFWI ERDDEEALPL 
GSTAEHLSGL FYIQEASSML PVAALFADDN HPQRVMDMAA APGSKTTQIA ARMGNRGAIL 
ANEFSASRVK VLHANISRCG IANTALTHFD GRVFGAALPE MFDAILLDAP CSGEGVVRKD 
PDALKNWSPE SNLDIAATQR ELLDSAFHAL RPGGTLVYST CTLNRQENEA VCLWLKETYA 
DAVEFLPLGD LFPDADRALT PEGFLHVFPQ IYDCEGFFVA RLRKMSSLPA MPAPGYKVGA 
FPFTPLKGRE ALHVTQAANA VGLLWDENLH LWQREKEVWL FPAEIESLIG KVRFSRLGIK 
LAESHNKGYR WQHEATIALA CPTHAHAFEL SVQEAEEWYR GRDIYPQTPP AADDVLVTFQ 
HQPLGLAKRI GSRIKNSYPR ELVRDGKLFT GNS