Gene SNSL254_A3122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3122
Symbol
ID	6485726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3037696
End bp	3038958
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	60%
IMG OID	642738434
Product	YgbK domain protein
Protein accession	YP_002042158
Protein GI	194445270
COG category	[S] Function unknown
COG ID	[COG3395] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.827819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.0402148
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAAAA TTGGCGTCAT TGCCGACGAT TTTACCGGCG CGACTGACAT CGCCAGTTTT 
CTGGTCGAAA ACGGGATGCC GACAGTGCAG ATCAATGATG TCCCAACCGG GACGCAACCG 
GAAGGATGCG ACGCGGTAGT TATCAGCCTG AAAACCCGCT CATGCCCGGC GCAAGAGGCG 
ATAAAACAAT CGCTGGCGGC GCTGGTATGG CTGAAAAAAC AGGGCTGCCA GCAAGTCTAT 
TTCAAATATT GCTCGACTTT CGATAGTACC GCCGAAGGCA ATATCGGCCC GGTCACCGAT 
GCGCTGATGG TGGCGCTGGA TACCTCATTT ACCGTGATTT CTCCCGCGCT GCCGGTTAAC 
GGACGCACGG TTTATCAGGG CTATCTGTTT GTCATGAACC ACTTGCTGGC GGAGTCCGGT 
ATGCGCCACC ACCCTATCAA TCCGATGACC GACAGCTACC TGCCGCGTCT GATGGAAGCG 
CAGGCGCAAG GGCGCTGCGG CGTTATTCCG GCTCAGACGC TTGATGAAGG CGTTGCCGCG 
ACCCGTGCGG CGCTGTCGCG TTTACAGCAG GAAGGATATC GCTACGCGGT ACTTGACGCG 
CTCAATGAGC GGCACCTGGA AATCCAGGGC GAGGTTTTGC GTGATGCCCC GCTAGTGACC 
GGCGGTTCCG GGCTGGCAAT GGGGCTGGCG CGTCAGTGGG CGAAGCACGG CGTTTCTCAG 
GCCCGTTCCG CAGGCTATCC GCTGAGCGGT CGCGCGGTGG TGCTTTCCGG TTCCTGTTCG 
CAAATGACGA ATCAGCAGGT GGCCTTCTAT CGACAACATG CTCCCACACG CGACGTTGAC 
GTGGCGCGCT GCCTGTCATC CGAGGCGCGC GAGGCCTACG CTGAAGCGCT GGCGCAGTGG 
GTGCTCAGTC AGGACAGCGA ACTGGCGCCA ATGATTAGCG CCACCGCCTC CACGCAGGCG 
CTGGCCGCCA TCCAGCAGCA ATATGGCGCT ACCGAAGCCA GCCATGCGGT AGAGGCGCTC 
TTTTCCCTGC TGGCCGCTCG CTTAACGGAA GGCGGTATCA CCCGGTTTAT CGTGGCGGGC 
GGCGAAACCT CGGGCGTGGT GACGCAAAGC CTCGGTATTA CCGGTTTTCA CATTGGACCG 
TGCATTTCAC CCGGCGTGCC GTGGGTCAAC GCGCTCCATG CGCCAGTCTC GCTGGCGCTA 
AAGTCAGGTA ATTTTGGCGA TGAATCCTTT TTCATCCGCG CTCAAAGGGA GTTTCAGGTA 
TGA

Protein sequence

MLKIGVIADD FTGATDIASF LVENGMPTVQ INDVPTGTQP EGCDAVVISL KTRSCPAQEA 
IKQSLAALVW LKKQGCQQVY FKYCSTFDST AEGNIGPVTD ALMVALDTSF TVISPALPVN 
GRTVYQGYLF VMNHLLAESG MRHHPINPMT DSYLPRLMEA QAQGRCGVIP AQTLDEGVAA 
TRAALSRLQQ EGYRYAVLDA LNERHLEIQG EVLRDAPLVT GGSGLAMGLA RQWAKHGVSQ 
ARSAGYPLSG RAVVLSGSCS QMTNQQVAFY RQHAPTRDVD VARCLSSEAR EAYAEALAQW 
VLSQDSELAP MISATASTQA LAAIQQQYGA TEASHAVEAL FSLLAARLTE GGITRFIVAG 
GETSGVVTQS LGITGFHIGP CISPGVPWVN ALHAPVSLAL KSGNFGDESF FIRAQREFQV