Gene SNSL254_A4321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4321
Symbol
ID	6484654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4210649
End bp	4211749
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	45%
IMG OID	642739565
Product	hypothetical protein
Protein accession	YP_002043259
Protein GI	194443990
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.932757
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.276393
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGGA ATTTATTATC CTCAGCGATA ATCATTGCGC TAATGACCCT GGGCGCAACA 
GGATGTGATG ACAATAATGT TAAAACCGAG GCGACGCCGG CCGCCAGCAG TCAGCCTGCG 
ACGCCAGCGC CTTCTCAGAC GCCGGAAACG CAATCTGACG AAAGTCCAGC GCAGCCCTCA 
GCAGCGAAGC CAGAAACGGC AACTCAGCCC CCGGTGGCGA AACCAGAAAC GCCAGCTCAG 
CCGGAGGTTG ACGCTGAAGA AGTTTATAGT GAAAAAATGG ATGTCTATAT CGATTGTTTT 
AATAAACTTC AATTGCCCGT TCAGCACAGT CTGGCGCGTT ACGCGGATTG GGTGAAAGAC 
TTTAAAAAAG GTCCGACAGG GAAAGAGAGC CTGGTTTATG GCATTTATGG TATTACGGAG 
TCTTACATAA CGAATTGCCA GAAAGAGATG AAACAGGTGG CCGCCTTAAC GCCATTACTT 
GAGCCTATTG ATGGCGTTGC CGTTAGCTAT ATTGATAGCG CCGCTGCGCT GGGTAATACC 
ATTAACGAAA TGGAAAAATA TTATACCCAG GAAAACTATA AAGATGATGC CTTTGCTAAA 
GGTAAGGCGC TGCATCAGAC ATTACTGAAG AATATCGAGG ATTTTAAACC CGTCTCGGAA 
AAATATCATG AGGCTATTCA GGAAATAAAT GACAGGCGGC AATTGACACA GTTGAAGAGA 
ATAGAAGAAG CGGAAGGCAA AACATTTAAC TATTATTCTC TGGCTGTCAT GATTTCGGCA 
AAGCAGATCA ACAAGGTTAT TTCTGCCGAT ACCTTTGATG CCGAAGCGAT GATGAAAAAA 
GTCGCGGAAC TGGAAACAAT GATTGCGCAA TTGAAAGAAG TGAATACTGA TGGCCGTAAT 
TCTTCTTTCA TCAGCTCTGC GGCTGATTAT CAGCTACAAG CTAAAAAATA TATTCGTCGC 
ATCAGAGACA ATGTTGAGTA TTCTGATTTT GAAAAGAAAC GGGTGCAGGA CCCTGCAACA 
GGATGGATGG TTGCGGATTC TTATCCGGCG TCGTTGAGAA GTTATAACGA GATGGTGGAT 
GATTATAACC GCCTGCGTTG A

Protein sequence

MKRNLLSSAI IIALMTLGAT GCDDNNVKTE ATPAASSQPA TPAPSQTPET QSDESPAQPS 
AAKPETATQP PVAKPETPAQ PEVDAEEVYS EKMDVYIDCF NKLQLPVQHS LARYADWVKD 
FKKGPTGKES LVYGIYGITE SYITNCQKEM KQVAALTPLL EPIDGVAVSY IDSAAALGNT 
INEMEKYYTQ ENYKDDAFAK GKALHQTLLK NIEDFKPVSE KYHEAIQEIN DRRQLTQLKR 
IEEAEGKTFN YYSLAVMISA KQINKVISAD TFDAEAMMKK VAELETMIAQ LKEVNTDGRN 
SSFISSAADY QLQAKKYIRR IRDNVEYSDF EKKRVQDPAT GWMVADSYPA SLRSYNEMVD 
DYNRLR