Gene SNSL254_A1701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1701
Symbol
ID	6486556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	1668918
End bp	1669979
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	52%
IMG OID	642737081
Product	hypothetical protein
Protein accession	YP_002040833
Protein GI	194445562
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02276] 40-residue YVTN family beta-propeller repeat

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.117434
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	0.828136
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTTAC GTCATCTTTT TTCGCCGCGC CTGCGTGGTT CTTTATTGTT AGGTTCGCTC 
CTCGTCGCAT CCTCATTTAG CACGCTGGCG GCGGAAGACA TGCTGCGTAA AGCGGTAGGC 
AAAGGCGCTT ATGAGATGGC CTGGAGTCAG CAAGAAAACG CGCTCTGGCT GGCTACATCG 
CAAAGCCGTA AACTGGATAA AGGCGGCGTA GTTTATCGTC TCGACCCGGT GACGCTGGAA 
ATCACGCAAG CGATTCATAA CGATCTCAAG CCGTTCGGCG CCACCATCAA TGCCGCGACC 
CAAACGCTGT GGTTTGGCAA TACCATTAAC AGCGCTGTTA CCGCGATTGA TGCCAAAACG 
GGTGATGTAA AAGGTCGTCT GGTACTTGAT GCGCGCAAAC GTACTGAAGA GGTTCGTCCG 
TTACAGCCCC GTGAGCTGGT TGCCGATGCG TCTACCAACA CGATCTACAT TAGCGGTGTT 
GGTAAAGAGA GTGCTATTTG GGTAGTGGAT GGCGAAACCA TCAAACTGAA AACGACGATC 
GAAAATACCG GCAAAATGAG TACGGGTCTG GCGCTCGACA GTAAAGCGCA ACGCCTGTAC 
ACCACCAATG CGGATGGCGA ATTTATCACC ATCGATACCG CCAGCAATAA AATTCTCAGT 
CGTAAGAAGT TGCTGGATGA CGGTAAAGAA CACTTCTTTA TTAACCTGAG TCTCGATACC 
GCAGGTCATC GCGCGTTTAT CACCGACTCG AAGGCGACTG AGGTTCTGGT TGTCGATACC 
CGTAATGGCA ATATTCTTGC CAAAATCGCG GCGCCTGCTT CTTTGGCCGT CCTGTTTAAC 
CCGACACGTA ACGAGGCGTA TGTGACACAT CGTCAGGCAG GTCAGGTCAG CGTGATCGAT 
GCGAAGACCT ATAACGTTGT TAAAACGTTC GATACGCCGA CGTACCCGAA TAGCCTGGCG 
CTATCGGCAG ACGGTAAAAC GCTCTACGTC AGCGTGAAGC AGAAATCGAC ACGTGAACAG 
GAAGCGACGC AGCCGGATGA TGTTATTCGC ATTGCTCTGT AA

Protein sequence

MHLRHLFSPR LRGSLLLGSL LVASSFSTLA AEDMLRKAVG KGAYEMAWSQ QENALWLATS 
QSRKLDKGGV VYRLDPVTLE ITQAIHNDLK PFGATINAAT QTLWFGNTIN SAVTAIDAKT 
GDVKGRLVLD ARKRTEEVRP LQPRELVADA STNTIYISGV GKESAIWVVD GETIKLKTTI 
ENTGKMSTGL ALDSKAQRLY TTNADGEFIT IDTASNKILS RKKLLDDGKE HFFINLSLDT 
AGHRAFITDS KATEVLVVDT RNGNILAKIA APASLAVLFN PTRNEAYVTH RQAGQVSVID 
AKTYNVVKTF DTPTYPNSLA LSADGKTLYV SVKQKSTREQ EATQPDDVIR IAL