Gene SNSL254_A4045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4045
Symbol
ID	6486155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3936008
End bp	3936937
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	50%
IMG OID	642739303
Product	hypothetical protein
Protein accession	YP_002043012
Protein GI	194446756
COG category	[S] Function unknown
COG ID	[COG5464] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01784] conserved hypothetical protein (putative transposase or invertase)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.673826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.0374243
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA GCCCCACGTC CACGCCTCAT GATGCGGTAT TCAAAACGTT TTTACGCCAT 
CCGGATACCG CGCGGGATTT TCTCAATATT CATCTTCCCC ATTCGCTAAG AATACGTTGC 
GATCTGACGA CGTTAAAACT GGCGCCGGAC AGTTTTATCG AGAAAAATTT ACGCGCGTTT 
TATTCCGACG TCCTTTGGTC GCTAAAAACG TGTGAAGGCG ATGGTTATAT CTATGTCGTT 
ATAGAGCATC AGAGTACGCC GGACGCGCAT ATGGCGTTCC GGTTAATGCG TTACGCGACT 
GCCGCGATGC AGCGCCATCT GGATGCTGGC CATAAAACGT TACCGCTGGT GATTCCCATG 
CTGTTTTACC ATGGCGCGAA AAGCCCGTAT CCCTTTTCGC TTTGCTGGCT GGATGAGTTT 
GACGATCCTG CACTGGCGCG TCAGCTTTAT GCGACGGCAT TTCCACTGGT AGACATTACG 
GTGGTGCCGG ATAACGAGAT TATGCAGCAT CGACGTATCG CGATGCTGGA ACTGGTACAA 
AAGCATATAC GTCAGCGCGA CCTGATGGGA TTGGTCGAGC GTTTAGCGGT ACTTCTGATT 
ACGGGAAACG CTAATGACAG TCAGCTAAAA GCGCTGTTTA ATTATTTGCT AATACAGCAT 
GGCAGCACGC CTCGTTTTGG CAAGTTTATC CGCGAGGTGG CGCGTCGTGT TCCCCAACAC 
AAGGAGAGAT TAATGACGAT CGTAGACAGA ATACGTGAAT CGGGGCGCAG AAAAGGTAAG 
CGTGAAGGCG TGCAACAAGG TATACATCAA GGTAAGCAGG AGGAAGCCTT GCGTATTGCG 
CATACGATGC TGGAACAGGG GATCAATCGA GAGATGGTGC TGATGATTAC CGGGCTTTCT 
GACGAAGAGA TTAAGGCAAA GCGCCATTAA

Protein sequence

MKKSPTSTPH DAVFKTFLRH PDTARDFLNI HLPHSLRIRC DLTTLKLAPD SFIEKNLRAF 
YSDVLWSLKT CEGDGYIYVV IEHQSTPDAH MAFRLMRYAT AAMQRHLDAG HKTLPLVIPM 
LFYHGAKSPY PFSLCWLDEF DDPALARQLY ATAFPLVDIT VVPDNEIMQH RRIAMLELVQ 
KHIRQRDLMG LVERLAVLLI TGNANDSQLK ALFNYLLIQH GSTPRFGKFI REVARRVPQH 
KERLMTIVDR IRESGRRKGK REGVQQGIHQ GKQEEALRIA HTMLEQGINR EMVLMITGLS 
DEEIKAKRH