Gene SNSL254_A1176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1176
Symbol
ID	6484496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1170111
End bp	1171310
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	53%
IMG OID	642736578
Product	putative bacteriophage protein
Protein accession	YP_002040336
Protein GI	194443659
COG category	[S] Function unknown
COG ID	[COG3299] Uncharacterized homolog of phage Mu protein gp47
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.118784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.0374243
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTCA ATTTGGACAC ACTCGGCTTA TCGGCAACGG TAACCGCTGA GGGGATCAGT 
GCGCCTGATT ACCAGACGAT ACTCGATACC CTGACGAGCT ATTTCCAGCA GATTTATGGC 
AGTGACGCTT ATCTGGAGCC GGACAGCAAA GACGGCCAGA TGGTGGCGCT GGTGGCGCTT 
GCTATTCACG ATGCCAATAA CACAGCCATT GCCGTCTATA ACTGCTTCTC ACCTGCTACG 
GGTTACGGCG CAGCGCTGAC CAGTAATGTG AAAATTAACG GTATCGCGCG CAAAGGTGCA 
ACGAACTCTA CCGTGGATTT ACTGTTCACT GGCACCGCAG GAACAATCAT TACGAACGGC 
ACCGTGAAAG ACACCAATAA CGTGATCTGG CGTCTTCCGG ATTCAGTGGT GATTGGTGTT 
GATGGCACCG TGACGGCAAC TGCAATCTGT TCCAAAGGCG GAGCGGTTGC AGCTCCTGCC 
GGGACGATTA CCACTATCAA TACACCGACC CGTGGCTGGA CGTCGGTAAC CAACCCGGCA 
GCGGCCACCG TTGGCGCACC TGCAGAAACG GACGCAGAAC TGCGCATCAG GCAGGGGCAG 
AGTGTCGCGA TACCATCCAT CACACCATTT GAAGGTGTGG ACGGGGCGAT CGCTAATATT 
GCTGGTGTGA CGCGCCACAA GCTCTATGAA AATGATACAG GAAAGACTGA CGGTAACGGG 
CTCCCTCCGC ATTCCATCTC GGCCATTGTT GATGGTGGCG ATGTGACCGA AATAGCCAGG 
ACCATCCGGG GAAATAAAGG GCAGGGGGTC CGGACCTGGG GAAAAACATC CGTAACCGTA 
CCGGATAAAT ATGGCAATCC TCACATAATC AGTTTTTCGC GACCAACTGA TGTCCCTGTT 
TACGGAAAAA TCACCTTATC AGTTTTTGCC GGGTACACCT CTCAGATAGG TGTGCAGATT 
CAGCAGGCTG TTGCGGATTA CATTAACAGA CTGATGATTG GTGACCAGGT ACTGCTGAGC 
CGGATTTATT CTCCTGCTAA CCTTGGGGTC GTCAGTGGTG GAAATGCACG CTATTACGAT 
ATTCAGGAGC TGCTGATCGG CAAATCTCCT GAAACCGTTG CCGCGGCGAA TATTAATATT 
GCTTACGACG AATCAGCCTC CTGTAAGCCG GAAAATATCA TTATTACGGT GGCGGCATGA

Protein sequence

MALNLDTLGL SATVTAEGIS APDYQTILDT LTSYFQQIYG SDAYLEPDSK DGQMVALVAL 
AIHDANNTAI AVYNCFSPAT GYGAALTSNV KINGIARKGA TNSTVDLLFT GTAGTIITNG 
TVKDTNNVIW RLPDSVVIGV DGTVTATAIC SKGGAVAAPA GTITTINTPT RGWTSVTNPA 
AATVGAPAET DAELRIRQGQ SVAIPSITPF EGVDGAIANI AGVTRHKLYE NDTGKTDGNG 
LPPHSISAIV DGGDVTEIAR TIRGNKGQGV RTWGKTSVTV PDKYGNPHII SFSRPTDVPV 
YGKITLSVFA GYTSQIGVQI QQAVADYINR LMIGDQVLLS RIYSPANLGV VSGGNARYYD 
IQELLIGKSP ETVAAANINI AYDESASCKP ENIIITVAA