Gene SeSA_A2015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A2015
Symbol
ID	6518487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	1940354
End bp	1941682
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	53%
IMG OID	642747101
Product	side tail fiber protein
Protein accession	YP_002114902
Protein GI	194736320
COG category	[R] General function prediction only
COG ID	[COG5301] Phage-related tail fibre protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.478107
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGAGG TACAGACCAA AGCCCCGCTG GACAGTCCAG CACTGACCGG TACGCCAACG 
GCACCAATGC CGGAAACCAC AGCTGCAGGT ATTGAAATTG CCACGGCAGC GTTTGTGGCT 
GCGAAAGTGG CGCAGTTGGT TGGTTCTGCG CCGGAAGCGC TGGACACCCT GCAGGAACTG 
GCTGACGCGT TGGGAAACGA TCCGAACTTT GCCATCACGG TACTGAATAA ACTGGCGGGC 
AAGCAGCCGC TGGACGAAAC CCTGACGGCG CTGTCAGGAA AAAGCGCTGA TGGTCTTATC 
GAATATGTTG GTTTACGGGA AACGATAAAT CACGCCGCCG ATGCGTTACA AAAATCACAG 
AATGGTGGCG ATATTCCGGA AAAGCCGCTG TTTGTACAAA ATATCGGAGC GCTCCCTGCA 
TCAGGTACGG CTGTTGCAGC GAACAGACTG GCATCACGCG GCGCGCTTCC GGCACTGACT 
GGTACGACAA GAGGCAGTGA TAGCGGCCTG ATAATGGGCG AGGTTTACAA TAACGGTTAT 
CCAACGCAAT ACGGGAATAT TTTGTGTCTG ACCGGAATCG GTGATGGAGA AATATTAATC 
GGATGGCGTG GGGTTAATGG TGCTCCTGCG TCTGCATATA TTCGCAGCCA TCGAGATACC 
GCCGACGCTG AGTGGTCAGA ATGGGCGATG TTCTACACCT CACTAAATCC GCCACCGGAT 
TCGTATCCAG TAGGTGTGGC GATAGCATGG ACGTCTGATG CTACTCCGGC AGGTTACGCT 
CTGATGCAGG GGCAATTGTT TGATAAATCT GCTTACCCGT TACTGGCTAT AGCGTATCCG 
TCCGGCATTA TCCCTGACAT GCGAGGCTGG ACAATCAAAG GTAAACCCAC CAGTGGGCGA 
GCTGTACTTT CTCAGGAGAT GGACGGCAAC AAATCGCACT CGCACACCGC GCGGGCGCAG 
GATACCGACT TAGGGACAAA AACAACCGGC AATCAGGTTT ATATCTCCGA TCTTGGTCCG 
CTACCTGAAA ACGTCACATC AGTTTCACCA GGTGGTGGAT ACAAAAAATG GGATAGTAAG 
GCTCAGGTCT GGGTGAATGA TGAAGCTGCG GAGGCCGCAG CCAGACTTCG TGAAGCTGAA 
GGAACGAAAA ACAGACGCCT GCAAATAGCG TCTGAAAAAA TCGCGCCGTT ACAGGATGCA 
GTGGATCTGG ACGGAGCAAC CGATAAAGAA AAAGCTTCTC TTCTGGCATG GAGAAAGTAC 
CGGGTACAGG TAAACCGTGT TGATACTTTA AAGCCTGTCT GGCCGGAGAA ACCAGCCAGT 
AGTTTATAA

Protein sequence

MGEVQTKAPL DSPALTGTPT APMPETTAAG IEIATAAFVA AKVAQLVGSA PEALDTLQEL 
ADALGNDPNF AITVLNKLAG KQPLDETLTA LSGKSADGLI EYVGLRETIN HAADALQKSQ 
NGGDIPEKPL FVQNIGALPA SGTAVAANRL ASRGALPALT GTTRGSDSGL IMGEVYNNGY 
PTQYGNILCL TGIGDGEILI GWRGVNGAPA SAYIRSHRDT ADAEWSEWAM FYTSLNPPPD 
SYPVGVAIAW TSDATPAGYA LMQGQLFDKS AYPLLAIAYP SGIIPDMRGW TIKGKPTSGR 
AVLSQEMDGN KSHSHTARAQ DTDLGTKTTG NQVYISDLGP LPENVTSVSP GGGYKKWDSK 
AQVWVNDEAA EAAARLREAE GTKNRRLQIA SEKIAPLQDA VDLDGATDKE KASLLAWRKY 
RVQVNRVDTL KPVWPEKPAS SL