Gene SeSA_A0633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A0633
Symbol
ID	6515855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	621067
End bp	622386
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	50%
IMG OID	642745777
Product	phage terminase, large subunit, pbsx family
Protein accession	YP_002113600
Protein GI	194735659
COG category	[R] General function prediction only
COG ID	[COG1783] Phage terminase large subunit
TIGRFAM ID	[TIGR01547] phage terminase, large subunit, PBSX family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000041592
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAAAGCC AAGTTGACCT CCAGATACCT GCCAAGTTAG TTCCTGTATT CGCGACAGAA 
GGAGTCCGTT ATCGTGGTGC TCACGGTGGA CGTGGATCTG CTAAGACGCG TACTTTTGCA 
CTAATGACTG CCGTCAAAGC GTATCAAGCG GCAGAAGCCA ATATCAGTGG AGTTATCCTG 
TGCGCTCGAG AATACATGAA CTCGCTGGAA GAATCCTCCA TGGAGGAGGT AAAGCAGGCA 
ATTCGCTCCG TGGCGTGGCT TGACGATTAC TTCGACATTG GAGAGAAATA CATCAGGACA 
AAGAACCGCA AGGTCAGCTA TGTATTCTGC GGTCTTCGCC ATAACCTAGA CAGCATCAAA 
TCAAAAGCGC GAATTCTTGT AGCCTGGGTT GACGAGGCCG AGTCTGTTTC TTCGACTGCG 
TGGAAAAAGC TTCGCCCGAC CGTTCGTGAA GAAGGCTCAG AAATCTGGGT TACGTGGAAC 
CCGGAGAAGG ACGGCAGCGC CACCGACAAA CTTTTCAGAA AGAATCCCCC AAAAAGCTCA 
ATTATTGTCG AGATGAACTA TGTTGACAAT CCATGGTTCC CCGCGGTGCT TGAGGAAGAG 
CGACAGGAAG ACCTGGCAAA CCTTGATTAC GCAGATTACG CGTGGATATG GGAGGGGGCT 
TACCTCGAAA ACTCAGATAA GCAGGTGCTG GCTAACAAAT ATGTCGTGCA GAGCTTCGAA 
GACAATCTAT GGAGGAAATC AGAGCGCTTG CTGTTCGGTG CTGACTTCGG ATTCGCGAAA 
GACCCCAGCA CGCTTATTCG CATGTTCATT CTGGATAACA ACCTCTACAT CGAATACGAG 
GCCTACGGCA ATGGCGTAGA GCTCGACGAT ATGTGGAAGT TTTATGCAGG CAAAACCGAT 
GCCACGCCGA AACAGCTTGA GGACTGGGAG GTCACTGACG ATGCGAAATT CCCCGGTATC 
CCTGAAGCGC GTAAATGGCC CATCAAAGCC GACAACTCCA GGCCAGAAAC TATCAGCCAT 
ATCAAAGGGC AGGGATTCAA CATCTCAGCT GCTCAGAAAT GGCAGGGTAG CGTAGAGGAC 
GGCATCACTT TCCTACGTGG ATTTAAGAAG ATCATCATCC ATCCTCGCTG CAAAGAAACA 
GCGAAAGAGG CGCGGCTTTA CTCGTACAAA ACAGACCGTA TCACTGGCGA AGTCTTGCCG 
ATTATCGAGG ATAAGTACAA CCACTGCTGG GATGGAATCC GATACGGTCT GGACGGGTAT 
ATCAAACGCA AACCTCAATC GATGGGGATG ATGATTCCTA AGCGCCTTAG GGGGAAATAA

Protein sequence

MESQVDLQIP AKLVPVFATE GVRYRGAHGG RGSAKTRTFA LMTAVKAYQA AEANISGVIL 
CAREYMNSLE ESSMEEVKQA IRSVAWLDDY FDIGEKYIRT KNRKVSYVFC GLRHNLDSIK 
SKARILVAWV DEAESVSSTA WKKLRPTVRE EGSEIWVTWN PEKDGSATDK LFRKNPPKSS 
IIVEMNYVDN PWFPAVLEEE RQEDLANLDY ADYAWIWEGA YLENSDKQVL ANKYVVQSFE 
DNLWRKSERL LFGADFGFAK DPSTLIRMFI LDNNLYIEYE AYGNGVELDD MWKFYAGKTD 
ATPKQLEDWE VTDDAKFPGI PEARKWPIKA DNSRPETISH IKGQGFNISA AQKWQGSVED 
GITFLRGFKK IIIHPRCKET AKEARLYSYK TDRITGEVLP IIEDKYNHCW DGIRYGLDGY 
IKRKPQSMGM MIPKRLRGK