Gene SeAg_B2801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B2801
Symbol
ID	6792471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	2743734
End bp	2744753
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	53%
IMG OID	642776978
Product	phage portal protein, pbsx family
Protein accession	YP_002147592
Protein GI	197250748
COG category	[R] General function prediction only
COG ID	[COG5518] Bacteriophage capsid portal protein
TIGRFAM ID	[TIGR01540] phage portal protein, PBSX family

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC GGAAATACAG GGAACGCCGC ACCGTTACCA GACCGCGCCA TATGAGCCTT 
ATCACGCTGG GTAAGCCAGA ACCCATTCTG ACGACCGGCA CGAACTATAC AGACGTCTGG 
TATGACAATG AAGCGGAACA CTGGACGCTC CCGATTGACC GGCTGGCGCT GGCGCAACTG 
GTAAACCTGA ACGCGCAGCA CGGTGGCGTG CTGTATGCCC GCCGCAATAT GGTGACAGCA 
AATTATAATG GCGGCGGCCT GACGCATGAG CAACTGGGCG CGGCCGTGTT TGACTGGCTG 
ACGTTCGGTG ATGTGGCCAT TCTCAAGGTA CGTAACGGCT GGGGGGATGT AATCGCACTT 
TACCCGCTGC CGGCACTCTA TACCCGCCAG CGTAAGACCG GGGAATTTGT TGTACTTCAG 
CAGGGTGAAC CGGTAATTTA TCCGCCTGAA GATATTATTT TTCTCAGGCA GTACGACCCG 
CAACAGGCCA TTTATGGTCT TCCGGATTAC ATCAGCGGCA TCCACTCCGC CATGCTCAAC 
GGTGAAGCCA CGATTTTTCG CCGGCGTTAC TACCACAACG GTGGTCACAC GGGCGGCATG 
ATTTATTGCA ACGACCCGAA TATGACCGAC GAAGTGGAAG AAGAAATCAT TCAGAAGCTG 
GAGCAGTCGA AGGGGATCGG GAACTTCAGC ACCATGTTTG TGAACATCCC CAAAGGCGAT 
CCGGATGGCA TCAAATTTAT CCCGATTGGC GATATCAGTG CCAAAGATGA GTTTCAGAAC 
ATCAAAAGCA TCAGCGCCCA GGACGTGCTG ACCGCGCATC GTTTTCCGGC AGGTCTGGCA 
GGGATTATCC CCACCAACGG AGCTATAATG GGCGATATTG AAAAAGCGGC TAAAACATAC 
CGTAAAGCGG AGATTTTACC CATTCAGCGT ATGTTCAGCG CCGCAGTGGC GCAGGAAAGT 
GATGTACCGC CCCACCTGTA CCTTAATTTC CTGAAAGACA GTGAGCTGGA AGGTGATTAA

Protein sequence

MKKRKYRERR TVTRPRHMSL ITLGKPEPIL TTGTNYTDVW YDNEAEHWTL PIDRLALAQL 
VNLNAQHGGV LYARRNMVTA NYNGGGLTHE QLGAAVFDWL TFGDVAILKV RNGWGDVIAL 
YPLPALYTRQ RKTGEFVVLQ QGEPVIYPPE DIIFLRQYDP QQAIYGLPDY ISGIHSAMLN 
GEATIFRRRY YHNGGHTGGM IYCNDPNMTD EVEEEIIQKL EQSKGIGNFS TMFVNIPKGD 
PDGIKFIPIG DISAKDEFQN IKSISAQDVL TAHRFPAGLA GIIPTNGAIM GDIEKAAKTY 
RKAEILPIQR MFSAAVAQES DVPPHLYLNF LKDSELEGD