Gene SeAg_B2787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B2787
Symbol
ID	6793594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	2732288
End bp	2734255
Gene Length	1968 bp
Protein Length	655 aa
Translation table	11
GC content	51%
IMG OID	642776964
Product	phage tail tape measure protein, TP901 family, core region
Protein accession	YP_002147578
Protein GI	197250251
COG category	[S] Function unknown
COG ID	[COG5283] Phage-related tail protein
TIGRFAM ID	[TIGR01760] phage tail tape measure protein, TP901 family, core region

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAGT TAGATTTTAC ATTAAGCCTG ATTGATAAAC TGACGCGCCC GTTAAAGCAG 
GTGCAGAGCA GTGTCACAGG CTTTGCGGAA AAATCGAAAG CGGCCTTTAC GCAGATTGGG 
GGCGGTGCGC TGGCTTTAGC CGGCACAGGG ATGGCCATCA AAGGGGCGTT ATCGCCGGCT 
ATTGAGATGT ATGACGCACT GAATGACGCT GCGGCAAAAG GGATTGATGA TCAGGCTTTA 
AAGGCTGTCC AGCGTGATGC GCTGCGGTTC AGTATGACCT ACGGTGCCAG CGCGGTGGAG 
TTTGTTAAGT CCACAGAAAA TATTAATGCC TCCATTGCCG GCCTCGCCGG TAATGAGCTG 
CCGAAAGTGA CAAAAGTTGC TAATACCCTG GCATTTGCCC TGAGATCCAC ATCTGCCGAA 
ACGGCGGAAT TTATGGGGCA GATGTTCGGT AACTTTTCCG CTGATGCGGA GCGTCTGGGC 
AAGGTTCAGT TCGCTGAGCA GCTGGCCGGA AAAATGGTGT ATATGCGCAA GGTCTTCGGT 
ACCGAAATGG GCACTATCAA AGACCTGATG GAAGGGGCGC GGGGCGTTGG TACCAACTAC 
GGCGTCGGAC TGGATGAACA GCTGGCCGTA CTGGGGCAGC TTAACCGCAC GCTGGGAACG 
GAAGCCAGCA GCGCTTACGA AGGCTTCATG ACCGGAGCCA TTGAGGGCGG TAAAAAGCTG 
GGGCTGTCCT TTACGGATGC CACCGGCAAA ATGCTGTCCA TGCCTGAAAT GCTGATCAAG 
TTACAGGGCA AGTATGGCAA AAGTCTGGAA GGGAACCTGA AAGCACAGGC GGAGCTGGAT 
GCGGCATTTG GTGACAGTTC GGCGGTGGTG AAACACCTGT ACGGCAATGT GGCCTTACTG 
CAACGTAACA TCACTGAGCT GGGCGGTTCT GACGGGCTGA AGCGTACACA GGAGATGGCC 
GGCAAACTGG TGAAACCGTG GGATCGCTTT GTACAGATCC TTAAGTCTGT TCAGACCGTC 
ATTGGACTGA CGTTGATCCC CGTTCTGTAT CCGGTGCTGA ACCGCCTGGC TGATATGGGA 
CAGACCTTTG CCCGCTGGAT GCAGTTGTTT CCCAACATTG CGCGTGTTAT CGGTTATGCG 
GCTATGGCGT TGTTGGGGTT TGCTGCTGCC GGCGCAATAG CTAACATCGT TCTGGGCGTC 
TCAAAACTTA TTAAGCTGGG TGCGATTGCT CTCTGGAAGA CACTGACTTC AGTCACGAAG 
ATATACACCG CCACCGTCTG GATTGCCTCA AAAGCTGTAG CGGCATGGAA TCTGACGCTT 
AAATTTCTGC GTGGTACGCT TCTTGCGGTT CGTATGGCGG CAATTATGGC CGGAATTGGC 
ATAAATCTGA TGAGCTGGCC GGTTCTGCTG GTTATTGGTG CGATTGGCCT GCTGGCAGCA 
GGGTGTTATC TGCTGATTAA ACACTGGGAC GATGTACAGG CGGCGGTGAT GAATACGGCA 
GCGTTTACCG CTGTGGCTGG CGTTGTCGAA TGGCTTGCCG GTGTGTTCTC GACGGCATGG 
CAATGGATTA AGGACGGCTG GAACGGCTTT ATTAATCTGC TGACGGGATT TTCACCTTCA 
CAGGCATTAA GCGGGATGGC CGGTGGTATT GTATCCATGT TTGATAATAT CTGGCAGTCC 
GTTAAAGGTA GCTTCCTGAA ATCATGGAAC TGGATTGTAG AAAAGTTGAA TAAAATACCC 
GGTGTCAATA TTTCGCTGGC TAACGAGTCA CCTCCGGCAC TGACAACAAA TACGCTTTCT 
ACTGGTGGAG AATTAAAAGG AATTGATAAA GGTGGTATTA GTAAATCTGT TAGTAATAAC 
TCAAGGGTTG TGACGGATAA CAGTCGGAAA ATTAATACTG TCAATATCTA TCCAAAAGAA 
ATGATAACGC CGGGGCAGTT AATGGAGTTT CAGGAGCTGG GCGTATGA

Protein sequence

MKQLDFTLSL IDKLTRPLKQ VQSSVTGFAE KSKAAFTQIG GGALALAGTG MAIKGALSPA 
IEMYDALNDA AAKGIDDQAL KAVQRDALRF SMTYGASAVE FVKSTENINA SIAGLAGNEL 
PKVTKVANTL AFALRSTSAE TAEFMGQMFG NFSADAERLG KVQFAEQLAG KMVYMRKVFG 
TEMGTIKDLM EGARGVGTNY GVGLDEQLAV LGQLNRTLGT EASSAYEGFM TGAIEGGKKL 
GLSFTDATGK MLSMPEMLIK LQGKYGKSLE GNLKAQAELD AAFGDSSAVV KHLYGNVALL 
QRNITELGGS DGLKRTQEMA GKLVKPWDRF VQILKSVQTV IGLTLIPVLY PVLNRLADMG 
QTFARWMQLF PNIARVIGYA AMALLGFAAA GAIANIVLGV SKLIKLGAIA LWKTLTSVTK 
IYTATVWIAS KAVAAWNLTL KFLRGTLLAV RMAAIMAGIG INLMSWPVLL VIGAIGLLAA 
GCYLLIKHWD DVQAAVMNTA AFTAVAGVVE WLAGVFSTAW QWIKDGWNGF INLLTGFSPS 
QALSGMAGGI VSMFDNIWQS VKGSFLKSWN WIVEKLNKIP GVNISLANES PPALTTNTLS 
TGGELKGIDK GGISKSVSNN SRVVTDNSRK INTVNIYPKE MITPGQLMEF QELGV