Gene SeHA_C3470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3470
Symbol
ID	6487822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3372207
End bp	3373910
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	58%
IMG OID	642743599
Product	phage protein
Protein accession	YP_002047213
Protein GI	194447335
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.0000394685
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGAAAC CAGTAAAACG CCTTTACCTT TCAACGGATG AAATACACCT GGCTGACGCC 
AGTCTGGTGC TGGAGCTGAA CAGCTGTGGA CGTGGCTTTA TTACGGCACA GACAACCACA 
GACTACACCG GCAAACTGGT ACGGCTGGAT GTGGGGTATT CCGGTTTACT TCTGCGCTGG 
TTTACCGGCT ATGTGGAGCG CTCACAGCCT GCCGAAAACG GTTATCAGCG TCTGTTTGTC 
CGCGAGCTGG CTGGCGTGTT TGAGCGGATG TGGCCATGCT CATTTCAGCA TCCCACACTG 
CGCGATGTGG CCGGATGGCT GGAGGAAAAC AGCGGGATCA GCATTGCGGT ACCGGATGTG 
CCGTACAGTG ATAAACCGAT CCCCCATTTC ACCCATAACG GGACGGGATA CCAGCTGCTG 
AATAACCTGG GCAGGGCATT CAGTATCACG GATTACATCT GGTATCCATT GCCGGATGGT 
TCGCTGTATG TCGGCGGCGC AGAAAAGGCG CTGTTTGCCG GACGCCCGGT AGAAATCCCG 
GCAGAGTTCA GCCAGGGAAC GGCGGGCGGT AATTCCATGA CATTGCCGGT GATCCAGAGT 
CTTCGTCCGG GCGTGGACGT GAACGGGGAA CGCGTGACCA AAGTTCATCT GACGAATGAC 
ACAATGACCA TCACCTGGAC ACCACGGAAC CGCGCCACAG GTCAGCCATT GCAGAAAACA 
CCGGCGCAGC GTCAGATAGA AAACCATTAC CCGGAACTGG CTTCAGGTCT TCACCTGCCC 
AAACTGGCCA GGGTGGTGGC ACCCAGCGAG GCCGTAAAAA GCGGTAATTT TGCCGACCCG 
TTCCGGCCAC GGTACGCTGT TGACGTGCAG CTGCTTGACG CGGACGGCAA CCCGGACAAC 
CAGACGCCGG TATATTCCGC CGTACCGCTG CCAGTGCCAA TGGCCGGTAA CGATTCGGGA 
ATGTTCCAGT TTCCACCGGA AGGAACGCTG GTAGAGGTGG CGTTTACGGG CGGCAGGCCG 
GATAAGCCCT TTATCAGGCA GACGCTGCCG GATGGCACCA GTCTGCCGGA CATTAAGCCC 
GGCGAACAGC TGCAACAGCA GCGGGCGGAA GTCTCGCAAC GCGTGACACA GGCAGGAGAC 
TGGGTACGCC AGACGGATCA GACCATCAGT GAAACATCGA TGGCGCGGAC GGTGAAAGCC 
GATACGGAAC GGCGCGAACT GGTCAGCCGT GAAACCACGG TGAAAGCCAC GGATAAAATC 
ACAGTACTGG GTACCGCCAC GCTGATGGCT GGAGCCATAC AGCAGGTCAG CGCTGGCGAC 
TTCAGCCAGG CGGTAAAAGG AAACCGGCTG GCCAGTATTA CAGGAAATGA AGAAACCGAA 
ATCGCCGGGC AGCAGTCCAC GAAAGTGGCC GGTGCCATGA ATGTTGATGT GGGGGGAACC 
CTGACAGAAA AGATTGCCGC ATTGCGTAAG TCGGTGGCAT CGGGCGGTCA GCAAATTATG 
GGGCCAACCG TCCATATTGG CAGTGAGAGC GTCAACACAC TGACCATGAT GCTGGACACC 
ATTGATTTAC TGGCAGAGCT GGCGCAGCAG TGCGCGAGCC ATTCACACCC CAGTGTTGGC 
ACGCCGACCA ATGCCGGAGC ATTCAACCAG ACGGCAGTAA AGGCCGGGCA GACCCGGAGC 
AAGTACCAGA ACATCATCGC CTGA

Protein sequence

MMKPVKRLYL STDEIHLADA SLVLELNSCG RGFITAQTTT DYTGKLVRLD VGYSGLLLRW 
FTGYVERSQP AENGYQRLFV RELAGVFERM WPCSFQHPTL RDVAGWLEEN SGISIAVPDV 
PYSDKPIPHF THNGTGYQLL NNLGRAFSIT DYIWYPLPDG SLYVGGAEKA LFAGRPVEIP 
AEFSQGTAGG NSMTLPVIQS LRPGVDVNGE RVTKVHLTND TMTITWTPRN RATGQPLQKT 
PAQRQIENHY PELASGLHLP KLARVVAPSE AVKSGNFADP FRPRYAVDVQ LLDADGNPDN 
QTPVYSAVPL PVPMAGNDSG MFQFPPEGTL VEVAFTGGRP DKPFIRQTLP DGTSLPDIKP 
GEQLQQQRAE VSQRVTQAGD WVRQTDQTIS ETSMARTVKA DTERRELVSR ETTVKATDKI 
TVLGTATLMA GAIQQVSAGD FSQAVKGNRL ASITGNEETE IAGQQSTKVA GAMNVDVGGT 
LTEKIAALRK SVASGGQQIM GPTVHIGSES VNTLTMMLDT IDLLAELAQQ CASHSHPSVG 
TPTNAGAFNQ TAVKAGQTRS KYQNIIA