Gene SeHA_C3476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3476
Symbol
ID	6487706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3378277
End bp	3379461
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	55%
IMG OID	642743605
Product	phage protein
Protein accession	YP_002047219
Protein GI	194449502
COG category	[S] Function unknown
COG ID	[COG3299] Uncharacterized homolog of phage Mu protein gp47
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00000000149492
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGGAAA AGCCACAGGT TGACTTTGAA GAGGTGGTGA AAGCCAGCGG TATGCCGGTG 
ACGGAAGAAG AGATTCGCGA TCGCTTTAAT GCCATTGCGA CGGAGGAGGG AATTATCACG 
AATACCTCCC GTATGTCTCC GTTCTGGCGA CTGGTCACGG CCATTGTAAC CGCGCCGGTG 
ATGTGGCTGA AGGAGGTTCT GATCTCCACC GTACTGGCAA ATATGTTTGT GGCCACGGCC 
AGTGGAAGCA TGTTACGGCT GCTGGCATGG GCGGTGAATA TCACGCCGAA GCCAGCCAGC 
GCTGCACAGG GCGTTATCCG TTTTTACAAG GAAGACGCCA GCGCCGTGGT GACGGTGAAG 
GCCGGAACGG TGATACAGAC AGAACGTATT AACGGCAGGG TGTATGAACT GGCCATCACG 
GAAGATGTGG TGATTGCCTC CGGTACCGCC AGCGCACTGC TGCCGGTAAA GGCAACGGGA 
ACGGGCGGCG CATATAACCT TGCGCCGGGA TATTACCGCA TTCTGCCGGT GGCCGTGGAC 
GGCATCAGCC ATGTGGCCAG TGAAGAAAAC TGGCTGACCG TACCGGGCGC GGATGAGGAA 
AGCGATGATG AACTGCGTGA GCGTTGCCGT AACCAGTTTA ACCTGGTGGG CAACTACCAT 
ACGGACGCGG TGTACCGGTC GATGATAGCC GGTGTTGCCG GACTGAGCAT TGACCGGATT 
TTCTTTGAGC ACGAAGCACC GAGGGGGCCG GGGACAGCCA ACGCCTATTT ATTGCTGGAC 
AGCGGCGTGG CTTCTGCGCC GTTTGTGGAT GCCGTGAATG ACTATATCAA CACTCAGGGA 
CATCACGGCC ACGGGGACGA TATGCAGTGT TATGCCATGC CGGAAACCCT GCACGATCTG 
GTGGTCACTG TCTGGGTCAG GAACCTGAAC AACATCAGTG ATGATGAACA GAAGCGCCTG 
AAGGACGGTA TTGAAAACCT GATCCGGTGC GCCTTCCGGG AAAATACGGA CTATGACGTC 
AGAAGGACGT GGCCGTATTC ACGGTTCTCC TTCTCGCAGC TGGGGCGCGA AATCCATAAA 
AATTTTCCGG TAACAGAATC GCTGAATTTT TCGCTGGATG ACATTGCCAG TGAGCTGAAT 
GTGCCGCGCC TGAAATCGCT TGTGGTGAGT ATTGAGAATG AATGA

Protein sequence

MTEKPQVDFE EVVKASGMPV TEEEIRDRFN AIATEEGIIT NTSRMSPFWR LVTAIVTAPV 
MWLKEVLIST VLANMFVATA SGSMLRLLAW AVNITPKPAS AAQGVIRFYK EDASAVVTVK 
AGTVIQTERI NGRVYELAIT EDVVIASGTA SALLPVKATG TGGAYNLAPG YYRILPVAVD 
GISHVASEEN WLTVPGADEE SDDELRERCR NQFNLVGNYH TDAVYRSMIA GVAGLSIDRI 
FFEHEAPRGP GTANAYLLLD SGVASAPFVD AVNDYINTQG HHGHGDDMQC YAMPETLHDL 
VVTVWVRNLN NISDDEQKRL KDGIENLIRC AFRENTDYDV RRTWPYSRFS FSQLGREIHK 
NFPVTESLNF SLDDIASELN VPRLKSLVVS IENE