Gene SeHA_C3491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3491
Symbol
ID	6490816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3387557
End bp	3388579
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	53%
IMG OID	642743620
Product	phage major capsid protein, P2 family
Protein accession	YP_002047234
Protein GI	194451187
COG category
COG ID
TIGRFAM ID	[TIGR01551] phage major capsid protein, P2 family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1.35706e-17
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACCTTA ATAACCGTGC GCGGGAATTA CTGGACGGAT ATTCGGCGGG CATGGCGCAG 
CAGTTTGGGG CGCGTGATGC CAGTCGTTAT TTTTCCCTGA ATAACCCGCA GGAAAATGCG 
CTGCGTCTTG CGCTGCTGGA ATCCGTCGAA TTCCTGGACA TGCTTACCTG TCTGGATGTT 
GATCAGCTGA GTGGCCAGGT GATTTCCGTT GGTTCTTCCG TATTACACAC AGGACGTAGT 
GAAAGTGGCC GTTTTATTCG CCAGGTTGGT GTGGACGGAA ACGACTATTC ACTGGTGGAA 
ACAGACAGCT GCGCCGCGTT GCGCTGGGAT CTGCTTTCGG TCTGGGCAAA CGCCGGTAAA 
GATGAAAACG AGTTTTACAA CCTTGTCCAG GCATTTACCA CGCAGGCTTT TGCACTGGAT 
ATGTTGCGTA TCGGCTTTAA CGGTAAGAGC CGCGCAAAAA CCACTGATCC CGAAGCTAAC 
CCGAACGGTG AAGATGTGAA TATCGGCTGG CATGAGCGCA TGAAAACGCT GCTGGGCGGC 
AATCAGATTA TGACCGATCC GGTGGTGCTG GATGCAGCCG GGGATTACAA ATCACTGGAT 
GCAATGGCGT CAGACCTGAT TAACGCCAAA ATTCCGGCGC AGTTCCGCAA TGACCCGCGT 
CTGGTGGTTC TGGTAGGGGC TGATCTGGTT GCAGCTGAAC AGTATCGCCT GTATCAGGCC 
GCAGACCGTC CGACTGAAAA AATCGCAGCG CAGTTGCTGG GGAATACCAT TGCTGGCCGT 
CCGGCCATTA TCCCGCCTTT TATGCCGGGA AAACGCATGG TGGTGACGCC GCTGAAAAAT 
CTGCACATCT ATACCCAGCG CAATACCCGT ATGCGTAAGG CGGAGTTTGT GGAAGACCGT 
AAGCAGTTTG AAAACAAATA CCTGCGCAAT GAAGGATATG CGGTGGAAGT GCCGGAACTG 
TATGCGGCCA TTGATGAATC CGCCGTAACT ATCGGCAAGG TTTCCGAACC AGCGGAGGGC 
TGA

Protein sequence

MHLNNRAREL LDGYSAGMAQ QFGARDASRY FSLNNPQENA LRLALLESVE FLDMLTCLDV 
DQLSGQVISV GSSVLHTGRS ESGRFIRQVG VDGNDYSLVE TDSCAALRWD LLSVWANAGK 
DENEFYNLVQ AFTTQAFALD MLRIGFNGKS RAKTTDPEAN PNGEDVNIGW HERMKTLLGG 
NQIMTDPVVL DAAGDYKSLD AMASDLINAK IPAQFRNDPR LVVLVGADLV AAEQYRLYQA 
ADRPTEKIAA QLLGNTIAGR PAIIPPFMPG KRMVVTPLKN LHIYTQRNTR MRKAEFVEDR 
KQFENKYLRN EGYAVEVPEL YAAIDESAVT IGKVSEPAEG