Gene SeHA_C4738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4738
Symbol
ID	6491848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4619069
End bp	4620259
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	50%
IMG OID	642744792
Product	integrase
Protein accession	YP_002048369
Protein GI	194450328
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.657187
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACTTA CAGCCAGACA GGTCGAAACA GCCAGACCTA AAGAAAAAGA CTATAAACTC 
TCTGACGAAC GTGGTTTATA TCTGCTGGTA AAAACCACGG GTGCCCGCTA CTGGCGGCTT 
AAATACCGGA TAGCAGGAAA AGAGAAAAAA CTGGCCCTCG GCGTCTATCC CGACGTCTCC 
CTTGCTGAGG CCAGAATCAA ACGCGACGAT GCCCGAAAAA TCATCTCCGA AGGTGGTGAC 
CCGGGCGAAA AGAAGCGAAA GGAAAAACTC ACTCAGAAAA TCTCTGCCAC CAATACGTTC 
CATGCCCTCG CTACGGAATG GCACCAGCAT AAATCTTTGT CATGGTCTGA AAGTTACGCC 
AGAAGCGTAC TGGAAGCGCT GGATAAAGAT ATTTTCCCGT ATCTGGGCAA ACGAAGCGTT 
ACGGATATCC TCCCGCTGGA AATGCTGGAA ATTCTGCGCC GCATAGAAAA ACGTGGCTCG 
CTGGAAAAAC TTCGTAAGGT GCGTCAATAC TGTAATCAGA TTTTTCGTTA TGCCATCGCC 
ACCGGACGAG CCACTGTCAA TCCGGCATCT GAACTGACCA GTACGCTGGC GGCGCCAAAA 
GCTGCACATT TCCCCCACCT GAGAGCAGAT GAGCTCCCTG TTTTTCTCCG GAAGCTCGCT 
GAGTATCATG GCAGTCCTGT TACCCGCATG GCGACAAATC TGCTGCTTCT GACAGGCCTC 
AGAACGATTG AACTACGGTC CGCTGAATGG TCAGAAATTG ATTTTGATAA TGCCCTGTGG 
ACAATCCCTG AAAGCCGCAT GAAAATGCGA CGTAAACATG TCGTACCACT GTCACGACAG 
GCCACTGACA TTCTGCTGCA GCTCAAAACT TTCTCCGGAC AATACCGGCT GGTTTTCCCG 
GGACGTTGTG ATATCAACAA GCCAATGAGC GAAGCCAGCA TCAATATGGT GCTCAAACGT 
ATCGGTTACG ATGGCAGGGC AACCGGTCAT GGTTTTCGTC ACACCATGAG TACCATTCTG 
CACGAACAGG GCTTTAATTC TGCCTGGATT GAAATGCAGT TAGCTCATGT GGATAAAAAC 
GCCATCAGGG GTACCTATAA TCATGCCCAG TATCTCGATG GTCGCCGTGA AATGATGCAA 
TGGTACGCAG ATTACATTGA TTCGCTTTCC AGGCAAGAGA GTCAGGGTTA A

Protein sequence

MALTARQVET ARPKEKDYKL SDERGLYLLV KTTGARYWRL KYRIAGKEKK LALGVYPDVS 
LAEARIKRDD ARKIISEGGD PGEKKRKEKL TQKISATNTF HALATEWHQH KSLSWSESYA 
RSVLEALDKD IFPYLGKRSV TDILPLEMLE ILRRIEKRGS LEKLRKVRQY CNQIFRYAIA 
TGRATVNPAS ELTSTLAAPK AAHFPHLRAD ELPVFLRKLA EYHGSPVTRM ATNLLLLTGL 
RTIELRSAEW SEIDFDNALW TIPESRMKMR RKHVVPLSRQ ATDILLQLKT FSGQYRLVFP 
GRCDINKPMS EASINMVLKR IGYDGRATGH GFRHTMSTIL HEQGFNSAWI EMQLAHVDKN 
AIRGTYNHAQ YLDGRREMMQ WYADYIDSLS RQESQG