Gene SeHA_C3462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3462
Symbol	gcp
ID	6490150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3364970
End bp	3365983
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	58%
IMG OID	642743591
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_002047206
Protein GI	194450356
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0322419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	0.0346823
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGTAC TGGGTATTGA AACATCCTGC GATGAAACCG GCATCGCTAT TTACGACGAC 
AAAAAGGGTC TGTTAGCCAA CCAATTGTAT AGTCAGGTGA AATTACATGC TGACTACGGC 
GGCGTAGTGC CTGAACTGGC TTCCCGCGAT CATGTGCGTA AAACCGTGCC GCTGATTCAG 
GCGGCATTAA AAGAAGCCGG TCTGACGGCG AGCGATATCG ACGCGGTGGC CTATACCGCA 
GGCCCGGGCC TGGTCGGCGC GCTGCTGGTC GGCGCAACCG TCGGGCGTTC ACTGGCATTT 
GCCTGGAATG TGCCGGCCAT TCCTGTACAC CATATGGAAG GTCATCTGCT GGCGCCAATG 
CTGGAAGATA ATCCCCCGGA ATTCCCGTTT GTGGCGCTAC TGGTCTCCGG CGGACATACG 
CAGCTCATTA GCGTGACCGG AATCGGTCAG TACGAACTGC TGGGAGAGTC GATTGACGAT 
GCCGCCGGTG AAGCGTTTGA TAAAACCGCC AAATTGTTGG GGCTGGATTA TCCTGGCGGC 
CCGATGCTGT CGAAAATGGC GTCGCAGGGG ACGGCGGGGC GTTTTGTCTT TCCGCGCCCG 
ATGACCGATC GTCCGGGGCT GGATTTTAGT TTTTCCGGTC TGAAAACCTT TGCCGCTAAC 
ACCATTCGTA GTAATGGCGG CGACGAACAA ACTCGCGCTG ATATCGCGCG CGCTTTTGAA 
GATGCGGTCG TGGATACGCT GATGATCAAG TGCAAGCGCG CGCTGGAAAG CACCGGTTTT 
AAGCGTCTGG TCATGGCGGG CGGCGTCAGC GCTAACCGCA CGCTGCGCGC GAAGCTTGCC 
GAAATGATGC AAAAACGCCG CGGCGAAGTG TTCTATGCGC GTCCGGAGTT TTGTACCGAC 
AACGGGGCGA TGATCGCCTA TGCCGGAATG GTGCGGTTTA AGGCGGGCGT TACGGCGGAT 
CTTGGCGTAA CGGTACGTCC GCGCTGGCCG CTGGCCGAGC TGCCGGCGGC GTAA

Protein sequence

MRVLGIETSC DETGIAIYDD KKGLLANQLY SQVKLHADYG GVVPELASRD HVRKTVPLIQ 
AALKEAGLTA SDIDAVAYTA GPGLVGALLV GATVGRSLAF AWNVPAIPVH HMEGHLLAPM 
LEDNPPEFPF VALLVSGGHT QLISVTGIGQ YELLGESIDD AAGEAFDKTA KLLGLDYPGG 
PMLSKMASQG TAGRFVFPRP MTDRPGLDFS FSGLKTFAAN TIRSNGGDEQ TRADIARAFE 
DAVVDTLMIK CKRALESTGF KRLVMAGGVS ANRTLRAKLA EMMQKRRGEV FYARPEFCTD 
NGAMIAYAGM VRFKAGVTAD LGVTVRPRWP LAELPAA