Gene SeSA_A3398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3398
Symbol	gcp
ID	6517292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3280339
End bp	3281352
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	58%
IMG OID	642748392
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_002116165
Protein GI	194735240
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00092258
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGTAC TGGGTATTGA AACATCCTGC GATGAAACCG GCATCGCTAT TTACGACGAC 
AAAAAAGGTC TGTTAGCCAA CCAATTGTAT AGTCAGGTGA AATTACATGC TGACTACGGC 
GGCGTAGTGC CTGAACTGGC TTCCCGCGAT CATGTGCGTA AAACCGTGCC GCTGATTCAG 
GCGGCATTAA AAGAAGCCGG TTTGACGGCG AGCGATATCG ACGCGGTGGC CTATACCGCA 
GGCCCGGGCC TGGTCGGCGC GCTGCTGGTC GGCGCAACCG TCGGGCGTTC ACTGGCATTT 
GCCTGGACTG TGCCGGCCAT TCCTGTACAC CATATGGAAG GTCATCTGCT GGCGCCGATG 
CTGGAAGATA ACCCTCCGGA TTTCCCGTTT GTGGCGCTAC TGGTCTCCGG CGGACATACG 
CAGCTCATTA GCGTGACCGG AATCGGTCAG TACGAACTGC TGGGAGAGTC GATTGACGAT 
GCCGCCGGTG AAGCGTTTGA TAAAACCGCC AAATTGTTGG GGCTGGATTA TCCTGGCGGC 
CCGATGCTGT CGAAAATGGC GTCGCAGGGG ACGGCGGGGC GTTTTGTCTT TCCGCGCCCG 
ATGACCGATC GCCCGGGGCT GGATTTTAGT TTTTCCGGTC TGAAAACCTT TGCCGCTAAC 
ACCATTCGTA GTAATGGCGA CGACGAACAA ACTCGCGCTG ATATCGCGCG CGCTTTTGAA 
GATGCGGTCG TGGATACGCT GATGATCAAG TGCAAGCGCG CGCTGGAAAG CACCGGTTTT 
AAGCGTCTGG TCATGGCGGG CGGCGTCAGC GCTAACCGCA CGCTGCGCGC GAAGCTTGCC 
GAAATGATGC AAAAACGCCG CGGCGAAGTG TTCTATGCGC GTCCGGAGTT TTGTACTGAC 
AACGGGGCGA TGATCGCCTA TGCCGGAATG GTGCGGTTTA AGGCGGGCGT TACGGCGGAT 
CTTGGCGTAA CGGTACGTCC GCGCTGGCCG CTGGCCGAGC TGCCGGCGGC GTAA

Protein sequence

MRVLGIETSC DETGIAIYDD KKGLLANQLY SQVKLHADYG GVVPELASRD HVRKTVPLIQ 
AALKEAGLTA SDIDAVAYTA GPGLVGALLV GATVGRSLAF AWTVPAIPVH HMEGHLLAPM 
LEDNPPDFPF VALLVSGGHT QLISVTGIGQ YELLGESIDD AAGEAFDKTA KLLGLDYPGG 
PMLSKMASQG TAGRFVFPRP MTDRPGLDFS FSGLKTFAAN TIRSNGDDEQ TRADIARAFE 
DAVVDTLMIK CKRALESTGF KRLVMAGGVS ANRTLRAKLA EMMQKRRGEV FYARPEFCTD 
NGAMIAYAGM VRFKAGVTAD LGVTVRPRWP LAELPAA