Gene SeHA_C4703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4703
Symbol
ID	6489730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4584087
End bp	4585319
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	43%
IMG OID	642744762
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_002048339
Protein GI	194450873
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG [TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	101
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTGCA ATGAATTAAA AGAATTTGCG CAAGAGCAGG AACAAAAACT TATCAGTGCG 
CTTGCTGATA CCAGAGAGCA CCCGTCCCCC GATGGTGAAA CAAGAAGCCG GGATAATTAT 
CAACGGGATT ACGCGCGTAT TCTGTATTCA TCATCATTTC GCAGGCTGCA GGGAAAGATG 
CAACTTTTTG AAATTGATCC TGAAAAATTC AACAGAAACA GATTAACGCA CAGTCTTGAG 
GTTGCTCAGA TCGCCCGAAG TATCGCGTCA GACCTCAAAC TGATTAACCC GGTGGTGGTT 
GAACTGGCAG CGCTGGCGCA TGACATCGGA AATCCTCCTT TCGGTCATTC CGGTGAAAAA 
CTGCTTAATG AACTGTCTGA AGAAATCGGC GGCTATGAAG GTAATGCACA GGCGCTACGT 
ATCCTGAGAA AACTGGAGAA GAAATTTTCA TACTGCAACG GATTAAATCT GACTCACCGT 
AGTTTACTTT CGGTTGTTAA GTATCCCATC CCCCGCGCTG CAGCTACTGC CGGCAAGTTC 
ATTTATGATG ATGATTACTA TTTTTACATT AACCTGCTTG CTGAAAATCA GCTCGATCTG 
AATCCCGGAG AGAAAACGAT TGATGCGCAG ATAATGGATC TCGCGGATGA GATTGCCTAC 
GCCGCGCATG ACCTGGAAGA TGCCCTTAGC AGGAACATGG TCACGATTGA AGATATTGAA 
TATGAGTTTC AGATTTCTGA CGAATTCCGG GGAGCGAGGG AACAGTTCAG GGAAATCGTT 
ACTCAGTCGA GAAACACCGC TTTTCAGGCT AACTTACTGA AAACCTCAGA AGAATTTGCC 
ATCATATTCC GCAAGGAGTT AACTTCAAAT ATTGTCAATC GCCTCGTTGC AGATATTTCT 
GTAGTAACGA ACCTGAATGG TTTTCAGGAA CTGGGGTTCG GGAAACTGAA TGCGTTATCC 
GAAGGACTCA AAAAACTTCT CTTTAAAGTC ATCATGCGAA AACGTAATAT CCTCACCTAT 
GAGTTCAGGG GAAATAAAAT AATCAGGGAT TTATATGACT TTTACAATGA AGGAGAGAAT 
TATAAATTTC TGCCTCCTGA ACTTAAATTC ACCTTACCCC AACCAGATTC CTGTATATTT 
GAAATCAGCA AAAAACGAGC AGTGGTTGAC TATATTTCAG GTATGATGGA TACATTTGCA 
GTCAAGGAAT GGGAAACTCA CTGTCTGAAG TAA

Protein sequence

MYCNELKEFA QEQEQKLISA LADTREHPSP DGETRSRDNY QRDYARILYS SSFRRLQGKM 
QLFEIDPEKF NRNRLTHSLE VAQIARSIAS DLKLINPVVV ELAALAHDIG NPPFGHSGEK 
LLNELSEEIG GYEGNAQALR ILRKLEKKFS YCNGLNLTHR SLLSVVKYPI PRAAATAGKF 
IYDDDYYFYI NLLAENQLDL NPGEKTIDAQ IMDLADEIAY AAHDLEDALS RNMVTIEDIE 
YEFQISDEFR GAREQFREIV TQSRNTAFQA NLLKTSEEFA IIFRKELTSN IVNRLVADIS 
VVTNLNGFQE LGFGKLNALS EGLKKLLFKV IMRKRNILTY EFRGNKIIRD LYDFYNEGEN 
YKFLPPELKF TLPQPDSCIF EISKKRAVVD YISGMMDTFA VKEWETHCLK