Gene SeHA_C4439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4439
Symbol
ID	6489003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4321160
End bp	4322716
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	51%
IMG OID	642744521
Product	5'-Nucleotidase domain-containing protein
Protein accession	YP_002048110
Protein GI	194449759
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.088476
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTAA AACTGCTTGC TGCCGGTATT TTGTTCACGC TGCCGTTCTG GGCCTGCGCC 
AAAGATGTCA CCATTATTTA CACCAACGAT CTACACGCTC ATGTGGAGCC TTATAAAGTG 
CCGTGGATTG CTGACGGTAA ACGCGATATT GGCGGTTGGG CCAATATCAC TACGCTGGTG 
AAGCAGGAAA AAGCCAAAAA TAAGGCGACG TGGTTTTTTG ATGCCGGAGA TTACTTTACC 
GGACCGTATA TCAGCAGCCT GACGAAGGGT AAAGCGAATA TCGATATTTT GAATACCATG 
CAGTATGACG CTGCCACTAT CGGTAATCAT GAGTTCGATC ATGGCTGGGA CAATACATTG 
TTGCAACTGA GCCGAGCAAA ATTCCCTATC GTACAGGGCA ATATTTTTTA TGAGGACAGC 
AGTAAATCCT TCTGGGATAA GCCGTACACC ATTGTTGAAA AAGATGGCGT CAAGATTGGC 
GTAATCGGCT TACACGGTGT CTTTGCTTTT AATGATACGG TTTCTGCCGC GACGCGCGTG 
GGCATTGAGG CACGCGATGA AATTAAGTGG CTGCAACGTT ACATTGATGA ACTTAAAGGT 
AAAGTCGATC TGACCGTCGC GCTGATCCAC GAAGGCACCC CGGCCCGCCA GTCCAGCATG 
GGGAATACCG ATGTGCGACG CGCGCTGGAT AAAGATATTC AGACCGCAAG TCAGGTAAAA 
GGGCTGGATA TTTTGATTAC CGGCCACGCG CATGTCGGTA CGCCGGAACC GATTAAAGTC 
GGTAATACGC TGATTCTTTC AACGGACAGC GGCGGCATTG ATGTGGGTAA ACTGGTGCTG 
GATTACAAAG AGAAACCACA CCACTTTACG GTGAAGAACT TCGAGCTGAA GACCATTTTT 
GCTGATGAGT GGAAGCCCGA TCCGCAAACG AAACAGGTGA TCGACGGCTG GAATAAAAAG 
CTCGATAAAG TCGTGCAGCA GACGGTGGCG CAATCGCCGG TTGAGCTGAC CCGCGCGTAT 
GGCGAATCGT CGTCGCTGGG GAATCTGGCG GCGGATGCGC TGCTTTTTAC GGCGGGGAAA 
GACACCCAGT TAGCGCTTAC TAACTCTGGC GGTATCCGCA ACGAAATCCC GGCTGGCGCG 
GTGACGATGG GGGCGGTAAT CAGTACCTTC CCGTTCCCTA ATGAACTGGT CACGATGGAT 
TTAACCGGTA AACAATTGCG CAGCCTGATG GAGCATGGCG CTGGATTAAG CAACGGCGTA 
TTGCAGGTGT CTAAAGGGCT GGAGATGAAG TATGACAGCA GCAAACCTGT CGGCCAGCGG 
GTTACCGTGC TGACGCTCAA TGGCAAACCG ATTGACGATG CTACGGTTTA TCATATTGCC 
ACCAACAGCT TCCTTGCCGA CGGCGGCGAT GGTTTTGCGG CGTTCACGGA AGGCCAGGCG 
CGGAATACCT CCGGCGGCTA CTATGTGTCG AATGCGATAG TTGATTACTT TAAGGCGGGC 
AACACCATCA CGGATGAGCA GCTCAAAGGG ATGCGCGTTG CGGATGTGAA GAAGTAA

Protein sequence

MKVKLLAAGI LFTLPFWACA KDVTIIYTND LHAHVEPYKV PWIADGKRDI GGWANITTLV 
KQEKAKNKAT WFFDAGDYFT GPYISSLTKG KANIDILNTM QYDAATIGNH EFDHGWDNTL 
LQLSRAKFPI VQGNIFYEDS SKSFWDKPYT IVEKDGVKIG VIGLHGVFAF NDTVSAATRV 
GIEARDEIKW LQRYIDELKG KVDLTVALIH EGTPARQSSM GNTDVRRALD KDIQTASQVK 
GLDILITGHA HVGTPEPIKV GNTLILSTDS GGIDVGKLVL DYKEKPHHFT VKNFELKTIF 
ADEWKPDPQT KQVIDGWNKK LDKVVQQTVA QSPVELTRAY GESSSLGNLA ADALLFTAGK 
DTQLALTNSG GIRNEIPAGA VTMGAVISTF PFPNELVTMD LTGKQLRSLM EHGAGLSNGV 
LQVSKGLEMK YDSSKPVGQR VTVLTLNGKP IDDATVYHIA TNSFLADGGD GFAAFTEGQA 
RNTSGGYYVS NAIVDYFKAG NTITDEQLKG MRVADVKK