Gene SeD_A1871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1871
Symbol
ID	6872649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1808603
End bp	1810303
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	57%
IMG OID	642784997
Product	putative amidohydrolase family protein
Protein accession	YP_002215665
Protein GI	198242385
COG category	[R] General function prediction only
COG ID	[COG1574] Predicted metal-dependent hydrolase with the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0576549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGTC TCGTCCCGCC TCTGCTTTCC AGAACCGCGC TTCTCTTTCT GCTCACGGCC 
ACAGGCGCAG CCACCGCCGC CCGCCCGGCA GCGGATATTA TTTTGCATAA CGGTAATATC 
ATCACTCTGA ATGATGCCCA GCCGCAGGCC AGCGCGCTGG TGATTTCCGG CTCGCGGATT 
GTGGCGATTG GCGATGATAC GGCGACAGAT GAATGGCGCG GCGACCATAC CCGTACCATC 
GATTTACAGG GTAAAACCGT GATACCCGGC CTGACCGATA CCCACATCCA CGCCATTCGC 
GGCGGACAAA CCTGGACATT CGAAACCTAC TGGTACGACA GCCCTTCGCT TAAAGACGCG 
CTGGATAAAT TACGCGCCGA CGCTAACCGT CGTCCCCACG ATCAATGGGT AGCCGTAGTG 
GGATCGTGGA TACCGGCGCA ATTTGCAGAA AACCGGGCGC CGACGGTAGC CGAATTGAGC 
CACGCCCTTC CCGATCATCC GGCTTATATT CAGTATCTTT ACGACTATGC TTTAGTGAAT 
CAGCGCGGTA TAGACGTACT TGGCCTTAAC GACACCCCTC CTCCTGATTT AGCGGGAATC 
CGCGTAGAGC GCGACGCAAA AGGTAGCGCC ACGGGGAAAT TATTTGGTGA CATCGCCGCG 
TTTAACCAGC TTTTTGCCAG CATAAGTAGT AACGCCGATC GCGAGGGCGG TCTGCGACAA 
TTTTTCGCTG ATATGAACGC TCGCGGCGTG ACCGGCATCA TTGACCCCTC TGCCGGGCCT 
GCCGCCGCTT ATGAGCCTTT ATTTGCAATG CGAAACCAGG GGGATTTACC GCTGCGCGTG 
GGGTATCGCA TTCCGGTACA GCCAGAAGCG AAAGGTCATG AAGCGCAGTG GTTCAGCAAC 
CTGATGGCCT TTCGCCCGGC GCGTGCCGAT GACGGGCAAC TGGCTTTTCT TGGCCTGGGG 
GAAAGCCTGG TGGCCGGAAT GAATGACGGC GTGCGGATGG CCCCAGGGTT TTCTTCCTCA 
GAGCAGGACA AAACCGCGCT TCGCCAGGTC GCGACATTTG CGGCAAAACG GGGAATACCG 
CTTGAGATCC ACGCCTATAC CGATGACAGC GCCGACGCGA TATTGACGAT TTTTGAGCAG 
GTAGCGCAGC AGTACGATCT GCGCCCTCTC CGCTGGTCTA TTGCGCATCT GAATACCGGT 
TCGCCACAGA CGCTTGAGCG AATGCGTAAG CTGGGTCTGG CATACACTGT GCAAATGGGG 
CCTTACTTTG AGGGGCTTGC CATCCGTGAC GCCAATCCCC CCGGCGCGAC GGACAATTCG 
CCGCCGGTTC GACTGGCGCT GGATAAAGGG CTTGTCGTAG CTGGCGGTAC CGATTCGACG 
CGTATTGGCA TTGCCGGTGT CTGGCACGCT ATCGAATATC ATATCATCGG TATAGCGTCA 
GGCGGTTCCG TGCGTAAACC CGCCAGCGAG CGGCTCACGC GTCTGGAAGC GCTAGCGTTA 
TATACACGTC ATGCCGCCTG GCTCGCCTTT GCCGAACAAC ACCGGGGCCA GCTTCGCGTC 
GGAAAACAGG CCGATCTGGC GGTACTCAAT CAGCCATTTA TGACGATGCC GGAAGACAGA 
ATTGATACCA TTCGCGCTGT TTTGACGCTT GTCGATGGAC GCATTGTTCA CGAAAGTCCG 
GACCTTAACG CCGGACAATG A

Protein sequence

MISLVPPLLS RTALLFLLTA TGAATAARPA ADIILHNGNI ITLNDAQPQA SALVISGSRI 
VAIGDDTATD EWRGDHTRTI DLQGKTVIPG LTDTHIHAIR GGQTWTFETY WYDSPSLKDA 
LDKLRADANR RPHDQWVAVV GSWIPAQFAE NRAPTVAELS HALPDHPAYI QYLYDYALVN 
QRGIDVLGLN DTPPPDLAGI RVERDAKGSA TGKLFGDIAA FNQLFASISS NADREGGLRQ 
FFADMNARGV TGIIDPSAGP AAAYEPLFAM RNQGDLPLRV GYRIPVQPEA KGHEAQWFSN 
LMAFRPARAD DGQLAFLGLG ESLVAGMNDG VRMAPGFSSS EQDKTALRQV ATFAAKRGIP 
LEIHAYTDDS ADAILTIFEQ VAQQYDLRPL RWSIAHLNTG SPQTLERMRK LGLAYTVQMG 
PYFEGLAIRD ANPPGATDNS PPVRLALDKG LVVAGGTDST RIGIAGVWHA IEYHIIGIAS 
GGSVRKPASE RLTRLEALAL YTRHAAWLAF AEQHRGQLRV GKQADLAVLN QPFMTMPEDR 
IDTIRAVLTL VDGRIVHESP DLNAGQ