Gene SNSL254_A4791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4791
Symbol
ID	6483918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4665455
End bp	4666588
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	57%
IMG OID	642740005
Product	dihydroorotase
Protein accession	YP_002043683
Protein GI	194445446
COG category	[R] General function prediction only
COG ID	[COG3964] Predicted amidohydrolase
TIGRFAM ID	[TIGR03583] probable amidohydrolase EF_0837/AHA_3915

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGATT TACTCCTGCG CCATGCGCGT CTGGTCGATG ACACGCTGAC TAATATTGCC 
CTGCAAGATG GCAAAATCGC GGCGTTGGGT GACGTTGATG GTCCGGCGGT GAAAACCATT 
GACCTGCGCG GCGAGTGTTA CGTTAGTGCG GGTTGGATTG ATTCTCATGT TCACTGCTAC 
CCAAAATCGC CGATTTATCA CGACGAACCG GACAGCGTGG GTATTGCCAC TGGCGTTACC 
ACAGTGGTGG ATGCAGGCAG CACTGGCGCA GACGACATTG ATGATTTCTA TGCTCTGACG 
CGTCAGGCGA CCACCGACGT TTATGCGCTG CTGAATGTTT CACGTGTTGG GCTTATTGCC 
CAAAACGAGC TGGCTAACAT GGCCAATATT GACGCCGATG CGGTCCGGCA GGCGGTAAAA 
CGCCATCCGG ATTTTATCGT CGGCCTCAAG GCGCGGATGA GCAGCAGCGT GGTAGGCGTT 
AACGGCATCA CGCCGCTGGA ACGCGCTAAA GCCATGCAGC AAGAAAACGG CAACCTGCCG 
TTGATGGTGC ATATTGGCAA TAACCCGCCG GATCTGGACG AAATCGCGGA GCGTCTGACG 
GCGGGCGATA TCATCACCCA TTGTTACAAC GGTAAGCCGA ACCGTATTCT TCGGCCTGAC 
GGCGAGCTGC GCGCCTCGGT GACACGAGCG CTGGCGCGCG GCGCGCGTCT GGACGTTGGA 
CATGGTACCG CCAGCCTGAG CTTTGCGGTG GCGAAACGCG CTATTAGCCT GGGGATTTTA 
CCGCATACCA TCAGTTCCGA TATCTACTGC CGTAACCGCA TCAATGGCCC GGTGCATTCG 
CTGGCTAATG TGATGTCGAA ATTCCTCGCC ATCGGCATGT CGCTGCCGCA GGTCATTGCG 
TGCGTGACGG CCAATGCCGC CGATAGCCTG AGTCTGAAAA CCAAAGGGCG TCTTCAGCCA 
GGTCTGGATG CTGACCTGAC CCTCTTTACG CTTAAACGCC AGCCCGCCGT GTTGGTAGAC 
GCGGAAAACG ACAGCTTACA GGCTGAAGAA TTGCTGACGC CGCTTGCCGC GATACGCGCA 
GGCAAGGGCT ATATGACCGA ACAAGGGAGC GCGGAACATG CCTTCGATTT TTGA

Protein sequence

MFDLLLRHAR LVDDTLTNIA LQDGKIAALG DVDGPAVKTI DLRGECYVSA GWIDSHVHCY 
PKSPIYHDEP DSVGIATGVT TVVDAGSTGA DDIDDFYALT RQATTDVYAL LNVSRVGLIA 
QNELANMANI DADAVRQAVK RHPDFIVGLK ARMSSSVVGV NGITPLERAK AMQQENGNLP 
LMVHIGNNPP DLDEIAERLT AGDIITHCYN GKPNRILRPD GELRASVTRA LARGARLDVG 
HGTASLSFAV AKRAISLGIL PHTISSDIYC RNRINGPVHS LANVMSKFLA IGMSLPQVIA 
CVTANAADSL SLKTKGRLQP GLDADLTLFT LKRQPAVLVD AENDSLQAEE LLTPLAAIRA 
GKGYMTEQGS AEHAFDF