Gene SeSA_A4149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4149
Symbol
ID	6518737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	4022438
End bp	4023607
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	55%
IMG OID	642749116
Product	putative uroporphyrinogen III C-methyltransferase
Protein accession	YP_002116868
Protein GI	194738078
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2959] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAAC AAGAAAAATC CTCCGCCGTG GTTGATGAGA CCAGGGAGAG CGTGGAAACC 
ACGCCACAGC CAGTTAATAC CGAGAAAAAA AGTAAGAACG GCGCCGCGCT GGTATTAAGC 
GCGGTGGCGA TTGCGATTGC CCTGGCGGCA GGTATTGGGC TTTATGGCTG GGGGAAACAG 
CAAGCAACCG CGCAAACGGA AACCAGCGAT GCGCTGGCGA CGCAACTAAC CGCCTTGCAA 
AAGGCACAGG AGAGCCAAAA AGCGGAGCTG GAAGGGATTA TCAAAAAACA AGCGGCGCAG 
TTAGATGACG CGAATCGCCA ACAGGCGGCG CTGGCGAAAC AGCTTGATGA AGTACAACAA 
AAAGTCGCCA CTATTTCCGG CAGCGATGCT AAAACCTGGC TGCTGGCGCA GGCTGATTTC 
CTGGTGAAAC TCGCCGGACG TAAGCTGTGG AGCGATCAGG ACGTCACTAC CGCCGCTGCG 
TTGCTCAAAA GCGCTGACGC CAGTCTGGCG GACATGAATG ACCCCAGCCT CATTACCGCA 
CGACGCGCGA TTACTGACGA TATCGCCAGC CTGTCATCCG TTGCGCAGAT CGACTACGAC 
GGCATTATTC TCAAGCTCAA TCAGCTCTCT AACCAAATCG ATAACTTGCG TCTGGCGGAT 
AACGATACCG ATGGTTCGCC GATGGATTCA GACAGCAGCG AGCTGTCCAG CTCGCTAAGC 
GAATGGCGCG TTAACCTGCA AAAAAGCTGG CAGAACTTTA TGGACAGCTT TATTACCATT 
CGCCGCCGCG ATGATACCGC TGTACCGCTG TTGGCGCCCA ACCAGGACGT CTATTTACGC 
GAAAATATTC GCTCTCGCCT GTTAGTCGCC GCGCAGGCCG TGCCACGCCA TCAGGAAGAA 
ACATACCGTC AGGCGCTGGA TAACGTTTCG ACCTGGGTTC GCGCTTATTA CGATACTGAC 
GACGCCGCGA CAAAAGCCTT CCTGGAGGAG GTCGATAAAT TAAGCCAGCA AAATATCACG 
ATGGATCTGC CGGAAACCCT GGAAAGCCAG GCGATTCTTG AAAAACTGAT GCAAACCCGC 
GTGCGTAATC TGCTGGCGCA ACCGACAGTC TCTACGGCAG CGCCTGCCAC GCAGACAGAC 
GCTCCGGCAG CCGCGCCGCA AGGAGAATAA

Protein sequence

MTEQEKSSAV VDETRESVET TPQPVNTEKK SKNGAALVLS AVAIAIALAA GIGLYGWGKQ 
QATAQTETSD ALATQLTALQ KAQESQKAEL EGIIKKQAAQ LDDANRQQAA LAKQLDEVQQ 
KVATISGSDA KTWLLAQADF LVKLAGRKLW SDQDVTTAAA LLKSADASLA DMNDPSLITA 
RRAITDDIAS LSSVAQIDYD GIILKLNQLS NQIDNLRLAD NDTDGSPMDS DSSELSSSLS 
EWRVNLQKSW QNFMDSFITI RRRDDTAVPL LAPNQDVYLR ENIRSRLLVA AQAVPRHQEE 
TYRQALDNVS TWVRAYYDTD DAATKAFLEE VDKLSQQNIT MDLPETLESQ AILEKLMQTR 
VRNLLAQPTV STAAPATQTD APAAAPQGE