Gene SeSA_A3808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3808
Symbol
ID	6515601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3672536
End bp	3674023
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	54%
IMG OID	642748786
Product	protein YhjJ
Protein accession	YP_002116550
Protein GI	194734488
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGGCA CAAAAATTCG ACTCTTAGCG GGCAGTCTGT TGATGTTGGC CTCTGCCGGC 
TATGTGCAGG CAGATGCGCT CCAGCCCGAT CCGGCATGGC AACAGGGGAC GCTGGCTAAT 
GGGTTACAGT GGCAAGTGTT GGCTACGCCT CAGCGCCCCA GCGATCGTAT TGAAGTTCGT 
CTCCAGGTTA ATACCGGTTC GCTCACCGAA AGTACGCAAC AGAGCGGGTT CAGCCATGCG 
ATTCCCCGTA TCGCGCTGAC GCAAAGCGGT GGTCTGGATG CCGCACAGGC ACGTTCTTTA 
TGGCAGCAAG GGTTTGATCC GAAACGTCCC ATGCCGCCCG TTATTGTTTC TTATGATTCC 
ACGCTCTATA ACCTCAGTTT ACCCAATAAC CGTAACGATC TGCTGAAAGA AGCGCTGACC 
TATCTGGCTA ACGTCTCCGG TAAATTAACC ATTACGCCAG AGACGGTGAA TCATGCGTTA 
AGCAGCGAAG ATATGGTTGC GACGTGGCCA GCAGATACTA AAGAGGGCTG GTGGCGTTAT 
CGGCTGAAAG GATCGGCGTT ATTGGGGCAC GATCCCGCGG AACCGTTAAA GCAGCCGGTA 
GACGCAGCCA AAATTCAGGC TTTCTATGAA AAATGGTACA CCCCGGATGC CATGACGCTG 
ATTGTTGTCG GCAACATTGA TGCGCGCTCC GTCGCCGAGC AGATCAATAA AACGTTCGGT 
ACGCTGAAAG GTAAACGCGA AACGCCCGCC CCGGTGCCGA CGCTTTCGCC GCTGCGGGCG 
GAATCAGTGA GCATTATGAC CGATGCGGTG CGCCAGGATC GTCTCTCCAT TATGTGGGAT 
ACGCCGTGGC AACCGATTCG CGAATCGGCG GCGCTGTTGC GCTACTGGCA GGCGGATCTG 
GCGCGTGAAG CGCTGTTCTG GCATATCCAG CAAGAGCTTA CTAAAAATAA CGCGAAAGAT 
ATTGGCCTGG GGTTTGACTG CCGGGTTCTG TTCCTGCGCG CGCAGTGCGC CATCAACATT 
GAATCACCTA ATGATAAGCT CAATACCAAT TTGAGCCTGG TGGCGAATGA ACTGGCGAAA 
GTACGCGATA AAGGTTTGTC GGAAGAGGAG TTTACTGCTC TGGTGGCGCA GAAAAATCTC 
GAATTGCAAA AGCTGTTCGC GACCTACGCG CGTACCGATA CTGACATTTT GGCTGGACAG 
CGTATGCGCT CGCTGCAGAA TCAGGTGGTG GATATCGCGC CGGAGCAGTA TCAGAAGTTG 
CGTCAGAATT TCCTCAACAG CCTGACCGTC GATATGCTCA ATCAGAATCT ACGTCAGCAG 
CTATCGCAGG AGATGGCATT GATTTTGCTG CAACCGCAAG GCGAGCCGGA ATTTAATATG 
AAGGCGTTAA AGGCGACGTG GGATGAAATC ATGGTCCCGA CAACTGCCGC CGCTGTTGAA 
GCAGATGAGA CGCATCCGGA AGTGACGGAT ACACCGGCGG CACAGTAA

Protein sequence

MQGTKIRLLA GSLLMLASAG YVQADALQPD PAWQQGTLAN GLQWQVLATP QRPSDRIEVR 
LQVNTGSLTE STQQSGFSHA IPRIALTQSG GLDAAQARSL WQQGFDPKRP MPPVIVSYDS 
TLYNLSLPNN RNDLLKEALT YLANVSGKLT ITPETVNHAL SSEDMVATWP ADTKEGWWRY 
RLKGSALLGH DPAEPLKQPV DAAKIQAFYE KWYTPDAMTL IVVGNIDARS VAEQINKTFG 
TLKGKRETPA PVPTLSPLRA ESVSIMTDAV RQDRLSIMWD TPWQPIRESA ALLRYWQADL 
AREALFWHIQ QELTKNNAKD IGLGFDCRVL FLRAQCAINI ESPNDKLNTN LSLVANELAK 
VRDKGLSEEE FTALVAQKNL ELQKLFATYA RTDTDILAGQ RMRSLQNQVV DIAPEQYQKL 
RQNFLNSLTV DMLNQNLRQQ LSQEMALILL QPQGEPEFNM KALKATWDEI MVPTTAAAVE 
ADETHPEVTD TPAAQ