Gene Cla_0231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cla_0231
Symbol	pepQ
ID	7410954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Campylobacter lari RM2100
Kingdom	Bacteria
Replicon accession	NC_012039
Strand	+
Start bp	204801
End bp	205826
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	32%
IMG OID	643717366
Product	prolidase (Xaa-Pro dipeptidase)
Protein accession	YP_002574845
Protein GI	222823272
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTCA TCTTAAAAAA CGAAAATGCA CTTTTTTATG AGTGTGGCTA TTCTTGCGAT 
AATGCTTTAT TTTTAAAACT TGAAGATGAA GCATTTTTCA TCACTGATGC AAGATATAGC 
TTTGAAGCTA GTGAAATGAT AAAAAATGCT AAGGTGGTTT TAGCACAAGA TCTTTTTGCT 
AGTGCTAGAG AGCTTTTAGA AAAAATGGGA ATTGATAGGG TGTGTTTTGA CCCAAAAGAC 
TTTAGCTATT TTGAATTTAA AGAACTTAGT AAAAGTGCAA ATATCGTTTT TGAAGAAAGA 
TTAGATTTTA GTAAAAACAA ACGCATTATA AAAAATTCTA AAGAATTACA ACTTTTGCAA 
AAGGCTGTAA ATTTTGGTAA AGAATGCTTT GATGAATTTG CAAAATTTAT AAGCTGTGAA 
GGTCATGGTA AAAGTGAGAA AGAATTGCAT TTTAAAGCAT GTGAAATTTT TCAAAAAAAA 
GGTGCTTTGA GACTTTCTTT TTCGCCTATT GTAGCTATTA ATGAAAATGC GGCTAAGGCT 
CATGCTTTGC CTAGTGAGAA AAAATTAGAA TTTGGAGATT TGTTATTGGT TGATGCGGGC 
GTGGTTTATC AAAGGTATTG CTCTGATCGC ACAAGAACGG CTTGTTTTGA TGAGAGTGGC 
ATAGTGTTTG ATAAAAATAA GCCAAATTTT AAAGACAAAG AAATTATACA AATTTATGAA 
GTGGTTAAAC AAGCTCAGCT TCAAGCTATA GAAAAAGCAC GCGTTGGTAT GATGGCAAAT 
GAGCTTGATT TTATTGCAAG AGAAGTGATT AAAAATGCAG GTTTTGAAAA AGAATTTATT 
CATAGTTTAG GACATGGAGT GGGGCTTGAT ATACATGAGT TGCCAAACAT TAGTCCAAGA 
AGTGATTATG AGTTAAAAGA AGGTATGGTA TTTACTATTG AACCTGGAAT TTATATCCAA 
GATAAATTAG GCATTAGGAT AGAAGATATG GTCTATCTTG ATAAAGAAAA GGCGGTGGTG 
TTATAA

Protein sequence

MNFILKNENA LFYECGYSCD NALFLKLEDE AFFITDARYS FEASEMIKNA KVVLAQDLFA 
SARELLEKMG IDRVCFDPKD FSYFEFKELS KSANIVFEER LDFSKNKRII KNSKELQLLQ 
KAVNFGKECF DEFAKFISCE GHGKSEKELH FKACEIFQKK GALRLSFSPI VAINENAAKA 
HALPSEKKLE FGDLLLVDAG VVYQRYCSDR TRTACFDESG IVFDKNKPNF KDKEIIQIYE 
VVKQAQLQAI EKARVGMMAN ELDFIAREVI KNAGFEKEFI HSLGHGVGLD IHELPNISPR 
SDYELKEGMV FTIEPGIYIQ DKLGIRIEDM VYLDKEKAVV L