Gene Acid345_1362 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1362
Symbol
ID	4068838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1653012
End bp	1654499
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	58%
IMG OID	637983371
Product	peptidase M28
Protein accession	YP_590438
Protein GI	94968390
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.162739
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTGTTA GGAATAATGA ACAACTCTCG TCGGCTCACG TTGGAGAAAA AATGATTCGT 
TCGCTCGCGC GCCTTTTCGT GGTGCCCACT TTGTTTTGCT CTTTCGGTTT TGCCCAGAAC 
GCGTGGACTC CGAAGGAGAT CAACGACATG CGCGACATCC GCGATGCTGC GCTTAGCAGT 
GATTACGGAT ACCAGGAACT CTCCTACCTC ACCGACAGCA TTGGCCCGCG CCTGACAGGC 
TCGGCGCAGT ATAACGCCGC GGCAGACTAC GTTGCGGCAG AGATGCGAAA GCTTGGCCTG 
GAAGTGACGC TGGAGAAAGC GACGGTGCCC CATTGGGTGC GGCGTAACGA AAGTGGTGAG 
CTGGTGACCT ATCCGGGCCA GGCCAATCAT TTTCCGCAAA AAATTGTTCT CACTGCGCTC 
GGACATAGCG TGGGTACTCC GGCCGATGGC GTTACGGCGG AAGTCGTCGT CGTGAATAAC 
TCCGACGAAC TGCATGCGCT CGGCGACAAA GTGCAAGGCA AGATCGTTCT CTTCAACGCG 
AAGTATGACG ACCGTCTGCG CGATGCCGGA TATTCCTTCG ACGCTTATGG AGACGCGGTT 
CGTTATCGCG GCATTGGTCC GGCGGAAGCA GCGAAGCTTG GAGCAGTGGG CGCGCTGGTG 
CGGTCCGTAG GAAGTGCGGA TTATCGTCTT CCACACACCG GACTGACGCT GGTGGATCCG 
AAGGGCAAGA ATGTTCCCGC GGCGGCGGTG AGTGCGGAAG ACGCCGATCT TCTTGCGCGG 
CTCACCAAGC GCGGACCGGT GCAGATGAAA CTTGTGCTTA ACACCGAGAT GCTCGAGCCT 
GTGACCGGCT ATAACGTGAT CGCAGATCTC AAGGGCAGCG AACATCCCGA TGAGTACGTG 
ATTGTCTCCG GGCACCTCGA CTCATGGGAC CTGGGCACCG GCGCGATTGA CGACGGCGCC 
GGCGTGGCGA TTGCGATGCA AGCGGTGGAG ACGATTCATC GTTTGAATTT GCACCCGAAA 
CGGACGATCC GCTTTGTAGC GTGGGTGGAT GAAGAAGGCG GCATCAGCGG AGCGCTGCAG 
TACGCAAAGG ACTATCCGGC GGCAAAGCAT TTTGGGACCA TTGAGAGCGA TACCGGCGCC 
GGGCATCCGA TCGGCTACAT TACCGACAGC TCAGATGAAG CCTTCAAAGT GCTGGCGCCG 
ATTGCGCCCC TGCTGGAAGA AATGGGCGTG GTCGTAAACC GAACTGGTGA AGAGGCGGGA 
GCCGACATCA GCCCGCTATC GTGGGCCGGA GTTCCGGGAT TTGCCCCGCT GATGGACAGC 
CGGAAGTACT TCGATTACCA CCACACGGCC GCCGACACGC TCGATAAAGT TGATCCGAAA 
GAACTTCGGG AGAACGGGGC GCTGGTCGGG GTACTCGCGT ACGGGCTGGC AAACTGCGCC 
AAAACGCTGC CGAGAATCGC AAAACCTGTT CCCGACTGGA TGAAATAA

Protein sequence

MCVRNNEQLS SAHVGEKMIR SLARLFVVPT LFCSFGFAQN AWTPKEINDM RDIRDAALSS 
DYGYQELSYL TDSIGPRLTG SAQYNAAADY VAAEMRKLGL EVTLEKATVP HWVRRNESGE 
LVTYPGQANH FPQKIVLTAL GHSVGTPADG VTAEVVVVNN SDELHALGDK VQGKIVLFNA 
KYDDRLRDAG YSFDAYGDAV RYRGIGPAEA AKLGAVGALV RSVGSADYRL PHTGLTLVDP 
KGKNVPAAAV SAEDADLLAR LTKRGPVQMK LVLNTEMLEP VTGYNVIADL KGSEHPDEYV 
IVSGHLDSWD LGTGAIDDGA GVAIAMQAVE TIHRLNLHPK RTIRFVAWVD EEGGISGALQ 
YAKDYPAAKH FGTIESDTGA GHPIGYITDS SDEAFKVLAP IAPLLEEMGV VVNRTGEEAG 
ADISPLSWAG VPGFAPLMDS RKYFDYHHTA ADTLDKVDPK ELRENGALVG VLAYGLANCA 
KTLPRIAKPV PDWMK