Gene Acid345_3212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3212
Symbol
ID	4070424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3799721
End bp	3800977
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	60%
IMG OID	637985233
Product	aminopeptidase T
Protein accession	YP_592287
Protein GI	94970239
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.713242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATT CCGCCGTTGC TGCTACCGCG CTCACCTTCG AACAGAAACT CGACCAGCTT 
GCTGAAGTCG CTATCCGCAT TGGATTGGGA CTTGCTCCCG GCCAGGAACT CCTGATGACT 
GCGCCGCTCG ATGCACTGCC GCTGGCGCGG CGCATTACCG AGCAGGCGTA CAAGGCGGGT 
GCATCGCTCG TCACTACGCT CTACAGCGAC GACGAAGCAG TGCTGGCGCG CTATCACCAT 
GCGCCCAACG AAGCGTTCGA TAAAGCACCC AAGTGGCTCT ACGACGGCAT GGCCGCTGCG 
TTCAAGAGCG GCGCTGCTCG GCTGGCGATC GCCGGCGCGA ACCCGATGCT GCTCTCAAAG 
GAAGATCCCG ATAAAGTAGG GCGCTCGAAC CGCGCGGTTT CTGCAGCTTC GAAGCCCGCG 
ATGGAGTTGA TCACGCGACA TGAAATCAAC TGGACGATCG TTGCGGCGGC GACTCCATCC 
TGGGCCGCGA CGATGTTCCC GAACGATTCC GCCGATGTAG CCATCAACAA GCTCTGGGAC 
GCGATTTTCG CGACCTCGCG CGTGGGCGGC GACGATCCCG TCAGTTTGTG GAAGAAGCAC 
GACGACGGAC TCCAGAAACG CGCTGCCTAT ATGAATGAGA AGCGCTACGC GGCGCTGCAG 
TATCGCGGGC CGGGGACTGA TTTCCGGCTT GGCTTGTCGG ACGGCCATCT TTGGATGGGT 
GGCGGAACTA CGGCAGGGAA CGGACTGTAC TGCATTCCGA ATATCCCGAC GGAAGAGATT 
TTCACCACGC CGCACAAAGA TCGCGCTGAT GGCACGGTCA CTGCGAGCAA GCCGCTCTCG 
CACATGGGAA CGCTGATCGA AGACATTCAC GTTCGCTTCG AAGGCGGCCG CATTGTGGAA 
GCGAGAGCCT CGCGTGGGCA AGAAGTGCTG CAGAAACTCA TTGACACAGA TGACGGCGCG 
CGTCGCCTCG GAGAAGTTGC TCTGGTTCCA CACTCCTCGC CGATCGCCAG CAGCGGCATT 
TTGTTTTACA ACACGCTGTT CGACGAGAAT GCTGCGTCAC ATATCGCGCT CGGCCAGGCG 
TACACCTCGT GCTTGATTGA CGGCGATAAG GCATCGGCAG AAGAACTCGC ACAGCGCGGC 
GCGAACTCGA GTTTGATCCA CGTGGACTGG ATGATCGGCT CGAACAAGCT CGATATCGAT 
GGCATTACCG CGGACGGGAC GGCGGAGCCG GTGATGCGTC AGGGCGAGTG GGTGTAG

Protein sequence

MNNSAVAATA LTFEQKLDQL AEVAIRIGLG LAPGQELLMT APLDALPLAR RITEQAYKAG 
ASLVTTLYSD DEAVLARYHH APNEAFDKAP KWLYDGMAAA FKSGAARLAI AGANPMLLSK 
EDPDKVGRSN RAVSAASKPA MELITRHEIN WTIVAAATPS WAATMFPNDS ADVAINKLWD 
AIFATSRVGG DDPVSLWKKH DDGLQKRAAY MNEKRYAALQ YRGPGTDFRL GLSDGHLWMG 
GGTTAGNGLY CIPNIPTEEI FTTPHKDRAD GTVTASKPLS HMGTLIEDIH VRFEGGRIVE 
ARASRGQEVL QKLIDTDDGA RRLGEVALVP HSSPIASSGI LFYNTLFDEN AASHIALGQA 
YTSCLIDGDK ASAEELAQRG ANSSLIHVDW MIGSNKLDID GITADGTAEP VMRQGEWV