Gene Apar_0155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0155
Symbol
ID	8413001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	179005
End bp	180267
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	54%
IMG OID	645021725
Product	peptidase T
Protein accession	YP_003179182
Protein GI	257783965
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAAA CTATGTCTAA CCAGCTCCCT GATGTTGCCG AGCGCTTCAT GCGCTACGTG 
CAGGTTGATT CCCAGTCTAA TCCTGAGAAC GATACCGTTA CGCCTTCCAC GCCTGCTCAG 
CACGAGATGG CTCGCTACTT GGGCGAAGAG CTCAAGGCGT TGGGCTGCAC TGATGTCACT 
GTCGACGAGC ATGCTTACGT TACCGGCACT TTCGCCGCAT CTAAGGGCGC TGAATCGGCT 
CCTGCGCTGA TGCTTTGCTC GCACCTGGAT TCCGTTATTG ATGCGCCTGC TTCGGGCATT 
AAGCCGCACG TCGTCTATTA CGAGGGTGGT GACTTGGTTG CTGGCGTTGT TAACGGTAAG 
ACCATCGCTA CTACACAGGA ACAGGTTCCT GACCTCAAGG ATTTTGTGGG CATGGACATC 
ATCTGCTCCG ACGGCTCCAC GCTGCTTTCC GCTGACGATA AGGCCGGTGT GGCAGAGATT 
TGCGCCTTGC TCAAACGCCT GGGCGACAAC CCTGAGCTTG CGCATCCAAC ACTTAAGATT 
GCATTTGTCC CTGACGAGGA AATCGGTCAT GGCGCAAGTC TGCTTGACCT AGAAAAACTC 
GGCGCAGCTT ACGGCTACAC TGTTGATGGT GAGGCGCTGG GAGAATTTAA CTACGAGTGC 
TTCAATGCAG CTCATGCCGA TGTCTATTTC AAGGGTGTTA TGGTTCACCC TGGCAGCGCC 
AAGGATGTCA TGGTCAACGC GATCACCGTT GCGTCTGAGT TCCAGCAAAT GGTTCCCGCC 
TTCGAGCGTC CCGAGCACAC CGAGGGTTAC GAGGGCTTCT ACCATCCAAT TGCCATCGAG 
GGTTCCGCAT CTGAGGTTAA GCTCAGCTAC ATTGTCCGCG ATCACGATTC CCAGATTTTT 
GCCAATCGTC AGCAGGTTCT GCAGGATATT GCTGCGTTTC TGAACAAGCG CTATGGCGAG 
AATACCGTCC GCGTTGAGAT TCATCAGGAG TATCGCAACA TGGCCGAGAA GTTTGATGGC 
TATGAGTTTC TGATTGATTA TGCTCTTGAG GCAAACCGTG AGGTTGGTAT TGAGCCTAAG 
CCTGTTGCTG CTCGCGGTGG TACCGATGGT GCTCAGCTTA CGTTCCGTGG TCTGCCATGC 
CCCAACATTG CTACCGGTGG ATACAATGCT CACTCTGTGC GCGAGTTTAT CCCCGTGCCA 
AGCCTCAAGG TCACCGTTGA CCTTTTGGAG AAGCTTGTCG CTAAGTTTGC TACCCGCGGC 
TAA

Protein sequence

MPETMSNQLP DVAERFMRYV QVDSQSNPEN DTVTPSTPAQ HEMARYLGEE LKALGCTDVT 
VDEHAYVTGT FAASKGAESA PALMLCSHLD SVIDAPASGI KPHVVYYEGG DLVAGVVNGK 
TIATTQEQVP DLKDFVGMDI ICSDGSTLLS ADDKAGVAEI CALLKRLGDN PELAHPTLKI 
AFVPDEEIGH GASLLDLEKL GAAYGYTVDG EALGEFNYEC FNAAHADVYF KGVMVHPGSA 
KDVMVNAITV ASEFQQMVPA FERPEHTEGY EGFYHPIAIE GSASEVKLSY IVRDHDSQIF 
ANRQQVLQDI AAFLNKRYGE NTVRVEIHQE YRNMAEKFDG YEFLIDYALE ANREVGIEPK 
PVAARGGTDG AQLTFRGLPC PNIATGGYNA HSVREFIPVP SLKVTVDLLE KLVAKFATRG