Gene Apar_0506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0506
Symbol
ID	8413357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	582659
End bp	584017
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	49%
IMG OID	645022076
Product	putative aminopeptidase 2
Protein accession	YP_003179528
Protein GI	257784311
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1362] Aspartyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0233423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.547995
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGATT TACATGAGTC ACTTGCTCTT TCTGAGGAGC TTCTTGCTTT TATTAAGCAG 
AGTCCTTCCA TGTTTCATAC TACACAAACT ATCAAAGACT ACCTGTTAGA GAACGGTTTC 
ACTTACCTCT CTGAGGGTTC TTCTTGGGAT GTTCAGCCAG GCGGCTCTTA CTTTACAACA 
CGCAACAATT CTTCAATTAT TGCCTGGAAA GTTGGCGAGA AATACCGTGA GGCTCAAACC 
TCAAACGCTG ATACTCCTTA TCACTTCCAG CTTGCTGTTG CCCATGGCGA TTCTCCAACT 
TACAAGGTAA AAGCCCAGCC AGAGCTTACT GGCGAGGGCA ACTCGCTTCG TCTGAACACT 
GAGGCATACG GCGGCATGCT TGACCACACG TGGTTTGACC GTCCTTTGGG TGTTGCTGGC 
CGTGTGCTGG TCAAGGTAGG AAACAAGGTA GAGTCCAGGC TGGTCAACAT CGAAGATGAC 
GTTGTCATGA TTCCAAGCTT GGCTATTCAT CTTGAGCACA AAAATGGTCT CTCGCCAGAG 
TTCAACCGTG CTAAAGATCT GATGCCACTT TTCAGCGTTG GAGAGCTCAA TCCCGGCGCC 
TTTAACGCCC TGGTAGCAGA TGCAGCAGGT GCGTCTCAAG AGGACATTCT TTCTCGCGAT 
CTCTTTTTGG TTGATCACAC AGGTGGTCGT ATTTGGGGCG CAAAGAAGGA GTTTGTTTCC 
GCTGGTCATC TGGATGACCT GCAGTGTGCC TTTGTAGCAC TTAAAGCTTT CCTTGCGTCT 
TCAAATGAGC AGGACATCTC TGTGTACACC TGCTTTGACA ACGAAGAAGT TGGCTCAAAC 
ACTAAGCAGG GTGCTAAGTC TACGTTCCTT AAAGACACGC TACAGCGCGT AAACGCTACG 
CTTGGCTTTA CGCAGGAAGA TTACTACCGT GCGCTCTCGG CATCTTTGCT AGTAAGCTGC 
GACAACGCTC ATGCGGTGCA TCCCAATTAT CCTGAGAAGC ACGATGCGGC CAACAAACCT 
TACCTCAACG GAGGTATGGT TATCAAGGAA GCAGCACGTC AGTCATACTG CACGGATGCG 
TTTAGCCGCG CCATTGTCGA GGCAATTTGG AAGCAGCAAA ACGTTCCATA TCAGATTTTT 
GCTAATAGAA GCGATATGCC AGGTGGATCT ACTTTGGGCA ACCTCTCCAA CATTCAGGCC 
AGCATGCATG CCGTTGACGT GGGTCTGCCT CAGCTTGCTA TGCACTCTGT TTACGAAACC 
GCGGGCACTA AAGATACACT TTTGGGGTAC CAGGCACTTA AGGCGTTCTA TGACACCTGC 
GTCTGCATTA CTGATGCCGA TTCGTTTGAG TTGAGGTAA

Protein sequence

MSDLHESLAL SEELLAFIKQ SPSMFHTTQT IKDYLLENGF TYLSEGSSWD VQPGGSYFTT 
RNNSSIIAWK VGEKYREAQT SNADTPYHFQ LAVAHGDSPT YKVKAQPELT GEGNSLRLNT 
EAYGGMLDHT WFDRPLGVAG RVLVKVGNKV ESRLVNIEDD VVMIPSLAIH LEHKNGLSPE 
FNRAKDLMPL FSVGELNPGA FNALVADAAG ASQEDILSRD LFLVDHTGGR IWGAKKEFVS 
AGHLDDLQCA FVALKAFLAS SNEQDISVYT CFDNEEVGSN TKQGAKSTFL KDTLQRVNAT 
LGFTQEDYYR ALSASLLVSC DNAHAVHPNY PEKHDAANKP YLNGGMVIKE AARQSYCTDA 
FSRAIVEAIW KQQNVPYQIF ANRSDMPGGS TLGNLSNIQA SMHAVDVGLP QLAMHSVYET 
AGTKDTLLGY QALKAFYDTC VCITDADSFE LR