Gene Apar_0188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0188
Symbol
ID	8413036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	221587
End bp	223113
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	48%
IMG OID	645021760
Product	LPXTG-motif cell wall anchor domain protein
Protein accession	YP_003179215
Protein GI	257783998
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4932] Predicted outer membrane protein
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0846582
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAC GACTGTTAAA GCTTTTTAGT TTTGTCCTCG TTCTTGCTCT ATCGCTTCCT 
CTTGCAGTGA AATTAGCTTT TGCTGAGCCC ACAAGCGTTG AAGGCGCAAC GGGCGCCCCT 
AAGGCGGTTG TTGCAACCAT TACAGACTTT AGAATTGAAG ACCGTTTTGG TAACCCAACC 
ACTGTTGTCA ACAAGGCAAA TCTTTATGCC ATTGCAATGA ACTGGGACGC CTCTGCTAAT 
GCTCATGTTG AGCCTGGTGA CTACTTTGAC GTCACCCTTC CTGACACTAT GAGGTTTACT 
GCGGCTCATC CTGCATCTAC CTTCAACATC ACTGATGCAG CAACTGGTGA GGTTATGGCA 
GTTGCTCACG TCAGCCCAGG TGCTGATGGT TTTGGCGGAA CCATGCGTGT TGTCTTTACC 
GACTACGTTA ACAATCACAC TGACCTGCGT GGTAGTGTCC GTCTTGGCTT TACCATTAAT 
TCAGAACGTA TTCAAACAGG TACCGGCAAG ACCTTTAACT TTACTGTTTC TGGCAACATT 
GTTCCTGTAA CGTTTGACGT CACCGCTCTT GGCGTTATTG ATACCGAGTA TCTCTATAAG 
TGGGGAAAGG TTATCGAAGG CAACGCAAAC GAGATTCAGT GGACTGGTCG TATCAACTTC 
TCCCGCGGTA ACTTCAACAA TGTCCACCTT CACGATCAGC TCCTTGACTG GGGTGGCGGA 
GACCTTCCTG CAGAGATTAC CTACGTTCCA GGCTCTTTTG AACTTTGGAC TGGTGTCTTT 
GATGAGTACG GTTCAACCAT TCCAGGTACC GCTCACCGTG TTCCAATTAC CGACGACATG 
ATTACCATTT CTCCTGATGG TAAGTCGTTT GATCTTGATC TTTCCGGCGT AGACTTCAGT 
AATGGTCAGA GCTATAAGTT TATGTATCGA ACCACCTACG TTCCTGGCGT TGCCCTGCGT 
AACCTCATCA AGATGTATTC CGATAAACCT GAGTACAGCT CTGACTGGGT CTGGCGTAAT 
GCAACTTCCA GTGGAGAAGG TACTTCTACT ATCGTCGCTC GCATCCGCGT CATTAAGGTT 
GATAAGGATG ACCACAACAC CAAGCTTGCG GGCGCTGTTT TTAAGGTAAC CAGCGTTGCT 
GATCCAACCA AGACCTGGAC TATCACCACA GGTGAGGACG GCACTGCTAC TACCGAAAAG 
CTTCCTGCAG GCACTTACAC TGTTCAAGAG ATTACCGCTC CTAACGGTTA CGAACTTAGT 
ACTGATACCT ACAACTTAAC CGTCTCTGCA ACAAGCGGCG TTATCAAGAC TGTTGAGAAC 
GAGAAAACCC CAACCGTTCC ACCAACCACC CCGCCGAACA CTCCACCTGC AGCTCCTCCA 
TCAGAGACTC CAAAGAAACC TAAAAAGAAG CAATCTAAGC TTCCAGAGAC TGGCGAAGTT 
TCCGAGATTG CTCTTGTTGC AGTAGCTACT GTTGGTAGCG TTGCTTCAAC TCTTGGCTAT 
GCTCTAAAGA ATCGTCACCG TAAGTAA

Protein sequence

MNKRLLKLFS FVLVLALSLP LAVKLAFAEP TSVEGATGAP KAVVATITDF RIEDRFGNPT 
TVVNKANLYA IAMNWDASAN AHVEPGDYFD VTLPDTMRFT AAHPASTFNI TDAATGEVMA 
VAHVSPGADG FGGTMRVVFT DYVNNHTDLR GSVRLGFTIN SERIQTGTGK TFNFTVSGNI 
VPVTFDVTAL GVIDTEYLYK WGKVIEGNAN EIQWTGRINF SRGNFNNVHL HDQLLDWGGG 
DLPAEITYVP GSFELWTGVF DEYGSTIPGT AHRVPITDDM ITISPDGKSF DLDLSGVDFS 
NGQSYKFMYR TTYVPGVALR NLIKMYSDKP EYSSDWVWRN ATSSGEGTST IVARIRVIKV 
DKDDHNTKLA GAVFKVTSVA DPTKTWTITT GEDGTATTEK LPAGTYTVQE ITAPNGYELS 
TDTYNLTVSA TSGVIKTVEN EKTPTVPPTT PPNTPPAAPP SETPKKPKKK QSKLPETGEV 
SEIALVAVAT VGSVASTLGY ALKNRHRK