Gene Apar_1264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1264
Symbol
ID	8414143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1419596
End bp	1421656
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	40%
IMG OID	645022856
Product	conserved repeat domain protein
Protein accession	YP_003180280
Protein GI	257785063
COG category
COG ID
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain [TIGR01451] conserved repeat domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA GTTTTCTTAA GAGAATCTCG GTTTTTCTAA CCATGATTAT GGCATGCTTG 
GTTATGTTTG TTAACACAGC TCAGGCATTT GATCGCCAGA AAGACGATAG TGATCTTACT 
CAGATTAACA TCTATCAGTT CACTATGACC AGGGATAACA TGACTGTTCT CTCACAAGGG 
GATGGGGTTA AACGCGTGGA GATTCCTGCG TCAGATACAG GTAATCTTCC TTCAACAGCT 
TTTGTTATGC AGCCTACTAA GGATGGCTCT AACCATCAGT ATAATCAGCC ACTTTCATTG 
AAGTTTTCTA ATGCTGGCAC CGTTGATGGT GAATCCGTTG ATGTTTATGT AACGGTTAAT 
TCTTTGGACC TTACCCTTAA AAATACAAAT GCAGACTACA ATAATCCTAA TAAGACTGAT 
GTTCCGTTTT TGACTGTTGA TGAAAACTGG GGAACAAAGT CTTTCTCGCT TATGGATTAT 
ATTGATGTGA ATCACCCTAG TTATACAGCA GACATGCTTG GATCCTATGC AATTAACGCT 
AATGTAACTA TGGAATTAAG GTACTCTGAT GGAACGCCGT GCAACCTTAA ACTTGTCATG 
CAGCCAAGTG ATATTGACGT TTTAAATGGC GGCACAAATG AGACTTTTTC TCTGGTAAAT 
GCAGAGAGCA CCGTTGACAG TATTGTTATG AGCAATAGAA ATGTTCTTAC AGAAACTACA 
AATGGTAATA AAATAACGTG GAATCCAACT CGTCCAACTT CTGGAAACGA TCAAGAAAAA 
AATCTTGCGG GTTTTGCTGT TAAGTCAAAG TCCAATTCAT TAACTTTTGA GTCTACAAGT 
GCTGCTACAA GTGGTAGCCT TTTTGGTGCT TATACTGAAG TGATAAGTCC AGCTCCTGTA 
AAAGCGGTTG ATCCAGAGCA GGCTCCTGCT AAGGCTGGGG AAGAAATTAC TTACACTGGA 
ACATTTACTT TACCAAGACA AGGCATTGAT ACTATCGGCA AGATCAAGTC GATGAGTATG 
GTTGATACGT TTGATGAGCG TCTTGACTAT CAGAGCCTTA GCGTTTCGTT TGATGGACAG 
ACTCTTACTG AAGGCACCGA TTACACCGTT TCTGTCGATG GTCAAAAGGT GACTGTAGAC 
ATTGATGCTC ATTTACTTAC CAAAGAAAAT GGCGGTAAAA AGTTTGTCAT TACGTATAAA 
ACTCTAACTA ATTCAAAGAT AGAGACTGAC AGTTCAAATA TTGATAATGA GCTTACCCAG 
GTTGTTGACG GTAACATTGC TCACTCTAAT AAAGTAACCA CAGAGCTTCT TTATGAGAAG 
ACTCATGAGT ACGTTAGTGG CACCCCTAAT AAGGAACTTC CACAAGAGGT TCTGGATTTA 
CTTCCTGGTA AGCAGACCAG AATTCCAAAC GGCACAACTG TTACACCTGA TCAACCACTT 
GGTGGAGTAA CTCGTGTTGA AACTTCTGAT GGAACTTGGG TGTTCATTGG TTACGATCAC 
GATTCTGAGA TTATTGATCA CAAGAACGCA CACTTCATTG GTGTTTGGGT GATTTTGCCT 
CAGCCAAAGA AGGACGTTCT TGATAGTGAG GGTAATTCTA TTGATGGTAA TAAGGTAACT 
GCAGGACAAG TACTCACTTA TTCTGTGACA TATACCAATA CCACCAATAC TGCTCGTGAT 
GTTACGGTTA CTGATGTTAT TCCAGAGCAC ACAACTTACG TTGATAATTC TGCTGATAAC 
GGTGGAGTTT ATGATAAGGC TACTCGTACT GTAACCTGGA CGAAAAATGT TGCACCTGGT 
GAGACCCTCA CGGTTACTTT CCAAGTTAAG GTTAATAAGG GCGTTAAGGA TATTACTGTT 
GTGAATACTG CTCACGTCAG TGATGGTCTC ATTGACACCG ATACTAACAC TACAAAAAAT 
CCTGTTATAC CTAAGCCACG TAAGTCTCGT GTTCCAAATA CTGGTGACAA CACAATGCGT 
GATGTAATTA TTGTTGCTGG TTTAGGTGGA ATAGCTCTTC TTATAGTTAT TGTTTTAAAA 
CTTCGCTCTT CGAGAAAGTA A

Protein sequence

MKKSFLKRIS VFLTMIMACL VMFVNTAQAF DRQKDDSDLT QINIYQFTMT RDNMTVLSQG 
DGVKRVEIPA SDTGNLPSTA FVMQPTKDGS NHQYNQPLSL KFSNAGTVDG ESVDVYVTVN 
SLDLTLKNTN ADYNNPNKTD VPFLTVDENW GTKSFSLMDY IDVNHPSYTA DMLGSYAINA 
NVTMELRYSD GTPCNLKLVM QPSDIDVLNG GTNETFSLVN AESTVDSIVM SNRNVLTETT 
NGNKITWNPT RPTSGNDQEK NLAGFAVKSK SNSLTFESTS AATSGSLFGA YTEVISPAPV 
KAVDPEQAPA KAGEEITYTG TFTLPRQGID TIGKIKSMSM VDTFDERLDY QSLSVSFDGQ 
TLTEGTDYTV SVDGQKVTVD IDAHLLTKEN GGKKFVITYK TLTNSKIETD SSNIDNELTQ 
VVDGNIAHSN KVTTELLYEK THEYVSGTPN KELPQEVLDL LPGKQTRIPN GTTVTPDQPL 
GGVTRVETSD GTWVFIGYDH DSEIIDHKNA HFIGVWVILP QPKKDVLDSE GNSIDGNKVT 
AGQVLTYSVT YTNTTNTARD VTVTDVIPEH TTYVDNSADN GGVYDKATRT VTWTKNVAPG 
ETLTVTFQVK VNKGVKDITV VNTAHVSDGL IDTDTNTTKN PVIPKPRKSR VPNTGDNTMR 
DVIIVAGLGG IALLIVIVLK LRSSRK