Gene Apar_1355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1355
Symbol
ID	8414246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	1526910
End bp	1529165
Gene Length	2256 bp
Protein Length	751 aa
Translation table	11
GC content	43%
IMG OID	645022958
Product	Cna B domain protein
Protein accession	YP_003180370
Protein GI	257785153
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4932] Predicted outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000416795
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTATCA CAAAATCCTC AAAACCTAAG GAAAAAATAA CTGCGCAGAA ACGCTCTCTT 
GCTTCTGCTT TTCACTTTTG GTTTATTCCC CTATTGATTG GAGGACTTTT ACTTAGCCAT 
CTTTTACTAA AGCCTGCTCA TAAACTTGCC TTTGCCCAAG ATCCTTCTTT TACTGTTGCC 
CAAAGAGAAG ACTTCCCCGG TGGACAACAA ATTCCCATGT GGACTGCTAG CGATGGCACT 
TATCTCTACT GTGGAGACGA GTTTAATCAC TACGGCGCAT GGCCAGGAGC AACTGGAAGT 
ATAGTTGACC CACAATCTTA TACAAAACTT ACTTCAGCTA CCGGCGCTCG TGGTGGAACT 
TATACAGATG AGCAACTTCG AGCTATTGAC TACATCATTT ATCACGGAGC TACTGCTTCC 
CAAGAGAAAG ACGTTTATGG CTATACGGGC TGGAAGGCGC GAGCTATCAC ACAGTTTGCG 
CTTTGGGCTG TTATGCGCGG TGAAGCTCAT ACCCTTGCGG TTAGCGTCCC TCAAGAAGAA 
CTCCATCAAC CAATCGAGAG ATTCTACACC GATGCTGTGA ACTACGCCCA CAATAACAGC 
GGCGGTCCAG AGAACGGGAT TGCAAAGCTT TTTGTACCCG CAGGTGACAA ACAGGTCCTA 
TTTTTCTTCG GAGAACAATC TGGCTCTCTC AAGATTACTA AAAACTCCTT ATTGCCTGCT 
ATTACTTCCA ATAATGAGCA TTACGCCTTA GAAGGCGCTG TCTACGAAGT ATATTCCGAT 
GAAGGTTGTA CCAATCTTCT TGGTAGTCTC ACACTTGATG CATCTGGATC CGCAACAATC 
GACGGACTGC CTGTTGGATG TGTATATGTA AAAGAAACCT CTGCTCCAAA AGGTTTTCTT 
CTTGATCCAA CCGTTCACAC CGTAGAAATA AAAAACCAAG AAGAAAGCAC TCTCGCGGTT 
ACCGATACTC CTATCGGGGA CTTCAATCTA CACATTTCAA AACAAGACTT CGACCACAGT 
GCCAACCTCG ATGAGGGCAA CCAAGCAGAG CAACAGGGTA CTTCTCCCCA AGGAAACGCA 
ACGCTACAAG GTGCACTTTT TAAAGTAACC TATAGCGGAT CCTCCGAAAC AACGTTAAGA 
ACATGGGTTT TTTCGACCGA CGCTCAAGGC TTTACTTCTT TTGATGCAGA CCACAAGGTT 
TCTGGAGATG ACCTCTTTAC TCTTGACGAG AAACCCTGGC TTCCTCTGGG GTATTATCAA 
ATCGAAGAAA TTCAAGCACC TAAAGGTTAT AAACTTCCAG AACTTTCATT TCAAACTTGG 
AAACTATCAA GCCAAAATGG GAATCTGGTC TGGACAAACG TTTCTAGTGG AAAAGAGAGT 
TCTTCGTCTG AGCACTCCTT TATTTTTAAA GATGAAGTAA TAAGAGGGAA TCTTAAGATT 
AAGAAAATTG GACACACTTC TCTAAGTTCA TCCGATGGTT ATTCTGAAAT AAAAGAAATG 
CCAAGTCTAA AGGGTGCCAA AATTGAACTT ACTAATAACT CCACTCAACC TGTTTTTTAT 
CAAGATAAAT GGATTGCTCC TCACGAAGTT GTCACTACAG TAGAAACAGA TGAATCTGGC 
GTTGCTGCAA TTAAAGACCT TCCATTTGGT TCCTATTCAC TTAAAGAAGT ACTAGCTCCA 
GCAGGTTACT CTCTCAATAC AGAATGGAAT CCAACGGTTA CCCTTACTTC TGAAGAGACT 
ATAGAAGCGC CCGAACTCAT TGATGAGAGA ATTGCTCTAC AAACAATGCT TGTAGACACT 
TCGGGATCCA AAACTCCCAA ATATACTGAA ATATTAAATC TTGTTGATCA CATCAAATAT 
GAAGGTCTCA CTCCAGGAGA AGAGTATGAA ATTACTGGAG AACTCTATGA AACAAAACAA 
GTCCAAGAAG GTGCAGCAGA ACCCATCGCT CGCGGGACTG TCCGTTTTAA AGCTTCTACC 
TCATCGGGAG AAGCCGCTGT TCCTTTTTCT GTAAGAACTA CTTCTCTTGA GGGTAAAGAA 
GTTACTGCCT ACGAAACAAT CTCAAAAGAT GGAGAAAAGG TTGCTTCACA TACCGACAGC 
CACTCTGAAG CTCAGACTAT TCGTGTAGCC CCTAAGCCCC ATCTTCCCGA AACGGCAGAT 
AATGCTTACG AAATTCCTCT TTTATTCGCT CTGGCAGGCG CGTTACTCAT TGGATGTACT 
CATTTATTTG CTACAAAAAT AAGACGGCTT TTTTGA

Protein sequence

MFITKSSKPK EKITAQKRSL ASAFHFWFIP LLIGGLLLSH LLLKPAHKLA FAQDPSFTVA 
QREDFPGGQQ IPMWTASDGT YLYCGDEFNH YGAWPGATGS IVDPQSYTKL TSATGARGGT 
YTDEQLRAID YIIYHGATAS QEKDVYGYTG WKARAITQFA LWAVMRGEAH TLAVSVPQEE 
LHQPIERFYT DAVNYAHNNS GGPENGIAKL FVPAGDKQVL FFFGEQSGSL KITKNSLLPA 
ITSNNEHYAL EGAVYEVYSD EGCTNLLGSL TLDASGSATI DGLPVGCVYV KETSAPKGFL 
LDPTVHTVEI KNQEESTLAV TDTPIGDFNL HISKQDFDHS ANLDEGNQAE QQGTSPQGNA 
TLQGALFKVT YSGSSETTLR TWVFSTDAQG FTSFDADHKV SGDDLFTLDE KPWLPLGYYQ 
IEEIQAPKGY KLPELSFQTW KLSSQNGNLV WTNVSSGKES SSSEHSFIFK DEVIRGNLKI 
KKIGHTSLSS SDGYSEIKEM PSLKGAKIEL TNNSTQPVFY QDKWIAPHEV VTTVETDESG 
VAAIKDLPFG SYSLKEVLAP AGYSLNTEWN PTVTLTSEET IEAPELIDER IALQTMLVDT 
SGSKTPKYTE ILNLVDHIKY EGLTPGEEYE ITGELYETKQ VQEGAAEPIA RGTVRFKAST 
SSGEAAVPFS VRTTSLEGKE VTAYETISKD GEKVASHTDS HSEAQTIRVA PKPHLPETAD 
NAYEIPLLFA LAGALLIGCT HLFATKIRRL F