Gene Apar_1356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1356
Symbol
ID	8414247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1529252
End bp	1531177
Gene Length	1926 bp
Protein Length	641 aa
Translation table	11
GC content	45%
IMG OID	645022959
Product	hypothetical protein
Protein accession	YP_003180371
Protein GI	257785154
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.347792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATTA CACATGACTA TGTTGACTAT CTAGACGAGC AAATTGATAT TGCTCCTGCC 
GGTAGCCAAG AGGAGCTTCA GGCTGCTCAA ACTATTGCTG AAGAAATGAA AATTCACGGA 
CTTGAAGCAA CCATTGAAGA ATTTGATGCT AAGTCTATTA AGAGTCTTGG CTATTCAGTC 
TATCTAATTT TCCTCTTCAT TGGCATTATT TTTGCAGGAA CTAGTAACGT AGCACTCATT 
GTTTTTGGTG TTTTGCTTGT TGTTGGTTTT GGTGCACTCA CTTGTCTTAA GTATTTTGGT 
AATGACGTTC TCGGTACATT TGGATCTTCC ATTAGAAGTC AGAATGTTGT CGCTAAGCAT 
GAGGCTACCG GTGAGCTTGT TGCAAAAGGC AATCGTCCAA TCGTAATCGT TGCTCATTAT 
GATTCTCCAC ATACCAACTT CCTTGTTGAG TCTCCTGTTG CGAAGTACGT ACCTCTTGCA 
CAAAGGTATG CACGTTGGTG TGTAGTTGCT GTATTTGTTG CTACTTTTGT TCAGATTCTT 
CGTTTCCTTC CTGATTCAGT TCGTATCTTT TTCTGGATTG TTGGTATTCT TGCAGCTCTT 
CCGCTTGTTG CGCTATCTAT TGCAACTATC GCAGAGCGTT TTGCACCATG TACTATCGGC 
GCAAACAACA ATAAGTCTTC AGTTGCGGCT CTTCTTGGCA TTCTCGAAAA CGTTCGTCCT 
ACTGGACATC GTCCTGAGGT TATTCATCAC TTTGCAGGAG ATGCTGCTGC GCTTATCCCA 
GAGCCTGATG AGGTGGAAGG CGTTCGTCAT GGCGAGGAAG TTCTCAATTC ATTGGGCATT 
CTTCCTAAGG ATTGCGAAGT AAGCTACGTT GCTTATGACA CTACTGGTGC CAGTCAGACC 
GCATCTCTTG ATGATGTTGC GGAAGCTGTA AATGCCACAA CAGAAGAAGA ACAGGCTGAG 
GATGCTGCAT CTGACAATAC TGTTGTTTAT GACTCTGTTG ATGATGAACT TAATGCAACC 
ATGAAGCAGG TTCATGAGTC TGCAGATGCA AACGCAACAT TAGTACAGCC TGGAGAAGCG 
CATGAGCTCC ATTCTAAAAA CGATTTTGCT CGTCGCGCGT CACTTTTCGA CCTACCCGAT 
CCTTCTGGCG ATGCTGTTGA TCCACTGGCT CCATCTTCTG AACCAGCTCC TCATTATGTT 
CCAGCTTCAA CACCTGCACC TACTCCTGAA ACAGAAGATG CGGAGGGTCC ATTTGACACC 
ATTTCAGCTG ATGAGAGTCT AACGGAGACA CAAGACGCAA AGACTCCTGA GGCCAAGCGT 
CGTTCTTTCA GGCTTTTTGG ACGCAACGAT GGGCCATCAG ATGACTGGAA GGGAGGAGCA 
ACTCCATCTG CAGAAAATCG TGAAGAAGAT GACTCTGAGG ATGTATCTGC TATTTCTGAG 
GACGATCTTC GTAATGCCGT TCTTTCACTT TCTGATGATG AGCTCATTTC GCATGACATT 
TGGTTTGTTG CGCTTGGTGC ATCTGATTTT GATCACGCAG GCATGAGAGA GTTCCTTGCA 
AAGCACAGAA CTGATATTCG TGGTGCTTTC CTCATCAACC TTGATTGTGT TGGCGCTGGT 
TCGCTCTCTA TTCTTAAGAA TGAGGGAATT GGTAACGTTC GTCGTGCTGA TCGTAGAATG 
ACTCGACTCC TTTCTACTAT TGCGACTGAT CTTCATATTG ATGTTGAGCA GAGTTCATTT 
GACTGGGGAA CCACTGATGC AACTCCTGCA ATGCAGAATT CAGTTCGTTC TGTTACTTTG 
ATGGGAATGA ATGAGGACGG TCTTCCTGCG TTTAGCCGCA CTGCCTCTGA TGTTCGTGAG 
AACGTTAGTG CTGATCAGTG TGCTGACGCT GCAGCCCTTG TTACCGAGCT TATTAGACGC 
TCATAA

Protein sequence

MAITHDYVDY LDEQIDIAPA GSQEELQAAQ TIAEEMKIHG LEATIEEFDA KSIKSLGYSV 
YLIFLFIGII FAGTSNVALI VFGVLLVVGF GALTCLKYFG NDVLGTFGSS IRSQNVVAKH 
EATGELVAKG NRPIVIVAHY DSPHTNFLVE SPVAKYVPLA QRYARWCVVA VFVATFVQIL 
RFLPDSVRIF FWIVGILAAL PLVALSIATI AERFAPCTIG ANNNKSSVAA LLGILENVRP 
TGHRPEVIHH FAGDAAALIP EPDEVEGVRH GEEVLNSLGI LPKDCEVSYV AYDTTGASQT 
ASLDDVAEAV NATTEEEQAE DAASDNTVVY DSVDDELNAT MKQVHESADA NATLVQPGEA 
HELHSKNDFA RRASLFDLPD PSGDAVDPLA PSSEPAPHYV PASTPAPTPE TEDAEGPFDT 
ISADESLTET QDAKTPEAKR RSFRLFGRND GPSDDWKGGA TPSAENREED DSEDVSAISE 
DDLRNAVLSL SDDELISHDI WFVALGASDF DHAGMREFLA KHRTDIRGAF LINLDCVGAG 
SLSILKNEGI GNVRRADRRM TRLLSTIATD LHIDVEQSSF DWGTTDATPA MQNSVRSVTL 
MGMNEDGLPA FSRTASDVRE NVSADQCADA AALVTELIRR S