Gene Apar_0093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0093
Symbol
ID	8412936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	101349
End bp	102767
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	32%
IMG OID	645021660
Product	hypothetical protein
Protein accession	YP_003179120
Protein GI	257783903
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.891852
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGATT TACTTTCACT ACAAAGCAAA ATACAAGATG TATACGTAAG ACAGATTTAT 
TGTGAGGCGG TTGCTAGCTA TAATGCTCAA GCTTATAGAT CGGCAATTTT GACTGCATGG 
CTTGCTGTGT ATGTTGATTT AATGAAAAAA ATAGAATCAA TAGGAGGTAA TAAAATTGCA 
GAGGAATTTC AAACAAAAGT AAATAAAATG CGACTTGAGA AAAACGACTC AGCTAGGATT 
AAATCTGCAT TAGATATAGA AAAAGGAATA ATTTCGACCG CTAAGGATTT ATCACTTATT 
GATGAAGCTG AGGAAAAATT TTTAAGAGAA TTACATGAGT GTAGACACAA GTGCGCCCAT 
CCAACTACAG ATGATACTGT ATATATTTTT GAGCCTACCG AAGAGCAAGT AAGATATCTT 
TTAAGTGGTG TAATAGATAA CTGTCTATCA TTTAGCGCAC TTCCAAAAAA TAATCAAATA 
ATACAAATTT TGATGAATGA TTTATCGAAA GATTTCCCAT TAGAGCAGGA TTTATTTGAA 
TTTTACAAAT CAAAGTATAT TGATAAAATT CCACAGAATA CGCAAAGACA GCTTATTAAG 
ATAATTGCCA TAGAAGCGGT ATGTCCGTCG TCAAAAGAAA AATGGGCGGA GTGCGGACTT 
GAAATATCAA GTCCAGATTT GATTGCAAAA AGGTGTATGC AAATATTGAA ATGCATAAAT 
ACGTTTAGCA AAGATCTTTT AATAGAAGTT TTCACCAATC AATCTAAAAA ATTATCCAAC 
GGTGACTCTT CCTATAGATT TGTTGGTGTA TTTTCTTCAT TTGATTTCTT TAGGGATCAC 
TTAGACCGAG ATCTATACTT TATATGCAAA GCAAAGTTTA ACAAAGCAAT TGAAAGTGAG 
TACGATAAGC CTTGGGAGTT GCTTCTGAAT GGATTTCCGT ATGATCAAGA ATTACGAGAA 
GAATCTGAGA AGTTATTTAA TTCTGATTAT TTTTTAAGCC ATGAGAAAAA TTTGACTGAA 
TTATCAAAAA ATGGAGATTT GGACAACGAT GAGCTAAAGA AGCTTGTTGA TTGTTGTATA 
GATAAATTGG AAAAATCAAG TTCATATAGT GAAGCAGATT ATCTTGCAAG ATTAATAGTT 
GAACTCGCTC CAGTACTGGA GGGTAATGAT ATTTTAAAAA TCTCTGCTAT TTTGTTTAAA 
AACAATCAAG TATTCGAATC TTTTAGTATG GATAGATTAA TCAAAAATAT TGCTTTAAAT 
TCTATGAAGA AGGAGACTGC GAATTATTGG AAAGAGTTTG CTGAAAACGG TATGGAAAAG 
AAAAAACCAG AGTTATTGAA TCCAGATTTA TCTCCAAGTT ATGATTCAGT AATGAAGTGG 
ATTTATAACC GTGCTATCGA AGAGTTAAAA AAGTCTTAG

Protein sequence

MRDLLSLQSK IQDVYVRQIY CEAVASYNAQ AYRSAILTAW LAVYVDLMKK IESIGGNKIA 
EEFQTKVNKM RLEKNDSARI KSALDIEKGI ISTAKDLSLI DEAEEKFLRE LHECRHKCAH 
PTTDDTVYIF EPTEEQVRYL LSGVIDNCLS FSALPKNNQI IQILMNDLSK DFPLEQDLFE 
FYKSKYIDKI PQNTQRQLIK IIAIEAVCPS SKEKWAECGL EISSPDLIAK RCMQILKCIN 
TFSKDLLIEV FTNQSKKLSN GDSSYRFVGV FSSFDFFRDH LDRDLYFICK AKFNKAIESE 
YDKPWELLLN GFPYDQELRE ESEKLFNSDY FLSHEKNLTE LSKNGDLDND ELKKLVDCCI 
DKLEKSSSYS EADYLARLIV ELAPVLEGND ILKISAILFK NNQVFESFSM DRLIKNIALN 
SMKKETANYW KEFAENGMEK KKPELLNPDL SPSYDSVMKW IYNRAIEELK KS