Gene Apar_0143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0143
Symbol
ID	8412989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	163045
End bp	164574
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	48%
IMG OID	645021713
Product	ABC transporter related
Protein accession	YP_003179170
Protein GI	257783953
COG category	[R] General function prediction only
COG ID	[COG3845] ABC-type uncharacterized transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAGTCA GTTCGGATTA CGCTGTTCAG ATGCATGGCA TTACCAAAGT TTTTGGATCG 
TTTAAAGCTC TTGACGCCGT AGACCTTAAC GTGCGCAAGC AAACTGTCCA CGCCATTTTA 
GGAGAGAACG GCGCAGGTAA AAGTACGCTC ATGAACGTAC TGTATGGCCT GTATTCTGCT 
GATGAGGGCG AGGTTTACCT CAACGGAGAG CGTGTATCCA TATCTGATCC AAACGATGCT 
ATCGCTCACG GTATTGGTAT GGTTCACCAG CACTTTATGT TGGTCGAGAA TTTTACTGTT 
ACAGAAAATA TTGTTTTGGG TAATGAGGTC ACCAAAACCG GTGGCATTCT TGATCCAAAA 
CGAGCTCGCG AGAAGGTCCT TGAAATTGTT GAGGAATACG GCTTTGACGT AGATCCTGAC 
GCTAAGATTG AAGACATTTC TGTTGGTATG CAGCAGCGTG TTGAGATCTT AAAGGCCCTA 
TATCGCGGTG CTGATACGCT GATTCTTGAT GAGCCTACGG CAGTGCTTAC GCCACAGGAG 
ATTGAGAAGC TTATCCAGAT CATGCATGAC CTGGTAAGCA AAGGTAAAAC CATCATTGTT 
ATTACTCACA AGCTTAAAGA GATTATGTCA TCTGCAGATG AATGCACTAT TATTCGCCGC 
GGTAAGTACA TGAGCACTGT TGATGTCTCC AAGACATCAG AGACTGAGCT TGCAACACTT 
ATGGTGGGTA GAAACGTTAA CCTGCATGTT GAAAAGAAGC CAGCAACTCC TGGTGAGGTT 
GTGCTTTCTA TTAAGGATCT CCACGTCAAG GATGAGCGTG GTATTGAGCA GGTAAACGGC 
TTTAATTTGG ATATTCGTGC CGGCGAGATT GTTGGTCTTG CGGGTATCGA CGGCAACGGT 
CAGAAAGAAC TCGCCGATGC CATAAACGCA ATGGTCAAGC CCGAGTCGGG CACCATCACC 
GTCAAAAATG AAGAGATTCA AGGTACAACT CCTAAGACGG TCATTGATCA TGCGGTTGCA 
ACCATTCCTT CAGACCGTCA TCGTTGGGGC TTGGTCCTGC CATTTACGGT TGCCGAGAAC 
ATGATTCTTG AGCGCCACAA TGAGGAGATT TTTGGCAAGG GCATTGCGCT TGATTTGGCA 
AAGATGAAGG AATTCTCTCA GAAGTTGATT GACGAGTTTG ATATTCGCCC TGCAGAGTGC 
TCCGATCATC AAGCAGCAGG ACTTTCTGGT GGTAACCAGC AGAAGGTTAT TATCGCCCGA 
GAGGTCTCTT CCAACCCAGA CGTTCTTATT GCCATCCAGC CAACTCGCGG CCTTGACGTT 
GGTGCAATTG AGTTTGTTCA CAAAGCGCTG ATTCGCGAGA GGGACCGTGG AGCAGCAATT 
TTGCTGATTT CCTTTGAGCT GGATGAGATT ATGGACGTTG CCGATAAGAT GGCAATTATT 
TACGCCGGCA AGAATGTTGG CGAGTTTGAC CAAGGTACTA TCACTGAAGA GCAGGCTGGC 
CTGCTGATGG CAGGAGGTGA CGCCGAGTGA

Protein sequence

MEVSSDYAVQ MHGITKVFGS FKALDAVDLN VRKQTVHAIL GENGAGKSTL MNVLYGLYSA 
DEGEVYLNGE RVSISDPNDA IAHGIGMVHQ HFMLVENFTV TENIVLGNEV TKTGGILDPK 
RAREKVLEIV EEYGFDVDPD AKIEDISVGM QQRVEILKAL YRGADTLILD EPTAVLTPQE 
IEKLIQIMHD LVSKGKTIIV ITHKLKEIMS SADECTIIRR GKYMSTVDVS KTSETELATL 
MVGRNVNLHV EKKPATPGEV VLSIKDLHVK DERGIEQVNG FNLDIRAGEI VGLAGIDGNG 
QKELADAINA MVKPESGTIT VKNEEIQGTT PKTVIDHAVA TIPSDRHRWG LVLPFTVAEN 
MILERHNEEI FGKGIALDLA KMKEFSQKLI DEFDIRPAEC SDHQAAGLSG GNQQKVIIAR 
EVSSNPDVLI AIQPTRGLDV GAIEFVHKAL IRERDRGAAI LLISFELDEI MDVADKMAII 
YAGKNVGEFD QGTITEEQAG LLMAGGDAE