Gene Apar_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1041
Symbol
ID	8413914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1176037
End bp	1177770
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	42%
IMG OID	645022630
Product	ABC transporter related
Protein accession	YP_003180060
Protein GI	257784843
COG category	[V] Defense mechanisms
COG ID	[COG1132] ABC-type multidrug transport system, ATPase and permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTATCTG TCTTAAAAAT GTACTTTCAG TTTGGAAGCT CTTATCGCCA GAAACTCTAC 
AAAGGTCTTT TCTTTACCAT TCTTGGTTGC CTTTTTGAAG GCGTACAAAT AACGGCGCTT 
TGGATCGTTT TTACCGCTCT TACTACTAAC ACACTCTCAA CCCAGACGAT ATTTTCTGCA 
CTGGGAGTAA TGCTTTTAAG CATTATGGGG ACGTTCGTTT GCGCTCACTT TAAGAGTGAG 
AATTTCTGTG ATGCTAATTT CAGTATGGCT GGTGCAAAGC GTGCAGAAAT TGGAGATACA 
TTACGTCGCC TTCCTATGGG TTATTTTAAC GAGAATAGCC TTGGAGAAGT AACAGCTGTT 
ATGACTAATC AGCTTGACGT AATGCAAAAT CTTGGTGGTC TGCTTTATAT GATGGTTGTT 
GGAGGTTTGG CTTTAACAGC AATTATTGTT GCATTCTTGT TCGTGTTCTG TTGGCAATTA 
GGTCTTATAA CTGCAGCTAC TTTTGTTTTC TTCTGTATAA CAATGGAGCT GCTTCAGGCT 
TACGTACGTA ATACATCAGA TGATTATGTG GCTGCCAACA CTACCTTGAT CAGCTCCGTA 
CTTGAGTATG TCCGTGGCAT TAATGTGGTA AGGTCATTTT CTCTTATTGA CGATGCTGAG 
GGAAAATATG CCAAAGCTGT TGATGATTGT CGTGTTCAAG CACTCAAACT TGAATTTAAG 
GCACTTCGTT TCTCAGTTCT GCAAATGGTT GTTTCTAAGG CTACCAGCGT TATTATGTGC 
TTGGTATCAG TTGAATTATG GCTATCGGGA ACACTTGATA CAGCTTCTTG TTTGACGGTA 
GTAGTTATGT CATTTATGTT GTTTAGTCGC TTAGAATCAG CTGGTCGTTT CTCAACTATT 
TTACGCAACC TTGAAATTGC AATGGAGCAA ACAAATGCTA TTCTCGCTAC TCCTGCAATG 
GAGGAGGGAG AAGGTCTTGA GGAAGCGGCA TCCTGTGACA TAGAGCTTTC TCATGTGTCG 
TTTGGCTACG ACGATAGGCA AATTCTCGAA GATGTAAGCC TTTCTATTCC TGCGGGTACT 
TCTTGCGCAA TTGTAGGACC AAGTGGATCT GGCAAAACAA CGCTTGTCCG TCTTATTGAG 
CGTTTTTGGG ATGTGAATAC AGGACAAGTG TCACTTGGTG GACACGATGT ACGCGACTAT 
AAGGTTGATG CTCTTCTTCA AAATTTCTCT ACCGTTTTTC AGGGAGTATT TCTTTTTGAT 
GACACTATTG AGAACAACAT TAAGTTTGGT AATCCAAGTG CAACTCATGA GCAAGTAGTC 
GATGCAGCTA GGCGCGCCTG TTGTGAGGAG TTTATCCAGG CATTACCTAA TGGATATGAA 
ACACGCTTAG GTGAAGGTGG TTCAATGCTT TCTGGTGGCG AGCGCCAGCG TCTTTCTATT 
GCGCGTGCCA TCTTAAAAGA TGCACCGATT GTTGTACTTG ATGAGGCTAC GGCTAATGTT 
GATCCGGAAA ATGAACTTGA GTTGCAGCAT GCAATTGCAG AGCTCACAAA GTCAAAGACT 
GTCATTATGA TTGCTCATCG CTTAAAGACA GTTCGCAATG CAGATCAGAT ACTTGTGTTA 
GATAAAGGTC GTATTGTGCA AAGAGGCACT CACGAATCTC TCATGGCAGA GGGCGGTATT 
TACGCTGATT TTGTTAACAT GCGCGAGAAA ACCGTTGGCT GGAAAATTGC ATAG

Protein sequence

MLSVLKMYFQ FGSSYRQKLY KGLFFTILGC LFEGVQITAL WIVFTALTTN TLSTQTIFSA 
LGVMLLSIMG TFVCAHFKSE NFCDANFSMA GAKRAEIGDT LRRLPMGYFN ENSLGEVTAV 
MTNQLDVMQN LGGLLYMMVV GGLALTAIIV AFLFVFCWQL GLITAATFVF FCITMELLQA 
YVRNTSDDYV AANTTLISSV LEYVRGINVV RSFSLIDDAE GKYAKAVDDC RVQALKLEFK 
ALRFSVLQMV VSKATSVIMC LVSVELWLSG TLDTASCLTV VVMSFMLFSR LESAGRFSTI 
LRNLEIAMEQ TNAILATPAM EEGEGLEEAA SCDIELSHVS FGYDDRQILE DVSLSIPAGT 
SCAIVGPSGS GKTTLVRLIE RFWDVNTGQV SLGGHDVRDY KVDALLQNFS TVFQGVFLFD 
DTIENNIKFG NPSATHEQVV DAARRACCEE FIQALPNGYE TRLGEGGSML SGGERQRLSI 
ARAILKDAPI VVLDEATANV DPENELELQH AIAELTKSKT VIMIAHRLKT VRNADQILVL 
DKGRIVQRGT HESLMAEGGI YADFVNMREK TVGWKIA