Gene Apar_0821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0821
Symbol
ID	8413686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	904154
End bp	905809
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	45%
IMG OID	645022403
Product	Monosaccharide-transporting ATPase
Protein accession	YP_003179841
Protein GI	257784624
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4211] ABC-type glucose/galactose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00463034
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCAAAAA CAGGTGGATC TGTTCTGACG GCTGAGCAGG AAAAAGAGCT GCTAAAGCCT 
ATTGATCAGA AGATTGGTTC CATTCAGGCT CAAATTGATG AGCTTCGCGC AAATGGTACC 
AATAAAGTAA TTTCAACGTT GAGCGCTATT GAGTCTACAA AGCGCGATAA GTCCATTTCT 
GCCGAAGAGC GTACCACGCT TATTGAGGGC TACAAAACTG AACTTGAGCT TGCAAAGAAG 
GTTGAGTCCG AGAACAATGC TCAGGTCTCC AAGCTTATTG CAGAGGCAGA GGCTTACCTC 
AAGGAACACT ACAAGAGCGA GTATCTAGAG CCCGTTAAGG CTAGCTGTGC TGTCGAGAAG 
ACTCAGGCCA AGCAGAATTA TGAGGCTGCT CTTGATCGTC TTAAAAAGGA GCACGAAGAA 
GCTGTCAGGA AGACTTCTGA CGCTCAGGAA ATCAAGGACG AGAAGTACGT TTACAAGAAC 
CGTCAGTTTG ACGCTAAGGT CAACTATCAG AAAGATCTTC AGCGCATCAA AGATCGTGCT 
CATAATGCAT TTAGTCATGA GTATCACCTC ATCGACCTTC TCAGGATGTC TAAGTTTACT 
CCACTGGAGT CTCAGGCTCA GAAGTGGGAG AACTACAAGT ACACCTTCAA CACCCGTTCA 
TTCCTGCTTC AGAACGGTCT GTACATTGTT ATTCTCCTGG TATTTATCGC CCTTTGTATT 
ATTACTCCAG CAGTCAAGGG CACTCAGCTT TTGACATACT CCAATGTCAT TAACATTCTT 
CAGCAGGCAT CTCCTCGAAT GTTCTTGGCT CTTGGTGTAG CTGGATTGAT TTTGCTTACC 
GGAACTGACC TTTCTATTGG TCGTATGGTT GGTATGGGTA TGACCGCTTC AACCATTATC 
ATGCATCAGG GTATCAATAC TGGTCAGGTC TTTGGTATCA CTTTTGATCT TACTGGTGTT 
CCAATTCCTG TCAGAATCAT TATGGCTTTG GTCACTTGTA TTGTTCTGTG TACTTGCTTC 
ACTAGTATTG CTGGTTTCTT TACCGCCAAG TTTAAGATGC ACCCATTCAT CTCGACCATG 
GCTAATATGC TGATTATCTT TGGTATTGTT ACCTATGCAA CAAAGGGTGT TTCGTTTGGT 
GCCATCGAGC CATCTATTCC AGATATGGTC ATTCCACGAA TTGGTAAATT CCCATCTATC 
ATTTTGTGGG CAATTGCCGC TATCGCTATT GTTTGGTTCA TTTGGAACAA GACTACCTTT 
GGTAAGAACC TCTACGCTGT AGGTGGAAAC CCTGAGGCAG CAGCTGTTTC TGGTATTTCA 
GTCTTTAGAG TTATGGTTGG CGCTTTTGTC ATGGCTGGTA TTCTTTATGG ATTTGGTTCA 
TGGCTCGAGT GCATGCGTAT GGTTGGCTCT GGTTCAGCAG CTTATGGTCA GGGCTGGGAT 
ATGGACGCAA TCGCGGCCTG CGTTGTTGGC GGCGTTTCGT TTACGGGTGG TATTGGTAAG 
ATCTCTGGTG TCACTACAGG TGTTCTTATC TTTACTGCAC TGACTTACGC TTTGACAATT 
CTTGGTATTG ATACCAACCT TCAGTTTGTC TTCTCGGGCG TCATCATTCT GACTGCTGTC 
ACCCTTGACT GCTTGAAGTA CGTTCAGAAG AAGTAG

Protein sequence

MPKTGGSVLT AEQEKELLKP IDQKIGSIQA QIDELRANGT NKVISTLSAI ESTKRDKSIS 
AEERTTLIEG YKTELELAKK VESENNAQVS KLIAEAEAYL KEHYKSEYLE PVKASCAVEK 
TQAKQNYEAA LDRLKKEHEE AVRKTSDAQE IKDEKYVYKN RQFDAKVNYQ KDLQRIKDRA 
HNAFSHEYHL IDLLRMSKFT PLESQAQKWE NYKYTFNTRS FLLQNGLYIV ILLVFIALCI 
ITPAVKGTQL LTYSNVINIL QQASPRMFLA LGVAGLILLT GTDLSIGRMV GMGMTASTII 
MHQGINTGQV FGITFDLTGV PIPVRIIMAL VTCIVLCTCF TSIAGFFTAK FKMHPFISTM 
ANMLIIFGIV TYATKGVSFG AIEPSIPDMV IPRIGKFPSI ILWAIAAIAI VWFIWNKTTF 
GKNLYAVGGN PEAAAVSGIS VFRVMVGAFV MAGILYGFGS WLECMRMVGS GSAAYGQGWD 
MDAIAACVVG GVSFTGGIGK ISGVTTGVLI FTALTYALTI LGIDTNLQFV FSGVIILTAV 
TLDCLKYVQK K