Gene Apar_0448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0448
Symbol
ID	8413297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	516230
End bp	517126
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	46%
IMG OID	645022016
Product	extracellular solute-binding protein family 3
Protein accession	YP_003179470
Protein GI	257784253
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.917749
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTCT TTGAAAATAC TTCCACTTCT CTTTCTCGTC GTGCTTTCCT TGGTGCAACC 
GCACTTTCTG CTGCAACTCT TTTGGCAGCT TGCAAGAAAA AGGATTCCGA TGGAGCTCAG 
GGCGGATCTT CTGATACAGA CTCAAAGTTT AGAACTCTTG ATGATATCAA GAAGGCAGGC 
ACAGTAAATA TCGGCGTCTT CAGCGATAAG GCTCCTTTTG GTTACGTTGA TGCAAACGGT 
AATTACGCTG GTTACGACAT TGTTTTTGCT GAGCGTCTTG CAAAGGATAT GGGCGTAAAG 
ATTAACTACA TTGCCACTGA CGGACAAAAT CGCGTGCCTT TCTTGCAGTC AAATAAGGCA 
GATATCATGC TGGCAAACTT TACGGTAACT GATGACCGTA AAGAGAAGGT TGATTTCTCC 
CTGCCATACA TGAAGATCAA GCTGGGTGTT GTTTCTCCAG CTTCTGCGCC AATCACAGAC 
GTTTCTCAGC TTGATGGCAA GAAGCTTATT GTTTCTAAGG GAACCACAGC TGAGGTTTGG 
TTTGCTAAGA ACGCACCTAA GGTTGAGCTG GTGAAATTTG ATAGCTACGC TGATGCGTAT 
AACGCGCTGC TCGACGGCCG CGGAGACGCG TTCTCAACTG ACAATACCGA GGTACTTGCA 
TGGGTTAAGT CTAACCCTGG CTTTATTGTT GGCATCGATG ATCTGGGCGA CTCCGATACT 
ATTGCTGCAG CAGTTCACAA AGGCAATTCT TCGCTATTGG AGTTTATCAA CAATGAGATT 
ACCGGTCCTC TTGCAGAGGA GAACTTCTTC CACAAGGCCT ATGAAGAGAC GCTTGCTCCA 
ATTTATGGCG ACGAGGTAGA TCCAAATACC ATGGTTGTCG AGGGCGGCAA AATTTAA

Protein sequence

MNFFENTSTS LSRRAFLGAT ALSAATLLAA CKKKDSDGAQ GGSSDTDSKF RTLDDIKKAG 
TVNIGVFSDK APFGYVDANG NYAGYDIVFA ERLAKDMGVK INYIATDGQN RVPFLQSNKA 
DIMLANFTVT DDRKEKVDFS LPYMKIKLGV VSPASAPITD VSQLDGKKLI VSKGTTAEVW 
FAKNAPKVEL VKFDSYADAY NALLDGRGDA FSTDNTEVLA WVKSNPGFIV GIDDLGDSDT 
IAAAVHKGNS SLLEFINNEI TGPLAEENFF HKAYEETLAP IYGDEVDPNT MVVEGGKI