Gene Apar_0951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0951
Symbol
ID	8413822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1070558
End bp	1071574
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	46%
IMG OID	645022539
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_003179971
Protein GI	257784754
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00952521
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAGAC GTTCGTTCCT TAAGCTTGCA AGTCTTATTC CAGCTACAGC ATTGTTTGGC 
TGCAAGGGAA CAAGTCAAGA GAAGTCTCAA GAAACTGCAA AAGATGAGGC TAAGAAATCT 
GACCCCGTTG CGGTAAAAGT TGCAACACTT AAAGGACCTA CCGCCATGGG CTTGGTTAAG 
TTCATGAGTG AGGTTGAAGC AAAAAACATT ACCGACAACA ATTATTCATT TGAGATTTTA 
GATGCCCCTG ATCAGGTAGT TGCTAAGGTA GCTCAGGGTG ATGTCGACGT TGCGTCTATT 
CCTGCAAACC TTGCCGCTAC GTTATTCAAC AAGACCAAAG GTGCCTACAA GGTAGCTTGC 
CTCAACGTAC TGAATGTTCT CTACATTGTT GAGACGGGAA GCGCTATTTC TAAGATTGCT 
GACCTTAAGG GAAAGACGCT CTATGCCTCT GGTAAGGGTG CTGTTCCAGA GTACACACTG 
TCCTACTTGT TGAGCAAAAA TGGTATGACG CTTGGTGAAG ATGTCCAGGT TGAGTGGAAG 
AGCGAGCATA CCGAGTGCGT TGCAGCTCTA GCACAAGATC CAGAGGGAAT CGCATTGCTT 
CCACAGCCTT TTGTTACCGT GGCACAAACC AAGAACAGTC AGATTCGCAT AGCAATTGAC 
CTTGGTGCCG AGTGGGAGAC AGTTAATCCT CAGAGTAAGT TGATTGCAGG CGTAACCATT 
ATTTCTTCAA AGCTTATCTC GGATTCTCCA GATGCTGTGA CTGCTCTGCT TTCTCACTAC 
AAAGACTCTG TTGAATTTGC TGTTGATCAT CCAGATGATG CTGCTACACT TGTGGGCAAA 
TACGGCATTG TTCCAGAGCC TATTGCCAAG GTTGCACTGC CTAAGTGTAA TATTACGTAT 
ATTGATGGCG CAGATATGAA GACTGCACTT TCAAGTTATT TAGGCATTCT GGCCGAGGCT 
AATCCTCAGT CAGTAGGCGG ACAGGTTCCC GGAGACGATT TCTACTTTGG CGCATAA

Protein sequence

MDRRSFLKLA SLIPATALFG CKGTSQEKSQ ETAKDEAKKS DPVAVKVATL KGPTAMGLVK 
FMSEVEAKNI TDNNYSFEIL DAPDQVVAKV AQGDVDVASI PANLAATLFN KTKGAYKVAC 
LNVLNVLYIV ETGSAISKIA DLKGKTLYAS GKGAVPEYTL SYLLSKNGMT LGEDVQVEWK 
SEHTECVAAL AQDPEGIALL PQPFVTVAQT KNSQIRIAID LGAEWETVNP QSKLIAGVTI 
ISSKLISDSP DAVTALLSHY KDSVEFAVDH PDDAATLVGK YGIVPEPIAK VALPKCNITY 
IDGADMKTAL SSYLGILAEA NPQSVGGQVP GDDFYFGA