Gene Apar_1197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1197
Symbol
ID	8414075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1342729
End bp	1343784
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	48%
IMG OID	645022791
Product	protein of unknown function DUF871
Protein accession	YP_003180216
Protein GI	257784999
COG category	[S] Function unknown
COG ID	[COG3589] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.717538
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACCG GGATTTCACT GTATTTTGCC AGTGGATATG AAGCTAATGC TGAGGTTGTA 
GCAAAAGCGC AGGCAGCCGG ATGTCACTAT GCATTTACCT CACTACACAT CCCTGAAGAA 
GAGGAGATTG ATTACCGCAC TGAGGCTCGC AAGCTCTTAG AGCTTTGCAG AAAAGCTGAG 
ATTAATCTTA TTGCTGATAT TTCTCCCGTT ACCCTTTCAA AACTTGGCGT TCAGAAGTTT 
GACGAACTTG CAGAGCTTGG CATTACGTAC GTGCGCCTTG ACTTTGGATT TGACGCGGCA 
GAGACTGTAG AGCTTTCTCA CAAGTTTCAT GTGGTTTTTA ATGCTTCAAC CATTACTAAG 
GACGATATCT CTGCGTGGCG CGCAGCTGGT GCTGACTTCA CTCGTTTTGC CGCCTGCCAC 
AATTACTATC CTAAGAGCTA CACAGGCCTT TCTCTTGAGC GCGTAGCTCA AATTAATGCG 
CGTCTTTCTG CTCTTGGATT CCAGATTTTC TCGTTTGTTC CTGGCGAGGT TTTCCGTGGA 
CCTCTCTATG AGGGATTGCC AACTGTTGAG GAACACCGTG GGCTCTCTGG TGATGCACTT 
ATTCAGGCAA TGCTCTCACT TTACGACGTT GACTCTGACG TGGTGCTTAT TGGTGACCCA 
GACGTCACTG AGGCTACCTG GAGGCGCATT GGTCAGCTTG AGAGAAACTG TATTGAGCTA 
AAAGCTGAGT TGAAGTCTGA TTTTGAGTAT CTATATGACC GCACTCAGAC GGATAGACCT 
GATTCCAGCT CGTATATTAT TCGCTCGCAG GAGTCCAGGC TCTGGAAAGA TGCTCCAGTA 
TACGATGCAA AGTCTTCTAC TCGTGAGACT GTTTCTACTG GCACGATCTT GGTGAGTAGC 
AAGGCTTATG GCCGCTATGC AGGGGAGCTT TCAATTGTTC GAGGTCTTTT GGAGCCTGAT 
GCTCGTGATA ACGTTGCAGG ATTAATCTGC GAAGAAGATC AGGCGTTCTT GCCGTACATT 
CACTCTGGCC GCGGTTTTAG GTTTGTACGC AAATAG

Protein sequence

MRTGISLYFA SGYEANAEVV AKAQAAGCHY AFTSLHIPEE EEIDYRTEAR KLLELCRKAE 
INLIADISPV TLSKLGVQKF DELAELGITY VRLDFGFDAA ETVELSHKFH VVFNASTITK 
DDISAWRAAG ADFTRFAACH NYYPKSYTGL SLERVAQINA RLSALGFQIF SFVPGEVFRG 
PLYEGLPTVE EHRGLSGDAL IQAMLSLYDV DSDVVLIGDP DVTEATWRRI GQLERNCIEL 
KAELKSDFEY LYDRTQTDRP DSSSYIIRSQ ESRLWKDAPV YDAKSSTRET VSTGTILVSS 
KAYGRYAGEL SIVRGLLEPD ARDNVAGLIC EEDQAFLPYI HSGRGFRFVR K