Gene Apar_0074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0074
Symbol
ID	8412917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	83810
End bp	85162
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	52%
IMG OID	645021641
Product	DEAD/DEAH box helicase domain protein
Protein accession	YP_003179101
Protein GI	257783884
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATAA CTTTTGCCGA GCTCGGGCTA AACGAGCAAA TTTTAGCGGG CGTTACAACG 
CTTGGGTTTA GCGTGCCCAC TCCCGTTCAA ACTGCAGCAA TTCCTGCTGT CCTGGCGGGT 
AAGGATGTTG TTGCATCTGC TCAAACAGGA ACGGGCAAAA CTGCAGCGTT TATGTTGCCT 
ACGCTGCAGC GTATTGCTGT CGAGAAACAC GACAAAGCCG AGAAACCTGA CGGCAAACGC 
AATGCAGCCG CCGAGCGCAA CGCAGTCGCC GAGCGCAACG CCAAACGCGG CACCGGCAAA 
CGCAACGCGT ATCCTCGTGC GCTCATCGTT ACACCGACGA GAGAACTTGC AGCCCAAATT 
GACAACGTTG CCAAAAGCGT TTGCGCATCC ACTGGTCAGC AAGCCGTCAT TGTCACAGGT 
GGCGCTCACT ACAAACACCA GATAGCCGCG CTGCAAAAAG GTTGCGACGT GCTGGTGGCA 
ACACCCGGCC GTTTGATTGA TCTTCTCGAC AAGAAGCATA CAAGCCTAGA GGACATCCAG 
GTGCTGGTAC TCGATGAAGC AGACCGTATG CTTGACATGG GCTTTTGGCC AAGCGTGCAC 
CGCATTATGG AACAGCTTCC CAAGGCACAT CAAACGTTGC TCTTCTCGGC AACGCTCCCC 
GCGTCAATTA CGTCAACCAT AGATGCGCTG CTCAAAGACC CAGAGCGTAT CGAGATTGCA 
AGAACCGGAC AAACTGCAGC AACAATCGAG CAACATTTGT GCTCAGTTAC CCAGGGACAA 
AAACCGCAGC TCTTGAAGGC ACTTATCGAC TCGTTTGATC CTGCGCCAGA GCGCGTTTTG 
GTCTTTTGCA GGACAAAGTC GCGCGTTGAT AGCATTTATA AAAACCTCAA AGCTGCAGGT 
CTGAAAGTTG ATGTTATGCA TGCGGACCGT CCGCAAAAAG CTCGCGCAAA AGCTTTAGAT 
CGATTCCGCA GCGCCTCTAT TCAAATTCTT GTTGCAACCG ACGTCATGAG CCGCGGCATT 
GATATCCAGG GCATTGACGT CGTCATTAAC TTTGACGTAC CTCTTGACCC CGAGGATTAC 
GTTCACCGCA TTGGCCGAAC GGGCCGTGCC GGAGCCACAG GTCAGGCCTA TACGTTCATG 
GGACCAGACG AGGTTACGCC GCTTAGAGAG ATTGAGTACT TCACAAAAGC GTTAGTTCCT 
GCATGGGATC TACCTGGCTT TGGGTATGAA ACAGGACGTA TTATTTTGCA GGCGTCTCGT 
TCTACTTCCA AAACTACTCG TTCCATGTTT TCTGGCTCAA GAGCACGCGG AAGAAACTTT 
GGTTTTAGCG GAAGATATGG ACGCCACACA TAA

Protein sequence

MEITFAELGL NEQILAGVTT LGFSVPTPVQ TAAIPAVLAG KDVVASAQTG TGKTAAFMLP 
TLQRIAVEKH DKAEKPDGKR NAAAERNAVA ERNAKRGTGK RNAYPRALIV TPTRELAAQI 
DNVAKSVCAS TGQQAVIVTG GAHYKHQIAA LQKGCDVLVA TPGRLIDLLD KKHTSLEDIQ 
VLVLDEADRM LDMGFWPSVH RIMEQLPKAH QTLLFSATLP ASITSTIDAL LKDPERIEIA 
RTGQTAATIE QHLCSVTQGQ KPQLLKALID SFDPAPERVL VFCRTKSRVD SIYKNLKAAG 
LKVDVMHADR PQKARAKALD RFRSASIQIL VATDVMSRGI DIQGIDVVIN FDVPLDPEDY 
VHRIGRTGRA GATGQAYTFM GPDEVTPLRE IEYFTKALVP AWDLPGFGYE TGRIILQASR 
STSKTTRSMF SGSRARGRNF GFSGRYGRHT