Gene Apar_0440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0440
Symbol
ID	8413289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	509083
End bp	510081
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	48%
IMG OID	645022008
Product	adenosine deaminase
Protein accession	YP_003179462
Protein GI	257784245
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1816] Adenosine deaminase
TIGRFAM ID	[TIGR01430] adenosine deaminase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCCT GTGCTCTTAT CGATTTGCAT GTCCATCTTG ATGGATCAAT CCCCCTTCCT 
GCCGCAGCCC AACTTGCAGC AGAAGCGGGA CTTAATTTCT CTTTGGATGA ACTCCAAGAA 
AAGATGCAAG TCCCCGCTCA TTGTCAGGAT CTTAACCAAT ATCTTGCAAC GTTTGAGTTG 
CCCTTAAAGC TCATGCAGTC AGAGCAAGGC ATACGTGCTG TTGCAAAGGC ATTTCATAAG 
CAACTTGATG CAGAGGGTAT TCTCTATGCA GAACCCCGCT TTGCACCAGG AAGCCTTACG 
GCGGAAGGTC TTTCTCAGCA AGAAATCCTT GAGGCTGCCC TTGCTGGTAG AGCGGATTTC 
TTTGCAGAGA ATCCACAGTC AGAGCTTCAC ACGGCGTACA TCCTTTGCGC CATGCGTGGC 
ACAGGTGAAG AGCTTAAACG TAAAAATGAA CAATCAATCG ATTTGGCTGT AGCATACCTT 
GGAAAGGGTG TTGTTGCGGC AGACTTAGCG GGAGCAGAAG CACTCTTTGC CACAGAGAAT 
TTCTCGTCAC TTTTTGCTGA AGCGCAAAGA AAAGATGTTC CTTTTACTAT TCACGCAGGA 
GAAGCCGCTG GTCCAGAGAG CATCAAGGCC GCACTTCGTC TTGGCGCACA ACGCATTGGT 
CATGGTGTAC GCTCCCTGGA AGATGTGAGT GTTATCCAGG ACCTCAAAGC TGCAAATGTT 
ACACTTGAGA TTTGTCCTAC CAGCAACCTT CAGACACGCA TCTTTGAGTC AATAGAGCGC 
TTCCCTCTTG AACAGCTGCT TGATGCTGGT CTAACGGTCA CCATCAACAC TGACAACATG 
ACCGCTTCCA ACACTACCCT CTCGCACGAA TTTGAGCTTT TGCAGCAGTA CTGTGGTCTA 
GACAAAAATA CCGCACGTGA GCTTGCTGAA AATGCTGCAC GTGCGGTATT TAGTGATTCT 
AGCGAGAAGG ACTGTCTACT TGCCTACCTT AGGCAATAG

Protein sequence

MSSCALIDLH VHLDGSIPLP AAAQLAAEAG LNFSLDELQE KMQVPAHCQD LNQYLATFEL 
PLKLMQSEQG IRAVAKAFHK QLDAEGILYA EPRFAPGSLT AEGLSQQEIL EAALAGRADF 
FAENPQSELH TAYILCAMRG TGEELKRKNE QSIDLAVAYL GKGVVAADLA GAEALFATEN 
FSSLFAEAQR KDVPFTIHAG EAAGPESIKA ALRLGAQRIG HGVRSLEDVS VIQDLKAANV 
TLEICPTSNL QTRIFESIER FPLEQLLDAG LTVTINTDNM TASNTTLSHE FELLQQYCGL 
DKNTARELAE NAARAVFSDS SEKDCLLAYL RQ