Gene Apar_0125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0125
Symbol
ID	8412969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	141751
End bp	142833
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	53%
IMG OID	645021693
Product	oxidoreductase domain protein
Protein accession	YP_003179152
Protein GI	257783935
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAA CAGCGGGTCA GATGTCACAG AGTGCCACGA GCTCCGCACA TAACACTGCG 
AGCACTATGC AGAGCGCCAT GAGCGACGGT GACGCAATCT TTACCGCACC ACACCTCAAG 
TGGGGTGTTA TTGGCTGCGG AGTCATTGCA AACCAGATGG CAGAGGCGCT GGCTTCGGTT 
GGTAGAACCA TCGACGGCGT AGCTAACAGG ACGCAGGAAA AGGCCGTTGC GTTTGCTCAA 
AAACACCACG TCAAGCGTGT GTATGACAGT ATCGACGATC TTCTCGCCAG CGACGAAATT 
GACGCAGTGT ACCTGACCAC ACCTCATAAC ACGCACATCA TCTACCTGCG CAAAGCACTT 
CAGGCGGGTA AGCACGTTCT GTGCGAGAAG TCTATTACGC TCAACTCCGC TGAGTTGCTT 
GAGGCAGAAG AACTTGCACG TCAAAATGGC GTTCAGTTGA TGGATGCCTG TACCATTTTG 
CACATGCCTC TCTACAAAGA GCTGGTTGGT CGCGTGGAGG CGGGCGAGTT TGGCCCAGTC 
AATCTGATTC AAGAAAATTT TGGTAGCTAC AAAGAGTTTG ACATGGAGAA CCGATTCTTC 
AATCCTAAGC TTGCTGGTGG CGCCCTTTTG GATATTGGCG TGTATTCGCT GACACTGGCT 
CGTCTTTTCT TGAAGAGTCA GCCTCATGAC GTGCTCTCCA TGATGAATCC AGCTCCTACT 
GGCGTTGATC AGACGGACGG CATTTTGCTG AGAAATGCCG AGGGTCAGAT GGTTGTTCTG 
GCGCTGACAC TTCATTCTAA GCAGCCAAAG CGCGCCATGA TTTCCGCTGA TAAGGCCTTC 
ATTGAGATTA TGGAGTACCC ACGCGCGGAC GTTGCTACCA TTACCTGGAC TGACGATGGC 
AAGCAGGAGA AAGTTCATGT TGGGCGCACG GCCGATGCTC TGGCATACGT GCTGGCTGAC 
CTGGAAGCTG CTGTTGCGGG AGATGCTTCT GCCCAGGCGC AACTTGAGGT CTCAAAGGAC 
GTTATGGAGC TCATGACTAG CCTGCGCAAT GACTGGAATT TCCTGTACCC CGAGGAGCAA 
TAA

Protein sequence

MSQTAGQMSQ SATSSAHNTA STMQSAMSDG DAIFTAPHLK WGVIGCGVIA NQMAEALASV 
GRTIDGVANR TQEKAVAFAQ KHHVKRVYDS IDDLLASDEI DAVYLTTPHN THIIYLRKAL 
QAGKHVLCEK SITLNSAELL EAEELARQNG VQLMDACTIL HMPLYKELVG RVEAGEFGPV 
NLIQENFGSY KEFDMENRFF NPKLAGGALL DIGVYSLTLA RLFLKSQPHD VLSMMNPAPT 
GVDQTDGILL RNAEGQMVVL ALTLHSKQPK RAMISADKAF IEIMEYPRAD VATITWTDDG 
KQEKVHVGRT ADALAYVLAD LEAAVAGDAS AQAQLEVSKD VMELMTSLRN DWNFLYPEEQ