Gene Apar_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0601
Symbol
ID	8413458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	670463
End bp	671392
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	50%
IMG OID	645022176
Product	diacylglycerol kinase catalytic region
Protein accession	YP_003179622
Protein GI	257784405
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.902429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.638771
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCAAT CCCCTCTTGG ACGCACACTT ATCATAGCTA ATCCCGCTGC TCATAGTGGT 
AAAGGCGCTG CAGGTGCGGA ATTTGCTCGA CACTTCCTTA CCAGCTATTC AGCCGCAACG 
GATGGATACG AGCTCAAGCT CACCACAGCT ATGGGAGACG CTCGTGTTAT GGCCTCAGAA 
GCTGCAGATT TTGACACGGT TGTCACACTT GGCGGAGATG GCGTTATCCA TGAGGTGGTT 
AATGGTCTCA TGACCTTATC GCCAGAAACA CGCCCAGCGC TTGGCATTAT CCCTATGGGC 
TCTGGAAACG ATTATGCGCG CACACTGGGC ATGAAAATCA ACGATCCAGA AGGCGCTTTT 
GCGCAGCTAG TTCGCGGCAA GATTAAGCAA CTAGAGATTG GTCGCATCAA CGACGTCTAC 
TTTATGGAAA CTATGTCATT TGGACTTGAC GCAGCTATTG CAATCGATAC CACAAAGCGA 
CGTGCAAACA ACTCATCAAC TGAAGGCGAA GCACTCTTCT TTACCTCGGG CCTTAAGTTC 
ATGTCTGCAG GTAGCAAGGG TTATCCCTGC ACCGTCTCGT TTGATGGCGA GAAGGACATT 
GACCTCCAAG CTCTTATCAT GGCCTTCCAA GTTGGACCTA CATACGGCGG TGGCTTTAAA 
GTTTGCCCAC ATGCCCAGCC AGATGATGGT CTGCTCACCG TTTGTTATAA CACCAAAGTC 
CCTAATATCC CCCACCTGCT AGCCTTGTTT GGTCTAGCAA AGTCTGGCAA ACACATCAAC 
TCCCGTATCA TTGAAGAACG TCATCTCAAA CAAGCAGTGG TAACTTTCCA CAAGCCGGTT 
CCTGTTCAGG TTGATGGCGA AGAACTTCCT TTTGCAGAGC AATTTGTCAT TGAGGTCATC 
CCCGACGCGC TTTCCGTGGT TGTTCCCTAG

Protein sequence

MSQSPLGRTL IIANPAAHSG KGAAGAEFAR HFLTSYSAAT DGYELKLTTA MGDARVMASE 
AADFDTVVTL GGDGVIHEVV NGLMTLSPET RPALGIIPMG SGNDYARTLG MKINDPEGAF 
AQLVRGKIKQ LEIGRINDVY FMETMSFGLD AAIAIDTTKR RANNSSTEGE ALFFTSGLKF 
MSAGSKGYPC TVSFDGEKDI DLQALIMAFQ VGPTYGGGFK VCPHAQPDDG LLTVCYNTKV 
PNIPHLLALF GLAKSGKHIN SRIIEERHLK QAVVTFHKPV PVQVDGEELP FAEQFVIEVI 
PDALSVVVP