Gene Apar_0617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0617
Symbol
ID	8413477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	692763
End bp	693839
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	45%
IMG OID	645022195
Product	glycosyl transferase family 8
Protein accession	YP_003179638
Protein GI	257784421
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.170905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.336264
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGCAA GCTCATCTGA TGAGCTAGGT CTTGCTCTTA ACGACGTTGT GCTTGTTTTT 
GCCTGTAGTG ACAACTTTGT ACCATATTTA TCTGTAGCAA TTCAGTCCAT TATTGAGAAC 
GTCAATCCAG AGCGTCGCTA CGACATCATT GTTCTGACTC GTGACCTCTC TCCTACCAAC 
ATGATTACGC TTACTCGTCA GGCGCAGCTT GTTAACAACG TGCATGTTGG TTTTTTGGAT 
GTTGACGCCG CCCTTGGTGA CATTGAGCTT CCTCATCATG GTCACTTTAG ACCAGAAACC 
TACTACAGAC TTCTTGCTCC CTCACTGCTT CCTAACGTTA ATAAAGCCAT CTATCTTGAT 
TCTGACCTGG TAGTTAATAC CGACATTGCA GAGCTCTACG ATATTGATAT CACTGGATAT 
TTGGTGGGTG CTACGCGCGA CGCAGATACT ATTGGCCAGA TTGATGGCTA TGACGCCACA 
GTTGGACCCT ACCTAAAAAA TGAACTGGGC ATGGATGATC CTCACGATTA CTTCCAAGCA 
GGCGTCATTT TAATGAACCT AGAAGAGATT AGAAAGCAGA TTTCTCCTGA AGAGTTTCTC 
AAGGTCTCAA CCATGCGTAC ATGGCGCTGG CTTGATCAAG ATGTCCTCAA TAGGTTTGTA 
AACGGTCACT ATCTTCGTAT TAATATGAAG TGGAATTACC TGGTAGATTG GCAGTTTCTC 
CGTCGTGATC ACATTGTTGC TCAGGCACCA AAAGATATAC GAGAAGAATA CGAAGAAGCT 
CGTAAGAATA TTTGCATTGC GCATTTTGCG GGACCTGACA ACAGACCTTG GCTCTATCCA 
AACTCAGATC TTGCAGGTCT TTTCTGGTTC TATGCTCGCC GCTCCCCTTA CCTTGAGGAA 
CTTCGTTCAC AGCTTGAAGA GTCAAGACGC ACTGTAAGAG GTCTTTCTCA TCGCGTGCAA 
AGCGGTGTAC TTTTCCGTGG CTTGATGCCT TTGTTTGATA CCGTTTTTCC ACCAGGTACC 
AAAACACGCA CCAAAGTTAT TACGTCATAC AACAAACTTG GTGGCGGCAA TCTGTAA

Protein sequence

MLASSSDELG LALNDVVLVF ACSDNFVPYL SVAIQSIIEN VNPERRYDII VLTRDLSPTN 
MITLTRQAQL VNNVHVGFLD VDAALGDIEL PHHGHFRPET YYRLLAPSLL PNVNKAIYLD 
SDLVVNTDIA ELYDIDITGY LVGATRDADT IGQIDGYDAT VGPYLKNELG MDDPHDYFQA 
GVILMNLEEI RKQISPEEFL KVSTMRTWRW LDQDVLNRFV NGHYLRINMK WNYLVDWQFL 
RRDHIVAQAP KDIREEYEEA RKNICIAHFA GPDNRPWLYP NSDLAGLFWF YARRSPYLEE 
LRSQLEESRR TVRGLSHRVQ SGVLFRGLMP LFDTVFPPGT KTRTKVITSY NKLGGGNL