Gene Apar_1126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1126
Symbol
ID	8413999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	1276292
End bp	1277464
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	46%
IMG OID	645022715
Product	glycosyl transferase family 2
Protein accession	YP_003180145
Protein GI	257784928
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.463481
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCACA CTCAAAATCA CCAACCCTTG GTTTCTCTTG TTGTGCCTAT ATATAACGTT 
GCAGACTATC TGGAGCAGTG CCTGGCAAGC ATTCAATCAC AAAGCTACAC AAACCTAGAG 
ATTATCTGCT TAAACGATGG CTCAACCGAC ACATCTTTAG CTCTTTTGGA AGCATACGCA 
GCCCATGATG GACGCATTGT CATCATAGAC AAAGAAAACG AAGGTTACGG AGCAACATGT 
AATCGTGGTA TTGCCGCAGC TCACGGCATG TGGGTAGGCA TTGTTGAACC TGACGATTAC 
CTTGAGCCAA CTATGGTTCA AGAGCTTATT GATCTTATCC AAAAAAACGG CGGAGAAGAC 
CAGGTAGATA TTGCACGTTC TGCGTATTGG CGCGTGTTTG GCAATCAGAA AAATGGTCGA 
GCAGGAGCAA AGACACAGAT AAAGAATACT GCTGGTTCTG CCGAATACAG GATTGCCTGC 
GCTTATAAAG GCCGCGTCAA ACCTAAGTAT CAACCTTGTT CTATTGATCA GATGTCACAG 
CTTCTATTAC ACCATCCTGC CATTTGGACA GCACTCTATC GCAAGAAATT CTTGACCCAG 
AACAACATCA ACTTCAGAGA AGTTCCTGGT GCAGGCTGGG TGGACAACCC CTTCCTCATT 
GCGTCGCATT GCTGTGGTGC TCGTCTGGTG TATACAGACT CAGCACTTTA CAACTATCGC 
GAGAATGGCT ATGCAGAAGC TGTCGCTTTT GCGCAGCGTC AGCCCAAAAT TCCGCTTGAA 
CGTTGGAATG ACATGATGGA CGTTGTGGAC ACACGCAACA TCACCTCAAA CGTAGTGCTC 
AATGCACTCA CGCTGCGTGG CATAAATTAC GCACTGCTTA CAAAAGACGC ACTTATCTGG 
CGAGAAAAAC ATGATGCTGC AGGTGAGATT GACTCAGAGG CACACGATCT TCTCGCCAAG 
AGCTTTGAAC GTATGGACGC AAAACGTGTT ATTGAAAACC CAGCAATCCC GGGTTCTGGG 
AAAGCTTTCT TTGCGCAGAT ACGTGGTATT GCCCTACCAA AAGAAGACAA ATTTGCTCGT 
TATGCTTATC TAGCCAAAGA AGGGTTCTTC CGACTCAAAA ATGATGGCAT AGTACAGACG 
CTTAAATCGC TTACAGACAG ACGCGAAAGT TAA

Protein sequence

MSHTQNHQPL VSLVVPIYNV ADYLEQCLAS IQSQSYTNLE IICLNDGSTD TSLALLEAYA 
AHDGRIVIID KENEGYGATC NRGIAAAHGM WVGIVEPDDY LEPTMVQELI DLIQKNGGED 
QVDIARSAYW RVFGNQKNGR AGAKTQIKNT AGSAEYRIAC AYKGRVKPKY QPCSIDQMSQ 
LLLHHPAIWT ALYRKKFLTQ NNINFREVPG AGWVDNPFLI ASHCCGARLV YTDSALYNYR 
ENGYAEAVAF AQRQPKIPLE RWNDMMDVVD TRNITSNVVL NALTLRGINY ALLTKDALIW 
REKHDAAGEI DSEAHDLLAK SFERMDAKRV IENPAIPGSG KAFFAQIRGI ALPKEDKFAR 
YAYLAKEGFF RLKNDGIVQT LKSLTDRRES