Gene Apar_1062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1062
Symbol
ID	8413935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1205938
End bp	1207104
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	45%
IMG OID	645022651
Product	sugar isomerase (SIS)
Protein accession	YP_003180081
Protein GI	257784864
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2222] Predicted phosphosugar isomerases
TIGRFAM ID	[TIGR02815] putative sugar isomerase, AgaS family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.316402
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAA AGAGCCAAGA AGAGCTAAAG GCACTAGGTG CGGATATTAC AACTGCCGAG 
ATTAAGCAGC AGCCTGAGCT TTGGGAGTCT ACCTTTGGCA TTTATCAAGA GAACCTTTCT 
GCAATTAAAG AATTTGTAGA GCGCGCTCGT AGTCTTGGTG GGAAACGTCG TACGCGCGTG 
GTTTTTACTG GCGCAGGTAC CTCGGCATAT GTAGGTGATA CCATTACTCC CTATCTTCGT 
TCTCATGGCG AGAAGAGCTC TTTTGAGTTT GTGTCTGTTG CAACTACTGA TATTGTTTCT 
GATCCTTACG GTAGTCTTGA TCTAGAGGAT CCAACGGTCC TGGTGTCTTT TGCACGCTCT 
GGTAATAGTC CAGAGAGTCT TGCTGCAGTA AATATTGCTC GCCAAATTGT TAAAAATCTT 
TTGCTCATCA ATATTACTTG CGCTCCTGAA GGAAAACTTG CTGTTGAGTC CGCAGGTAAA 
GACGATACAT TGCTTCTTCT TATTCCTGGT GCAAATGACC AGGGCTTTGC AATGACTGGC 
TCTTATAGCT GTATGACACT TCTTGCAACG CTTGTCTTTG ATAGCGCCGA TGACCAGCAG 
AAGAAGGCTT GGATACTTGA TGCTGCTAAG CTGGGTAGAC AAGTAATTGA ACGTGAGGAA 
GAGATTGCTG AGTGGCTCAA GAGTGATTTC AACCGCATTA CTTATTTGGG TTCTGGTCTT 
TTTGTGGGTC TTGCTCATGA GGCACAGCTT AAGATTTTGG AACTTGCAGC TGGTATTAAT 
GCAACGTCGT GGGATTCTTC AATGGGATAT CGCCACGGAC CAAAGTCTTT TGTTGACGAG 
CATACCTTGG TGTTTGATTT TGTTTCTAAC AATCCTTATA CGCGTCAATA TGATCTGGAT 
ATTCTTGACG AGATTAGGGG AGACCAGATT GCCGCTCTGA CCATTGGTAT TGAGCAAGAG 
GGCACAACAA ACTTTGCGGG AAGAACTTTT AGTCTTCCTG TACTTTCAGA GCCTCTGCCA 
GCACCTTATT TGGCTCTGCC CTTTGTAATG GTCGCTCAGG TAGTAGCACT TTTGAACTCA 
GTTCGCGTTA ATAACAAACC GGACACACCT TCTCCAACCG GTCAGGTTAA TCGAGTAGTC 
AAGGGTGTTA CAATTCACTC ACTGTAG

Protein sequence

MFKKSQEELK ALGADITTAE IKQQPELWES TFGIYQENLS AIKEFVERAR SLGGKRRTRV 
VFTGAGTSAY VGDTITPYLR SHGEKSSFEF VSVATTDIVS DPYGSLDLED PTVLVSFARS 
GNSPESLAAV NIARQIVKNL LLINITCAPE GKLAVESAGK DDTLLLLIPG ANDQGFAMTG 
SYSCMTLLAT LVFDSADDQQ KKAWILDAAK LGRQVIEREE EIAEWLKSDF NRITYLGSGL 
FVGLAHEAQL KILELAAGIN ATSWDSSMGY RHGPKSFVDE HTLVFDFVSN NPYTRQYDLD 
ILDEIRGDQI AALTIGIEQE GTTNFAGRTF SLPVLSEPLP APYLALPFVM VAQVVALLNS 
VRVNNKPDTP SPTGQVNRVV KGVTIHSL