Gene Apar_1061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1061
Symbol
ID	8413934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1204714
End bp	1205880
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	48%
IMG OID	645022650
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_003180080
Protein GI	257784863
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.346962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACAT TTGCAGTTAA AGCAGATAAG TTCTTTTTAC CAGGAGCAAC TTCTGGTCCA 
GGATATTTGC TCGTCGAAGA CGGCATATTT GGTCATTTCA CTAAAGAAAA GCCAGAGTGT 
GAGATTATTG ACCGCACCGG TTCTTGGGTA GCTCCTGGTC TTGTTGATAC GCATATCCAC 
GGTTTTCTCG ACCATGACAT TATGGATTGC GATCCTGACG GCGTCATTGA GATTGCTCAG 
GGTCTGCTCT CTAATGGCGT AACTTCTTGG CTTCCCACAA CACTGACCGC AAGCGTTGAG 
CAGACTGGTG ATGCTTGTGA GTCCGTTGCT GACGCAGCAG AGGGAATTGC GGCAAATGGT 
ATTGATGCTG CTCGCATCCA GGGAATCTTT CTAGAGGGAC CATTCTTTAC CGAGAAGCAC 
AAGGGAGCTC AAAATCCTGC GTACTTTCTT GACCCAGATG TGGATGTCTT TGATGAATGG 
CAGGAGCGCG CTGATGGTTG GATTGCCAAG ATAGCTATTG CTCCAGAGCG CGATGGTGCT 
CCAGAGTTCT GTGCAGAGAT GGCAGACCGT GGTGTTCATG TAGCCTTGGG ACACTCTGAT 
GCAACTTTTG AAGAGGCTCT TGCATGTGTA AATGCTGGTG CTGATATCTT TGTTCATACT 
TATAACGGCA TGAGTGGTCT TCACCATCGT GAGCCGGGTA TGGTGGGCGC TGCAATGACT 
ACCCACGGTA CTTATGCAGA GGCAATTTGC GACGGTCACC ACCTTAATCC TATTGCAGTT 
CGCGCTCTTG TGAATGCAAA GGGAGCAGAT CATACCGTTC TCATTACCGA TTGCATGCGC 
GCAGGCGGTA TGCCTAATGG TCAGTACAAT CTTGGTGATT TCCCCGTTGT TGTTGAAGGT 
GGGACTGCTC GCCTGATGGA TGACTCTCAC AGTCTTGCTG GCTCAATCCT TCGTCTGTTT 
GAAGGCGTAA AGAACGTCTA TGACTGGGGA GTTGTATCTG CTGAAGAGGC AGTTCGCATG 
GCTTCAGAAA ACCCAGCTCG CTCCTGTGGA ATTGATGATG TTTGCGGCTT TATTCGTCCT 
GGATACGATG CAGACTTTAT TGTTATTACT AAGAATCTTC AACTTGAAGA GACGTTCCTT 
GGTGGAAAGA GTGTCTACAA GGCTTAA

Protein sequence

MSTFAVKADK FFLPGATSGP GYLLVEDGIF GHFTKEKPEC EIIDRTGSWV APGLVDTHIH 
GFLDHDIMDC DPDGVIEIAQ GLLSNGVTSW LPTTLTASVE QTGDACESVA DAAEGIAANG 
IDAARIQGIF LEGPFFTEKH KGAQNPAYFL DPDVDVFDEW QERADGWIAK IAIAPERDGA 
PEFCAEMADR GVHVALGHSD ATFEEALACV NAGADIFVHT YNGMSGLHHR EPGMVGAAMT 
THGTYAEAIC DGHHLNPIAV RALVNAKGAD HTVLITDCMR AGGMPNGQYN LGDFPVVVEG 
GTARLMDDSH SLAGSILRLF EGVKNVYDWG VVSAEEAVRM ASENPARSCG IDDVCGFIRP 
GYDADFIVIT KNLQLEETFL GGKSVYKA