Gene Apar_0343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0343
Symbol
ID	8413191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	391957
End bp	393345
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	51%
IMG OID	645021910
Product	UDP-N-acetylglucosamine pyrophosphorylase
Protein accession	YP_003179365
Protein GI	257784148
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTTA CTGCGATTGT CCTCGCCGCA GGCGAGGGAA CGCGCATGAA GTCCCACCAC 
CCTAAGATTG TGCACAAATT ACTAGATAAA CCTATTGTTT GGTGGAGTGT CAACGCCGCA 
ATTACTGCTG GCGCTGACCG CGTCATTGTA GTTGTTGGTA ACCACGCCGA CGAGGTTAAA 
TCTGCACTTT CTTGCTTCCC TAACCTTGAG TATGTTGCCC AGACCGAGCG TCTTGGTACT 
GGCCACGCAG TCAAGGTTGT AAAGGATGCT CTTGGTGGCT TCAAGGGACC CGTTGTTGTC 
ATTAATGGTG ACGCATCTTT GTTGCGCGCA CAGTCTATTC TCGACCTTGT CGCAGAAACT 
AAAGCTCATC ACAACGCGTG TACTGTACTT ACGATGACGC CGCCAGATCC AACTGGATAT 
GGTCGCGTTA TTTCTTCTAA CGGCCAGGTA ACTGCCATTA TTGAACATAA AGACGCTACA 
CCAGAGCAAC GCGAACAAGA ACGTGAATGC AACGTTGGTG TGTACTGCTT CTGTGGCGGA 
AGACTGACCG CAAACATCGA TCTTCTCGGC AACGATAACG TCCAAGGCGA GTACTACATC 
ACCGATATGG TGGGCCTCTA TGTAAGCCAA GGTGAGCCTG TTGCTGCCGT CCACGTTGAC 
GACTACAAAG AAGCGCTGGG AGTCAACTCC CGCTCCGAGC TTGCTGTTGC TACCCGTATC 
ATGCAGGAGC GCATCAACGA GCACTGGATG AGCCAAGGCG TCACCATGCT GGATCCAACC 
TCGGTTTGGA TTGGCCCCGA GGTCACGCTT GGCATGGATA CCGAGGTTCT CCCTCAGACC 
ATGCTCTATG GCAAAACCTC AATTGGCGAG AATTGCGTGA TAGGTCCTAA CACTCGTCTA 
ACCGATACCT GCGTTGGCAA CGACGCTATT GTCGACGAAA CTGTTGCCAT TAACGCACAA 
GTTGACGATT ACGCCACTTG TGGTCCTCGC GCTTATCTTC GTCCAGGTAC GCACCTTATG 
CCCCACGCTA AAGCCGGCAC ACATGTTGAA ATCAAAAACT CAACTATCGG CGAAGGCTCC 
AAGGTTCCTC ACCTCTCTTA CATTGGTGAT ACTACCATGG GCTCTGGCGT CAATATTGGT 
GCAGGCTCAA TTACGTGCAA TTACGATGGT TACCACAAGT TTAAGACCCA CATTGGCAAC 
AACGTCTTTG TTGGATCCGA TACCATGATG GTAGCACCTG TTTCAATTGG TGATGGCGCA 
CTTGTGGGGG CAAGTTCGTG CATTACAAAG GATGTACCAG CAGATGCGCT TGCACTCGAG 
CGCTCTGAGC AAAAAATTGT TGAGGGATAC GCCGCTCAGA GGCGTCACAA GCTTGAGAAA 
GAGGACTAG

Protein sequence

MPLTAIVLAA GEGTRMKSHH PKIVHKLLDK PIVWWSVNAA ITAGADRVIV VVGNHADEVK 
SALSCFPNLE YVAQTERLGT GHAVKVVKDA LGGFKGPVVV INGDASLLRA QSILDLVAET 
KAHHNACTVL TMTPPDPTGY GRVISSNGQV TAIIEHKDAT PEQREQEREC NVGVYCFCGG 
RLTANIDLLG NDNVQGEYYI TDMVGLYVSQ GEPVAAVHVD DYKEALGVNS RSELAVATRI 
MQERINEHWM SQGVTMLDPT SVWIGPEVTL GMDTEVLPQT MLYGKTSIGE NCVIGPNTRL 
TDTCVGNDAI VDETVAINAQ VDDYATCGPR AYLRPGTHLM PHAKAGTHVE IKNSTIGEGS 
KVPHLSYIGD TTMGSGVNIG AGSITCNYDG YHKFKTHIGN NVFVGSDTMM VAPVSIGDGA 
LVGASSCITK DVPADALALE RSEQKIVEGY AAQRRHKLEK ED