Gene YpAngola_A0336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A0336
Symbol	nagC
ID	5798800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	349747
End bp	350973
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	50%
IMG OID	641338344
Product	N-acetylglucosamine repressor
Protein accession	YP_001604944
Protein GI	162421808
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0129193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG GCGGACAAGC ACAAATTGGT AACGTGGATC TGGTAAAACA ACTCAATGGA 
GCCGTGGTTT ACCGGCTAAT TGATCAGCAA GGCCCGATTT CTCGCATACA GATTGCCGAT 
CTCAGCCAGC TAGCCCCCGC CAGTGTCACC AAAATCACCC GGCAATTGTT GGAGCGCGGG 
CTGATCAAAG AGGTCGATCA GCAAGCCTCC ACCGGGGGGC GTCGCGCTAT CTCTATCGTG 
ACGGAAAACC GCCAATTCCA TACCGTTGCA GTCCGTTTAG GTCGTAATGA TGCCACGATC 
ACCCTCTTTG ACATGAGCGG TAAATCGCTG GGTGAAGAGC ACTATGCCCT GCCAGAACGA 
ACACAAGAAA CGCTGGAACA CGCCTTATTT AATATCATCA GTCAGTTTAT TGACGCCTAT 
CAGCGTAAAT TACGTGAACT GATTGCCATC GCGGTTATCC TGCCTGGGCT GGTTGAGCAA 
AGCAAAGGTA TCGTGCGCTA TATGCCGCAT ATCAGTGTCA GTAACTGGCC GTTAGTCGAT 
AATCTACAAG CGCGCTTTAA CGTCACCAGT TTTGTGGGTC ACGATATCCG CAGCCTGGCA 
CTGGCCGAGC ACTATTTTGG TGCAACCCGT GACTGTGAAG ACTCCATTTT GGTTCGTCTA 
CATCGAGGCA CGGGTGCCGG TATTATCGTT AACAGCCAAA TATTTTTAGG CAGCAACGGC 
AACGTTGGCG AGATAGGCCA TATTCAGATT GATCCATTAG GTGATCGCTG CTATTGCGGT 
AACTTTGGTT GTCTGGAAAC CGTGGCATCC AACGCCGCGA TTGAAAACCG CGTCAAGCAC 
CTTCTCACCC AGGGTTATCC AAGTAAGCTG TCTCTTGATG ACTGCCATAT TGGTGCTATC 
TGTAAGGCCG CAAACCGCGG TGACTTGCTG GCCTGCGAAG TGATTGAACA TGTTGGTCGC 
TACTTGGGGA AAGCCATTGC TATCACCATA AACTTATTCA ACCCACAAAA AGTGGTGATT 
GCCGGTGAAA TTATTGAAGC CGAGAAAATC CTACTACCCG CCATTCAGGG TTGCATTAAT 
ACGCAAGTTT TGAAAAACTT CCGCCAAAAC CTGCCGATAG TGACATCACA ACTTAACCAC 
CAGTCGGCTA TCGGCGCTTT CGCACTGGCT AAGCGCGCTA TGCTCAATGG TGTCTTGCTG 
CAACGTTTGC TAGAAACTCA CCCGTAG

Protein sequence

MSTGGQAQIG NVDLVKQLNG AVVYRLIDQQ GPISRIQIAD LSQLAPASVT KITRQLLERG 
LIKEVDQQAS TGGRRAISIV TENRQFHTVA VRLGRNDATI TLFDMSGKSL GEEHYALPER 
TQETLEHALF NIISQFIDAY QRKLRELIAI AVILPGLVEQ SKGIVRYMPH ISVSNWPLVD 
NLQARFNVTS FVGHDIRSLA LAEHYFGATR DCEDSILVRL HRGTGAGIIV NSQIFLGSNG 
NVGEIGHIQI DPLGDRCYCG NFGCLETVAS NAAIENRVKH LLTQGYPSKL SLDDCHIGAI 
CKAANRGDLL ACEVIEHVGR YLGKAIAITI NLFNPQKVVI AGEIIEAEKI LLPAIQGCIN 
TQVLKNFRQN LPIVTSQLNH QSAIGAFALA KRAMLNGVLL QRLLETHP