Gene YpAngola_A3370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3370
Symbol
ID	5801847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	3587694
End bp	3588860
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	57%
IMG OID	641341191
Product	putative N-acetylgalactosamine-6-phosphate deacetylase
Protein accession	YP_001607713
Protein GI	162420948
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.639781
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACTG CCTATCTCGC TGATCGCACT TTTACTCCGC AAGGCATTGA AACCGGCGTC 
GCGGTTATCG TCGAGCAAGG CGAGATTGTG GCAGTAACAC GCGAGCTGCC AGCGGATGCA 
GAAATTGTGC ATCTGACAGG GAAAACCCTG ATCCCAGGTC TGATCGACAT TCATATTCAT 
GGTCGCCAGG GGGCGGATGT CATGGATGCC TCTGCGGAGG CATTACGCAC CATTGCCCGT 
GCCCTACCCC AAACCGGGGT TGTTGCCTGG GTCGGCACCA CCGTCAGTGC GCCGATACAG 
GATATCTTTG CGGCTCTGGC GCAGGTGCGT GATTTTATTG CAGACCCGGA TAACGCACGT 
GATACCCGCA CCGCAACCCT GCTCGGCAGT TTTCTGGAGG GGCCATATTT CACCGCGCCT 
TTCCGGGGTT CACACCCAGA AAAGTATCTG ACGACACCAA CACCACAAGA GCTGGAGCAA 
TTACGGCATT CGGCGGGTAA CACCTTGTTG CGTGCAGCTA TCGCACCTGA GTCACCCGAG 
GCTTTGGCCG CGATCCGCTG GCTGGTGAAT CACGGGATCA AAACCTCTGT GGCGCACACT 
GCGGCTAATT TTGAGCAAGT GACGGCGGCC TATCAGCAAG GTGCGGATTG CGGCGTACAT 
TTGTATAACG GCATGTCAGG GTTGCATCAC CGTGAACCGG GCTGCTGTGG TGCCGTGTTG 
TATCACGACA TGCTGGCAGA GCTGATTGCC GATGGCATTC ATGTGCATCC GGTGATGATG 
AATCTGGCGT ATCGCATGAA AGGTTATCGC CGCATTGCAC TGATCACCGA CTGCATGCGC 
GCAGGGGGGC TGGGTGAGGG GCGTTATTTA CTCGGCGCAC AGCATATCAC GGTACGTCAG 
GGGGAAGCGC GCACCGATGA TGGTTCACTG GCAGGCAGTA CTTGTAGCTT GGATCAGGCG 
CTGCGTAACA TGATCCAACA TGCGCAAGTC CCCGAGTGGG AAGCTGTACA AATGGCCAGC 
GCAGTACCCG CCGCTTATCT GGGATTAGCG TCAACACTGG GTTCGATCCA GATGGGTGCA 
CAAGCCAGCA TGGTGGTGAT GGAGAGTGAC TTTACCGTTG CCGCAACCCT GATTAAAGGT 
GAATGGGCTT ATCGCCACTC AGCCTAA

Protein sequence

MRTAYLADRT FTPQGIETGV AVIVEQGEIV AVTRELPADA EIVHLTGKTL IPGLIDIHIH 
GRQGADVMDA SAEALRTIAR ALPQTGVVAW VGTTVSAPIQ DIFAALAQVR DFIADPDNAR 
DTRTATLLGS FLEGPYFTAP FRGSHPEKYL TTPTPQELEQ LRHSAGNTLL RAAIAPESPE 
ALAAIRWLVN HGIKTSVAHT AANFEQVTAA YQQGADCGVH LYNGMSGLHH REPGCCGAVL 
YHDMLAELIA DGIHVHPVMM NLAYRMKGYR RIALITDCMR AGGLGEGRYL LGAQHITVRQ 
GEARTDDGSL AGSTCSLDQA LRNMIQHAQV PEWEAVQMAS AVPAAYLGLA STLGSIQMGA 
QASMVVMESD FTVAATLIKG EWAYRHSA