Gene Acid345_2780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2780
Symbol
ID	4072403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3293229
End bp	3294398
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	61%
IMG OID	637984798
Product	N-acetylglucosamine 6-phosphate deacetylase
Protein accession	YP_591855
Protein GI	94969807
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.382216
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACTG CCCTCCTCGC TCGCGAGATC CTGACGCCGC TCGATCGCAT TCATAACGGC 
ATCCTCATCT TCGAAGACGG CTGCATTCTG GAAGTCGGCA ATCGCGATTG CATCGAGGTC 
CCCCGCGCCT GCCGCACCAT CGATCTGGGC GACGCAATCC TCACTCCCGG ATTCATTGAT 
CTTCACATCC ACGGCGGTGC CGGGCACGAC GTGATGGAAG GCGACGATGC CGCACTCGAA 
GCCGTCGAAC TTCTCATCGC GAAGCACGGC GTCACCAGCT ACTGCCCAAC CACGGTTACG 
GCAGCAACCG ACGTGACCCT CGTTTCACTC AATAAAATCG GGCACTTCAT CGAGCGCATG 
GCTTCGCACG GTCCCGCCAA CAACGGACGC GCGCGCCCCC TCGGCGTGCA CCTCGAAGGC 
CCCTTCCTCG CCGAGTCGCG ACGCGGCGTG CATCCGCCGA ACCATCTGCA AGCGCCGTCC 
ATCAAGCTCT TTCACGAGAT GTGGCAAGCC GCCATCGGCC GCGTGAAAGT GCTGACCATC 
GCACCGGAAT TACCAGGCGC CATCGAGTTG ATTCACGAAG CACGCAAGCG CGGCGTAGTG 
GTGAGCCTCG GTCATTCCAA CGCCGATCTC TGCGAAGCCA AGCGCGGCAT CAGCGCCGGC 
GGACATCACG CGACGCACAC CTTCAACGCC ATGCGCCCAC TCCAGCACCG CGACGCCGGC 
CTACTCGGCG CCATCCTCAC CCAGCAATGC GTCACCGCCG ACATCATCGT CGATGGCATT 
CACGTGGATC CCACGGTAGT GAAGTTGTTC CTGCGCGCGA AGGGTGTGGA GGGCGCAGTG 
CTCATCACCG ATGCAACCAG TGCGACCGGC ATGCCCGATG GTACGTATCA CCTTGGCAAT 
ATCGAAGTGG AAGTGAAGGA CGGGCAGTGC ATCTCGCAAG GCAAACTTGC CGGCAGTGTT 
CTCACACTCG ATCGCGCCGT GCGCAACGTG ATGGACTTCG CCGGTTGGAC GCTGCAGAAT 
TCAGTACGCC TCGCGACCTA CAATCCCGCC CGCGTGCTCG GCGTGGAAAA CAGCAAAGGC 
GTTTTAAAAG CCGGCGCCGA CGCCGACATC CTGGTGATGA ACGCCGCTGG CGAAATCCGA 
AATACGATCA TCGGTGGTAT TGGGATCTAG

Protein sequence

MKTALLAREI LTPLDRIHNG ILIFEDGCIL EVGNRDCIEV PRACRTIDLG DAILTPGFID 
LHIHGGAGHD VMEGDDAALE AVELLIAKHG VTSYCPTTVT AATDVTLVSL NKIGHFIERM 
ASHGPANNGR ARPLGVHLEG PFLAESRRGV HPPNHLQAPS IKLFHEMWQA AIGRVKVLTI 
APELPGAIEL IHEARKRGVV VSLGHSNADL CEAKRGISAG GHHATHTFNA MRPLQHRDAG 
LLGAILTQQC VTADIIVDGI HVDPTVVKLF LRAKGVEGAV LITDATSATG MPDGTYHLGN 
IEVEVKDGQC ISQGKLAGSV LTLDRAVRNV MDFAGWTLQN SVRLATYNPA RVLGVENSKG 
VLKAGADADI LVMNAAGEIR NTIIGGIGI