Gene Aave_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aave_4039
Symbol
ID	4666108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax citrulli AAC00-1
Kingdom	Bacteria
Replicon accession	NC_008752
Strand	-
Start bp	4490447
End bp	4491871
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	73%
IMG OID	639825226
Product	UDP-N-acetylglucosamine pyrophosphorylase / glucosamine-1-phosphate N-acetyltransferase
Protein accession	YP_972354
Protein GI	120612676
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.723724
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCAC TGGACGTCAT CATCATGGCC GCGGGCAAAG GCACGCGCAT GAAAAGCCGC 
ATTCCCAAGG TCCTGCAGCG CCTGGCGGGG CGCCCGCTGC TGGGCCATGT GCTCGATCAG 
GCGCGCGGCC TGCAGGCCCG GCGTGCCGTG GTCGTGACGG GCCATGGCGC GGCCGAGGTG 
GAGCCTTTCA TCGCCCGCGC GGCGGACGGG CTGGACGTGC GCTGCGTGCG GCAGGAGCCG 
CAGCTGGGCA CCGGCCATGC CGTGCAGCAG GCGGTGCCGG CGCTGCAGGG CGACGGGACG 
GTGATCGTGC TGTCCGGCGA CGTGCCGCTC ACGCGCACGG ACACCCTCCG CGCGCTGGTG 
GCGGCGGGCG GAGGCGGGCA ACTGGCCCTG CTCACCGTGA CCCTGCCGGA CCCGGCGGGC 
TACGGGCGCA TCGTGCGCGG CAGCGACGGC GCGGTGCGCG GCATCGTCGA GCACAAGGAC 
GCCACCGAGG CGCAGCGCGC CATCGACGAG GTGTACAGCG GGATCATGGC CGTGCCCGCG 
GGGCTGCTGG CCGGCTGGCT GGCGCGGCTG ACCAACGACA ACGCCCAGGG CGAGTACTAC 
CTGACCGACA TCGTGGCCAT GGCCGTGGCC GACGGCGTGC CCGTGGTGGC GCACCGCATC 
GCCGACGCGC TGCAGGTGGC CGGCGTGAAC AGTCCGCTGC AACTGGCCGA GCTGGAGCGC 
GCCCACCAGC TCGCACAGGC GCGCGCGCTG ATGGAGCAGG GCGTGCGCCT GGCGGATCCC 
GCGCGCTTCG ACCTGCGCGA CGATGCGCGC ACCGGCGTGC GCGGCGAACT GGCCTGCGGG 
CAGGATGTGG AAATCGACGT GAACTGCATC TTCTCCGGCC GCGTGGAGCT GGGCGAGGGT 
GTGCGCATCG GCGCGCACTG CTGCATCGCC AACGCCCGCA TCGCCGCGGG CGCGGTGGTC 
CACCCCTACA CCCACATCGA CGGCGAGCAG CCGGCGGGCG TGCAGGTGGG CGAGGGGGCG 
CTGGTCGGAC CGTTCGCGCG GCTGCGGCCC GGCGCGCAGC TGGGGCGCGA GGTGCACATC 
GGCAACTTCG TGGAAGTGAA GAACTCGAGC CTGGCCGAGG GCGCCAAGGC CAACCACCTC 
GCCTACCTGG GCGACGCCAC GGTGGGCGAG CGCGTGAACT ATGGCGCCGG CAGCATCACC 
GCCAACTACG ACGGCGCGAA CAAGCACCGC ACGGTGATCG AGGCCGACGT GCACGTCGGC 
AGCAACTGCG TGCTGGTGGC GCCCGTGACC ATCGGTGCGG GCGGCACGGT GGGCGGTGGC 
TCCACCATCA CCAAGAGCAC GCCCGCGGGC GCCCTGAGCG TGGCCCGCGG CAAGCAGGTC 
ACCAAAGAAA ACTGGCAGCG GCCGGCCAAG CTGCCCAAGG CATGA

Protein sequence

MSALDVIIMA AGKGTRMKSR IPKVLQRLAG RPLLGHVLDQ ARGLQARRAV VVTGHGAAEV 
EPFIARAADG LDVRCVRQEP QLGTGHAVQQ AVPALQGDGT VIVLSGDVPL TRTDTLRALV 
AAGGGGQLAL LTVTLPDPAG YGRIVRGSDG AVRGIVEHKD ATEAQRAIDE VYSGIMAVPA 
GLLAGWLARL TNDNAQGEYY LTDIVAMAVA DGVPVVAHRI ADALQVAGVN SPLQLAELER 
AHQLAQARAL MEQGVRLADP ARFDLRDDAR TGVRGELACG QDVEIDVNCI FSGRVELGEG 
VRIGAHCCIA NARIAAGAVV HPYTHIDGEQ PAGVQVGEGA LVGPFARLRP GAQLGREVHI 
GNFVEVKNSS LAEGAKANHL AYLGDATVGE RVNYGAGSIT ANYDGANKHR TVIEADVHVG 
SNCVLVAPVT IGAGGTVGGG STITKSTPAG ALSVARGKQV TKENWQRPAK LPKA