Gene Saro_3149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3149
Symbol
ID	3918191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3360447
End bp	3361565
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	67%
IMG OID	640445933
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_498418
Protein GI	87201161
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGAAGA CGATACTCGT GGTGTTCGGG ACGCGGCCCG AGGCGATCAA GCTGTTTCCG 
GTGGTGCACG CGCTGCGTGC CGATCCGCGC TTTCGCGTGG TGACCTGCGT TTCGGCGCAG 
CACCGGGGGA TGCTCGACCA GGTGCTGGAG ATCGCGGGGA TCGTGCCCGA CCACGATCTC 
GACCTGATGC GGCCGGACCA GACGCTCGAC GCGCTGACGG CGGCGCTTCT GACGGAACTG 
GGCAAGGTGA TGGATGCCGT GCGGCCCGAC TGGGTCGTGG TCCAGGGCGA TACGGCGACG 
GCGATGGCCG GGGCGCTGGC GGCTTATTAT CGCAAGCTTC CGGTCGCGCA TGTCGAGGCG 
GGCCTGCGCA GCCACAACAT CTATCACCCG TGGCCCGAGG AGGTGAACCG CAAGATTATC 
GGCACGATCG CGCGGCTGCA CTTCGCGCCG ACCGAGGTAT CGGCTGCCGC GCTCAGGGCG 
GAGAACGTGA CCGAGGGCGT TCACGTGACC GGCAACACGG TGATCGACGC CTTGCAGTGG 
GTTTCGGGCC GGATTGCGGC GGAGCCGGCG CTGGCGGCGG GGCTGGCCGA GATCGAGGCG 
CGCTTTGCCG GCAAGCGGAT CATCGGCGTA ACCAGCCACC GCCGCGAGAA TTTCGGCGGG 
GGGCTTGAGA ACATCGCCGA GGCGATCCGC CGCATCGCGC AGCGGGACGA CGTGGCGCTG 
GTCTTTCCGG TCCATCCCAA CCCCAACGTG CGCAAGGTGA TGGACGATGC GCTGGCGGGG 
CTGCCCAACG TCGCGATGAT CGAGCCGCTC GACTATCCGC ACTTCGCCCG GCTGTTGTCG 
ATCGCGGAAA TCATGCTGAC CGATTCGGGA GGGGTGCAGG AAGAGGCCCC CGCGCTCGGC 
AAGCCGGTGC TGGTCATGCG GGAGACGACC GAGCGCCCCG AGGGCGTGAC CGCCGGGACC 
GCGCGGCTGG TGGGGACCGA CGTGGACACC ATCGTTACCG AAATCTTCAC CCTGCTCGAC 
GATAAGGCTG CCTATTCGGC CATGGCGCGC GCTCACAATC CCTTCGGGGA TGGGCAATCT 
TCGCGCCGAA TCGTGGAGTT GCTGGCGAAT GATGGGTGA

Protein sequence

MVKTILVVFG TRPEAIKLFP VVHALRADPR FRVVTCVSAQ HRGMLDQVLE IAGIVPDHDL 
DLMRPDQTLD ALTAALLTEL GKVMDAVRPD WVVVQGDTAT AMAGALAAYY RKLPVAHVEA 
GLRSHNIYHP WPEEVNRKII GTIARLHFAP TEVSAAALRA ENVTEGVHVT GNTVIDALQW 
VSGRIAAEPA LAAGLAEIEA RFAGKRIIGV TSHRRENFGG GLENIAEAIR RIAQRDDVAL 
VFPVHPNPNV RKVMDDALAG LPNVAMIEPL DYPHFARLLS IAEIMLTDSG GVQEEAPALG 
KPVLVMRETT ERPEGVTAGT ARLVGTDVDT IVTEIFTLLD DKAAYSAMAR AHNPFGDGQS 
SRRIVELLAN DG