Gene Nmul_A1544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1544
Symbol
ID	3785617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1765715
End bp	1766878
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	48%
IMG OID	637811632
Product	acyltransferase 3
Protein accession	YP_412239
Protein GI	82702673
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3594] Fucose 4-O-acetylase and related acetyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTACC CCGCCCTGCC GGAACTATTT CCCACCGATG CACATTATTC CAGACGGCTA 
TTTGTTATGA CGACCCGCAA TAGCACAATC GACGTGGCAA AAGGAATCGG CATATTTTTT 
GTCGTACTCG GACATAATTG GCTGTCAACC CATGAGAAAA ACGAACTCCA TATAGTTATT 
TTCTCATTTC ACATGCCTTT GTTTTTCTTC CTGGCAGGAA TATTCTTGAG AGCACCGGAC 
GGAATCCTGC GTTTCGCAAT AGGCCGGGCA GGATCCTTAC TGAAACCCTA TTTCGTTGTC 
CTGACAGCCC TGGGTGTACT CAAGATGCTG AGGGCCGAAC TAGGTGGAGG CGGCGAAGCT 
GGGATGAGCG GCATCAGTTA TTTTATAGGC CTGCTTTATG GGACCGGGGA TACGATCGAG 
TGGATTGCCC TATGGTTTTT ACCGCATCTT TTTATTTCGT TGATCGCATC CCTCATCATT 
TTGAGGACAA TTGAAGCCTG CACGGACAAC AAGGTATGGA TAGTGTCAGT TGCTCTTCTG 
CTCTTAGGGG TGGGCATAAG TTCTATCGAT GCCTATCATC ACCCTACGGC AATAGCCGCC 
AGCCTTATGG GACCAGGACG ATTCCTGGGA CTTCCCTGGG GCGCCGATCT TATTCCGATA 
ACATCTTCCT TCATTATCTT CGGATATCTG CTCGCCGAGC CCGCGAAATC GATGAAATTC 
AGCTTGCCCG GCTTATTTAT ATCTGCTGGG GTGTTTGTTG CTCTGCACTT TTATTTTGAT 
GACACCATTG ATCTTAATGA AAGGGTATAC GATAGTGCGA TTGTATCGAC CATGGAGGCG 
GCGACAGGAA TATATATAAC GTTCAGTATC GCTTCCTTAC TGCAAAATTT TTCATTCTTC 
AGAAAACCGC TGGCATATCT GGGATCGGGG ACACTTTTTA TCCTGATCTT TCATGGCTTC 
CTGCAAACCC GGGCGTTTGT CGCGCTGCGC CATATCAGTC CTTATATGTA TCTAAACAGC 
ATTGTGAGTC TTGCATGGAG TATCGGGATG TCTTTGCTCC TGTGGGAGAT GGCGAAGCGC 
CAGCGATGGT TGTCAAAGTT GCTGTTACCA CAAAAACCGC GAAAGGCAAT TGTTCACGAC 
GAATTGGGCG GGAGTGCCGG CTAA

Protein sequence

MRYPALPELF PTDAHYSRRL FVMTTRNSTI DVAKGIGIFF VVLGHNWLST HEKNELHIVI 
FSFHMPLFFF LAGIFLRAPD GILRFAIGRA GSLLKPYFVV LTALGVLKML RAELGGGGEA 
GMSGISYFIG LLYGTGDTIE WIALWFLPHL FISLIASLII LRTIEACTDN KVWIVSVALL 
LLGVGISSID AYHHPTAIAA SLMGPGRFLG LPWGADLIPI TSSFIIFGYL LAEPAKSMKF 
SLPGLFISAG VFVALHFYFD DTIDLNERVY DSAIVSTMEA ATGIYITFSI ASLLQNFSFF 
RKPLAYLGSG TLFILIFHGF LQTRAFVALR HISPYMYLNS IVSLAWSIGM SLLLWEMAKR 
QRWLSKLLLP QKPRKAIVHD ELGGSAG