Gene Nmul_A0289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0289
Symbol
ID	3785535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	309931
End bp	311148
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	55%
IMG OID	637810365
Product	glycosyl transferase, group 1
Protein accession	YP_410989
Protein GI	82701423
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAATTC TGCATATCCT TGATCACTCC ATTCCCCTGC ACAGCGGCTA CACTTTCCGA 
ACGCTTTCGA TTCTGAATGA ACAACGGAAC CTGGGGTGGG AAACCTTTCA TCTGACCGGA 
TCGAAGCAGG AAAATTGCAG TGTGCTGGAA GAGTGCGTGG AAGGATGGCA TTTTTATCGT 
ACCCCAGCCC CGTCAGGACT GAGGGCACGG CTGCCCGTCT TGAATCAGCT GGCTGTCATG 
GAGGCTCTTA CCCATCGCCT GACTGAGGTG GTCAAGATTG TCGAACCGGA TATCCTGCAC 
GCGCATTCTC CAGTCCTGAA CGCTTTGCCT GCCTTGCGCG TGGGGCGGAG ATCGGGTATT 
CCTGTCGTCT ACGAAGTCCG GGCATTCTGG GAAGATGCGG CCGTAGATCA CGGCACTCAT 
CGCGAATGGG GCGCACGATA TCGTCTCACC CGTGAGCTGG AGAGTTACGC GTTAAGGCAT 
GTTGATGCAG TAACCACGAT TTGTGAGGGG CTGCGCGGCG ACATCCTCAA GCGGGGTATT 
CCGTCAGAAA AGGTAACTGT CATTCCCAAT GCGGTCAATC TCGAAACTTT CAGGATGAGC 
GAGCGCGGGG ATTTGCAACT TGCAAACGCA CTCGGGATGG AGGGCAAGGT GTTGCTCGGC 
TTCATCGGCT CGTTTTACGC GTATGAAGGA TTGACTGTAC TGCTCAACGC ACTGCCCCGT 
ATGTTAGCGG CAAATCCCGA CATCCGCATT CTTCTGGTGG GAGGAGGGCC TCAGGAAGAC 
GAATTAAAAT CTCTTACAGC CCGGAGGGGT CTGCAAGGCA AGGTTATTTT CACGGGCCGC 
GTTCCCCATG ATCAGGTTCG GCGCTATTAC AATCTGATCG ATATTCTCGT TTATCCGAGA 
TTGCCCATGC GCCTTACAGA CCTGGTCACG CCCCTCAAGC CGCTGGAGGC CATGGCGCAA 
GGAAGGCTCG TTGCCGCTTC AGATGTAGGC GGACATCTCG AGCTCATCCA GGATGGAAAA 
ACCGGAGTGC TTTTCAAGGC TGGCGATTCC GACGCCTTGG CAGCCCGGAT ATTGAATCTC 
ATATCCAGCA CCGATACCTG GGATACCCTT CGGGCCGGGG CGCGCGATTT TGTCGAAACC 
CAGCGCAACT GGGCTGGCAG CGTGGCCGGC TATAAGGAGA TCTATCGCAC TCTCCTTTCA 
AGGAAAGCAT CGTCATGA

Protein sequence

MRILHILDHS IPLHSGYTFR TLSILNEQRN LGWETFHLTG SKQENCSVLE ECVEGWHFYR 
TPAPSGLRAR LPVLNQLAVM EALTHRLTEV VKIVEPDILH AHSPVLNALP ALRVGRRSGI 
PVVYEVRAFW EDAAVDHGTH REWGARYRLT RELESYALRH VDAVTTICEG LRGDILKRGI 
PSEKVTVIPN AVNLETFRMS ERGDLQLANA LGMEGKVLLG FIGSFYAYEG LTVLLNALPR 
MLAANPDIRI LLVGGGPQED ELKSLTARRG LQGKVIFTGR VPHDQVRRYY NLIDILVYPR 
LPMRLTDLVT PLKPLEAMAQ GRLVAASDVG GHLELIQDGK TGVLFKAGDS DALAARILNL 
ISSTDTWDTL RAGARDFVET QRNWAGSVAG YKEIYRTLLS RKASS