Gene Nmul_A0290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0290
Symbol
ID	3785536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	311145
End bp	312257
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	58%
IMG OID	637810366
Product	glycosyl transferase, group 1
Protein accession	YP_410990
Protein GI	82701424
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCTG GCTTGCGCAT TGGATTGGTC GGGCCTCTGC CTCCTCCTTC AGGGGGAATG 
GCCAACCAGA CGTTGCAGTT GGCAGGACTC CTGCGAGAAG AGCATGTTGA GGTGGAGCTG 
ATTCAGGTCA ATCGTCCCTA CCGGCCTGGC TGGATTGGAA GATTCAAGGG GATCAGGGCG 
GGCTTCCGCC TGCTGTCCTA TGTCAGCCAA CTGTGGCTTT CCGCCGGCAG AGTTCAATTA 
TTTCACGTGA TGGCCAATTC CGGCTGGTCG TGGCACTTGT TTGCTGCTCC CGCCATCTGG 
ATTGCACGGC TCAGGGGTAA GCCGGTGATT ATCAATTATC GGGGAGGCGA GGCGGACTCC 
TTCTTTGATA AAGCCTTTTC GTGGGTAAAG CCGAGCTTGT CAAGAGCAAA TGCAATTATC 
GTTCCTTCCG GGTTTCTGGA AGGGGTTTTC GGCAAACGCG GCTTTTCGGC CAGTATCGTT 
CCCAATATCA TCGACCTGAG CCGCTTCGGA GCAGGAATGC GGTCCGATAC CTCCACGGTG 
GAAGCCGGAC CTGACTCTCC CCATATCATC GTCACCCGCA ATCTGGAGCC GATTTACGAC 
AATGAGACTG CACTGCGCGC CTTTCACATC GTAAGACGCT CCTTCCCCGC TGCGAAGCTC 
ACCTTGGCCG GATCCGGCCC GGAGCGGCAC ACGTTGGAGC AACTTGCCTT CGCATTGGGC 
ATAGGGGGGG CCGTGACATT CACCGGGCGC GTGGACAACG AAGGCATGGC TGCAATCTAT 
CGCAGCGCGA GTGTGATGCT CAATCCGAGC CTCGCCGATA ATATGCCTAT ATCGATACTT 
GAAGCTTTGG CAAGCGGCGT CCCGGTGGTG AGTACGAACG TGGGGGGTGT CCCCTATCTC 
GTTGAGCATG AAAAGAACGC CTTGCTCGTA CCCGCGCGCG ACCCCCAGGC GATGGCCAAT 
GCAGTTCTGC GGCTGCTCAA TGATGCAGCC AGGACCCGGC GTCTGATCGA GGCGGGTATG 
GAATGCGTGC AGCGCTACAC CTGGCCGAAC GTGCGCGTCC CCCTGTTCCG TGTCTATGAG 
CAGGTTCTTG CCGCACCAGA CAGATCCTGT TGA

Protein sequence

MKAGLRIGLV GPLPPPSGGM ANQTLQLAGL LREEHVEVEL IQVNRPYRPG WIGRFKGIRA 
GFRLLSYVSQ LWLSAGRVQL FHVMANSGWS WHLFAAPAIW IARLRGKPVI INYRGGEADS 
FFDKAFSWVK PSLSRANAII VPSGFLEGVF GKRGFSASIV PNIIDLSRFG AGMRSDTSTV 
EAGPDSPHII VTRNLEPIYD NETALRAFHI VRRSFPAAKL TLAGSGPERH TLEQLAFALG 
IGGAVTFTGR VDNEGMAAIY RSASVMLNPS LADNMPISIL EALASGVPVV STNVGGVPYL 
VEHEKNALLV PARDPQAMAN AVLRLLNDAA RTRRLIEAGM ECVQRYTWPN VRVPLFRVYE 
QVLAAPDRSC