Gene Nmul_A0253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0253
Symbol
ID	3785739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	273034
End bp	274110
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	49%
IMG OID	637810328
Product	glycosyl transferase, group 1
Protein accession	YP_410953
Protein GI	82701387
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGGAA CGGACTCAAC TGGCAGGGGA GGTATAGCAT CTGTCGTTAC CTTACTGCAG 
GAAGAGGGCT TTCTCGATCA GCAAAATGTC AAATACATTA CTTCACACCG GGAGGGAACA 
CACTTTAAAA AGTTAGCAAT CATGTTTTCC GCTACTGGCA AAGTGCTGTG GTATTGCATG 
TTTGCCAAAC CAGCCATCGT TCACGTCCAC TCGGCCTCAG GTGCAAGTTT TATCAGAAAA 
TCGATTTTTC TTGCTGTCGC CAGATTGTTC CGCTGCCAGA CAGTTTTTCA TTTGCACGGA 
GGTCGGTTTC CTCATTTTGC TTCAGAGGAA TCGGGAGTAC TGCTGAAATG GTGGATTCGG 
CGGACTCTTG AGAGGAGTTC CACAGTTATT GCATTATCAG AAAGCTGGGC AGCTTTTCTC 
TCAACCTGCG CCCCTGCGGC CGCTATCCAG ATTGTTCCCA ATTCTGTCAG GCTTGCTAAG 
ATATCTTCAA AACAGAGGGG GGAGGCCGGG CGGATACTGT TCTTGGGGCA CGTGGGAAAG 
GGGAAAGGAA TATTCGAACT GTTAAAGGCT TTATCCCTAC TGAAGGATTC ACTGCCGTAT 
ATCAGGTTAG TTGTTTGCGG AGATGGATGC CTTGATTCTG TGCAAAAGAT GGCAGATGAA 
CTGGGCATTG CCTCCAATGT GGAGTTTCGT GGCTGGGTGG ATGCAAGTCA AAAAGCGGAA 
GAACTCGCTC GTGCATCGGT TTTCGTGCTT CCCTCTCATG ATGAAGGTCT GCCAATGGCT 
ATGCTTGAAG CAATGGCGGC TGAACGGGCG ATTATTGTAA CTCCCGTGGG GGGGATACCA 
GAAGTGATCA GGGATAGAGA AAATGGCTTA CTCGTTCCGC CCCGAGATGC CGATGCTCTG 
GCACAGGCTT TAAAGGAGGT ACTGGAAAAC CCTCTTCTCC GCCAGATGCT GGCAGAAAAT 
GCGCTTAGAA CGATTGAAAG CCGGTTTAGC ACTCCTGTTA TCCTGGGTCA ACTTTCTCTA 
CTTTATGAGC GGTTACGAGG AGGCAGCAGG GGGGAAGTAG TTGCATTCAT AAAATGA

Protein sequence

MLGTDSTGRG GIASVVTLLQ EEGFLDQQNV KYITSHREGT HFKKLAIMFS ATGKVLWYCM 
FAKPAIVHVH SASGASFIRK SIFLAVARLF RCQTVFHLHG GRFPHFASEE SGVLLKWWIR 
RTLERSSTVI ALSESWAAFL STCAPAAAIQ IVPNSVRLAK ISSKQRGEAG RILFLGHVGK 
GKGIFELLKA LSLLKDSLPY IRLVVCGDGC LDSVQKMADE LGIASNVEFR GWVDASQKAE 
ELARASVFVL PSHDEGLPMA MLEAMAAERA IIVTPVGGIP EVIRDRENGL LVPPRDADAL 
AQALKEVLEN PLLRQMLAEN ALRTIESRFS TPVILGQLSL LYERLRGGSR GEVVAFIK