Gene Nmul_A1781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1781
Symbol
ID	3784359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2034134
End bp	2035276
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	58%
IMG OID	637811867
Product	glycosyl transferase family protein
Protein accession	YP_412470
Protein GI	82702904
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCAGCAC GTAATTTCCC CCCCGTTCTC CCTTTCTCAC CCCGCAAAAT CGCGGTTCTC 
CATGCCAAGG CGGTGGGTGA CTTTATCGTC ATCCTGCCCG CCCTGGATGC GATTAAACGG 
ACATATCCCG AGGCAGAACT CATCCTGCTC GCCAAGCCGT GGGTAAAGGA ATTCTTCTCC 
GGCCGCCCGT CGCCGGTTGA CCGTGTTCTC AGCCTTCCCC CACTTGCCGG TGTCAATGAT 
CCGGTTGAGT CCAAAGGCCG CGTTCCCTCC ACAGGCAGCG GTGTCTACCC TGTCGAAGTA 
GAACTGTTCT GCCAAGCGAT GCAAGGCGAG AAGCTCGATG TCGTCATTCA TATGCAAGGG 
GATGGTAAAT CCGTCAATCC CTTCATCAAT AAATTTGCCG CCCGCGTGAC GGCAGGCATG 
TGCAACCCGC CTGCCGAATC CCTCGACCGT TCCATTCCCT ATGTGCATTA CCAGAGCGAG 
GTTCTGCGCA ATCTCGAAGT GGCCTCCTTA ATTGGCGCTC GTACCACGAG TACCGGATTC 
GAACCGCGCA TCGAGGTGAC GGAATCCGAC GAACAGGAGA CAGAATCGGT CCGCCAGACG 
ATCAAGGGCA AACCCTATGT CGTTATCCAC CCGGGCGCGG ATGATATCCG CAGGGTATGG 
CCTGCAGTCA GGTTTGCCGA GGCCGCAGAT TGCCTGCTCG AAAAAGGATA TGCAGTTGTC 
GTGACAGGAA CGCCGAAAGA AGAAGAGCGC GTGGCGACTG TCATTCGGGC CATGAGTCGG 
CCTGCGATTC CCTGTACCCG ACTTGGCCTG TGCGGTCTGG CTGCCCTCTT ACAGCATAGC 
GCGCTCGTCA TCAGCAACGA TACCGGCCCG CTCCATCTGG CACGCGCGGT GGGCGCACGT 
ACAGTGGGAA TTTACTGGGC CCCCAACATC CTCAACTGGG GTCCGCTCAG CCGCGACCGG 
CACCGGCTCG CGATCGGTTG GCAGCTTGAA TGTCCCCAAT GCGGCATCAG GCCTGTTTCG 
CCCTGGCCGT TTCAGCCGCA GACATCCGAC TGCAGTCATC CGTACTCATT CGTGGAAAGT 
GTACCGGTTG CAGAGGTTCT TGCATTGGCC ACTGAATTAT TGGGCCTGAC GACTGAGCAT 
TGA

Protein sequence

MAARNFPPVL PFSPRKIAVL HAKAVGDFIV ILPALDAIKR TYPEAELILL AKPWVKEFFS 
GRPSPVDRVL SLPPLAGVND PVESKGRVPS TGSGVYPVEV ELFCQAMQGE KLDVVIHMQG 
DGKSVNPFIN KFAARVTAGM CNPPAESLDR SIPYVHYQSE VLRNLEVASL IGARTTSTGF 
EPRIEVTESD EQETESVRQT IKGKPYVVIH PGADDIRRVW PAVRFAEAAD CLLEKGYAVV 
VTGTPKEEER VATVIRAMSR PAIPCTRLGL CGLAALLQHS ALVISNDTGP LHLARAVGAR 
TVGIYWAPNI LNWGPLSRDR HRLAIGWQLE CPQCGIRPVS PWPFQPQTSD CSHPYSFVES 
VPVAEVLALA TELLGLTTEH