Gene Nmul_A2400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2400
Symbol
ID	3786181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2735853
End bp	2737211
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	49%
IMG OID	637812489
Product	glycosyl transferase, group 1
Protein accession	YP_413081
Protein GI	82703515
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTAG CATTGTATGT TCACTGTTTC TTTCCGGGAC ATTATCATGG GACGGAAACT 
TATACGTTGG CTCTTGCGGA AAACCTGAAA AAGCTTGGCC ATGAACCCGT GGTAGTGAGC 
GCCATATTCG AGGGAGAAAA AAAAGCCAAA AGCCTTATCA CACGTTACGA CTACAACGGC 
ATCCCTGTCT ATTGCATAGA CAAGAATCAT ATCCCTCAAA TGAGTTTGAG GGATACGTAT 
TATCAACCCG AGCTGCGGCA CATCCACGCA AATCTGCTTC ACGAATTGCA GCCTGATATC 
GTTCATGTCA CTCATCTGCT TAACCATACG GCGATCCTGC TGGATGTGAT CAAGGATTTG 
GAGATACCCG CTGTCGCAAC TTTTACCGAT TTCTTTGGTT TTTGCATGAA CGTGAAATTG 
GAAGGGGCGA ATGGCGACTT GTGCAAAGGC CCTAACTCAG AACGAACGAA CTGCTTCACC 
TGTTGCGCCA AGGCCGGCAT CAAACGGGCA TATCCCGCAA TGAGTGAACA ACGCTTCAAT 
AAATTGGCTT CCCTGCTCCG GCTAGGCTGC ATTTCATTTA ATGCTGTACA TAGGCTGCCG 
GTACTAAGGC GCAGTCAATT ATCCAGCCAG CTAGAGGTGA TAAAGGTGCG CCCTGAGCTC 
TTGTCAGAAC GTTACAGTCT CTATCGGGCC GTCATTGCCC CCACGCGATT CCTGCAATCT 
GCTTATGAGG CCAACGGGTT TACCTCGGTT CCTATCCACA AAATTCACTT TGGCGTTGAT 
CTGGACCGGA AACCAAAGCC GGGGCGGTCG GGGTCAGCGC CTACCCGTTT TGGTTTTATT 
GGACAGATTG CGCCGCACAA GGGAACAGCT TTGCTGGTGG AAGCCTTCTG CCGGTTACCG 
GCAGGTCAAG GCGAACTACA TATTTATGGA TCAGAGAGCC AGCATCCTGC CTATTTCCAG 
GCTCTGAAGC AGCATTGCGC CGGTTTCGCG GTCTACTTTC ATGGCACTTT TCCAACTGGC 
CAAATAAGAC CTGTTCTGGA TGAAATGGAT TTTTTGGTCA TTCCTTCCAC GTGGTATGAA 
AATAGCCCGC TCGTACTGCT CAACGCGCTT GCCAGCCATA CCCCAGTGAT CGTATCCGAC 
GTCGAAGGCC TGACGGAGTT TTTGCAACCG GATGTAAACG GCTACAAGTT TGCTCGGGGC 
GATGTGGATG ACCTGGAGCG AGTGATGCTC CAGGTCATCA CCAGCAAAGA AAATATGCAC 
AGGCTCATCC ATTCCACCAA TTATCCAAAG ACCAGCATGA GCATGACAGA AGAGGTTCTG 
GAAGTTTATT CTTCGATCCT AAAAGAGAAG ATTGCATGA

Protein sequence

MKVALYVHCF FPGHYHGTET YTLALAENLK KLGHEPVVVS AIFEGEKKAK SLITRYDYNG 
IPVYCIDKNH IPQMSLRDTY YQPELRHIHA NLLHELQPDI VHVTHLLNHT AILLDVIKDL 
EIPAVATFTD FFGFCMNVKL EGANGDLCKG PNSERTNCFT CCAKAGIKRA YPAMSEQRFN 
KLASLLRLGC ISFNAVHRLP VLRRSQLSSQ LEVIKVRPEL LSERYSLYRA VIAPTRFLQS 
AYEANGFTSV PIHKIHFGVD LDRKPKPGRS GSAPTRFGFI GQIAPHKGTA LLVEAFCRLP 
AGQGELHIYG SESQHPAYFQ ALKQHCAGFA VYFHGTFPTG QIRPVLDEMD FLVIPSTWYE 
NSPLVLLNAL ASHTPVIVSD VEGLTEFLQP DVNGYKFARG DVDDLERVML QVITSKENMH 
RLIHSTNYPK TSMSMTEEVL EVYSSILKEK IA