Gene Nmul_A2434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2434
Symbol
ID	3784129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2775715
End bp	2777226
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	48%
IMG OID	637812524
Product	glycosyl transferase, group 1
Protein accession	YP_413115
Protein GI	82703549
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGAAGC AACAGAAAGA TGCTGATATC ACGCTCTTGC TGGAAGGCAC CTATCCTTTT 
ATCAGGGGTG GGGTTTCGGG CTGGGTGCAC CAGATTATCG CAGAGTTGCC GCAGTACACA 
TTTTCTTTAG TTTTTCTGGG ATCCAGGAAG AGTGATTATG GCGAACTGAA ATATGTTCTG 
CCCGATAATG TCGTTCATCT GGAATGCCAC TATCTGTGGG AGCGTCTTTC TTTATCTAAA 
GCCAAGGGCT GCAAAGGTAA TAATGACTAC ATTCTGCGTT CAGGAAAGCT CCATGAGTGG 
TTCCGGAATC CATGCTCGGG TTTCGATGAG GTTGTCCTAA AGAACCTTTT GGTTTCTTTG 
GGGCAGCCGT CCGGCTTCAC TGCAGAGGAG TTTTTCCATA GTGATGCGTC CTGGCAGCAC 
ATTTGTGAGT ATTACGACAA ATATAACGCA GGGAATTCAT TCATTCATTA CCTGTGGGCA 
ATCAAAGCGA CTCACGCTCC ACTGTTTATG CTTGCCTCGG TGGCTAATCA GTTTTCTGTT 
GAGACGAAAG CATTTCATAC CGTTTCGACC GGCTTTGCAG GTTTTCTTGG CATATTACTG 
CATTACAGAA CGGGGCGGCC GCTTATTTTG ACGGAGCATG GCATCTATAC GAAGGAAAGA 
AAGGTGGACT TGCAGTCCCT TTTCATTAAA GAACATCGTG ATTCGTTAAG CGATGCTCTT 
TATATGGGAA TGCAATATCA GGAATTATTA TGGATAAGAT ATTTTGAATC ACTTGGGCGC 
CTTATTTATC AAGCCTCAAA TCCGATCATT AGCCTTTATG AAAATAATAG GAGGCGCCAA 
ATTGCCGATG GTGCGGATGG TGACCGCACT CAGGTTATCC CTAACGGAAT GGAAATGCAG 
CGTTTTCTTC CTATACGTGC GGAACGGCCA GAAAAGATTC CACTCGTGGT CGGATTGCTT 
GGAAGGATAG TGCCGATAAA GGATATTAAA ACCTTTATTA GAGCCATGAG TACGGTTGTG 
CTTCAACTTC CTGAAGCTCA AGGCTGGCTG ATCGGACCTG AAGAGGAAGA TCAGGAATAT 
GTGGCGGAAT GCAGAAGTCT GATTCAGGAG CTGGGACTGG AAGGAAAAGT ACGTTTTCTG 
GGGTTCCAGC AAATCAGCAA CGTGCTCCCT CGTCTAGGGT TGCTTGTACT GACGTCGATC 
AGCGAAGCCT TTCCTTTGGT GCTGCTCGAA GCTTTTGGCA GCGGTTTGCC GGTCGTGACG 
ACCGATGTGG GTGCGTGTCG GGAAATCATC GAGGGGGCCA GCGACGAGGA CCGTGCTTTG 
GGATGCGCAG GTATTGTAAC GCCCATCGCG GATCCGGAAG CCACCGCTGC TGCTGTGATT 
ACATTGCTGA CAGACGGGGA ACGTTGGCAT GCAGCACAGA AAGCGGGTAT TCAGCGATTT 
GAAAAATATT ATACGCAATC CAGAATGCTC GACAGCTATA AGAAGATTTA TGACCAAGCG 
ATAGCACAAT AA

Protein sequence

MQKQQKDADI TLLLEGTYPF IRGGVSGWVH QIIAELPQYT FSLVFLGSRK SDYGELKYVL 
PDNVVHLECH YLWERLSLSK AKGCKGNNDY ILRSGKLHEW FRNPCSGFDE VVLKNLLVSL 
GQPSGFTAEE FFHSDASWQH ICEYYDKYNA GNSFIHYLWA IKATHAPLFM LASVANQFSV 
ETKAFHTVST GFAGFLGILL HYRTGRPLIL TEHGIYTKER KVDLQSLFIK EHRDSLSDAL 
YMGMQYQELL WIRYFESLGR LIYQASNPII SLYENNRRRQ IADGADGDRT QVIPNGMEMQ 
RFLPIRAERP EKIPLVVGLL GRIVPIKDIK TFIRAMSTVV LQLPEAQGWL IGPEEEDQEY 
VAECRSLIQE LGLEGKVRFL GFQQISNVLP RLGLLVLTSI SEAFPLVLLE AFGSGLPVVT 
TDVGACREII EGASDEDRAL GCAGIVTPIA DPEATAAAVI TLLTDGERWH AAQKAGIQRF 
EKYYTQSRML DSYKKIYDQA IAQ