Gene Nmul_A0249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0249
Symbol
ID	3785735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	266239
End bp	267717
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	49%
IMG OID	637810324
Product	O-antigen polymerase
Protein accession	YP_410949
Protein GI	82701383
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGACAG TCATTATTCT TTCGATAGCT GTCTTTGTTT TTGCGCTTGG TTCAATCGTT 
GCAATGAGCG CTGTGGCAGG CGCAGCTTCC CGCTGGCCAG GTCAAATGTT CAGCTATCTG 
ATGTGGATGA TAGTGATGGC AGGTGTGGGC GGTATCCTCG TTTCAGGGCG TATTCTCAGA 
ATAGACGAAG AAGCTTTGGT TATGGGAGCA GTGGGCGAAG CTGGGGGCAC GATAATTGCC 
AAATTGCTCC TCTCCGCTGT AATCGGGGTT TCCCTCGCTT TATGCGTGAC ATGGATATTG 
TTGTCGAGCA AAAGGAAGGC AGGGGGTAAC CGTTTTGAAC AAAGGAGACT GAATTCGCCA 
AATGATATCG TGATTGCGTT TATGGTGTTC TATATCGCGT TCAGCATTCT GCCGCTCATC 
TTTGGAAAGA GCCATCAATT TCACGTATCA CTGTTTTATC CATTTTTCGT GTTTATCGCC 
TTATTTCTGT GGATGCGGTT GTCGAAGGTT GACCCGGTTA TCGTGGCGAA GCAGTGCCTG 
GGATTTATTG TATTGACTAG TTTGGTCATG GCCGTGCTAA TTCCCCAGCT GGCCGTTCAG 
CCCAGCTATG TAGGACTTAT CCCCGGATTC AATTCGCGAC TTTGGGGGTT AACGGCAGGA 
GCAAACTCTC TTGGATCAGT CGCTGGCACT CTTCTCGTGC TGGAGGCCGC CGAGCCATCC 
GCCAGGAGAT GGCTCGGCAA TGGAATTTTT TTCACTGCTG CCCTAGCCTT GGTTTTAACT 
CAATCCAAGA CCTCCATTCT GGCAGCGTTC CTGGGGCTTT TGATCATTTT TGGATATCGA 
CTGGTGACCG GGCTTCAAGG AAAAAGCTTG AACGGACGTA ATGAAAATTT AATTTTAATT 
ATTCTAATAG CGTTTTTTAT TTTGTTTATC ACGGCAGTCA GTGCGTGGGT GATGTTCTTT 
GATACAAGCG TCTTTACTTC ACTTGAACGC AGCCTGGATT CGCGAGCGGT TAGCAAATTG 
GCAACGGCAA GCGGACGAAC CTGGATATGG GAAGTTGCTT TGCGAGGAGG AATGGAGAAT 
CCTCTGTTCG GACAGGGTTT AGGCTTCTGG AGCTTGGAGA ATCGGCTTCG GTGGGGGCTG 
GGGGGTGCCG TACATGCCCA TAATTTGTTT CTTGACGTGT TTGCCCGTTC TGGATTTGTG 
GGCTTGAGCA CACTATTGGT TTTTCTCTAT TTTGTTTTTC GCTACTCCGT ACGCGCGACC 
CGGTACACGC ATGGAGGCAG CATTGCGTTG GCAGTCATCT TTCTCGTTCG AGCGACGTTT 
GAAGTGCCAC TTCAACCAAA TGCCATTCTA GGAGCGGAAT CCATGGCAAT GTTGGCTTTT 
TTCCTCTATG TAATCGATAG AGGAGCCAAA CAGCGCGACA AAGCCAATGA GCCCGTCCAA 
GTGCGGGCAC ATTTTTTAAG AGCAGGAAAC TTCCGATGA

Protein sequence

MLTVIILSIA VFVFALGSIV AMSAVAGAAS RWPGQMFSYL MWMIVMAGVG GILVSGRILR 
IDEEALVMGA VGEAGGTIIA KLLLSAVIGV SLALCVTWIL LSSKRKAGGN RFEQRRLNSP 
NDIVIAFMVF YIAFSILPLI FGKSHQFHVS LFYPFFVFIA LFLWMRLSKV DPVIVAKQCL 
GFIVLTSLVM AVLIPQLAVQ PSYVGLIPGF NSRLWGLTAG ANSLGSVAGT LLVLEAAEPS 
ARRWLGNGIF FTAALALVLT QSKTSILAAF LGLLIIFGYR LVTGLQGKSL NGRNENLILI 
ILIAFFILFI TAVSAWVMFF DTSVFTSLER SLDSRAVSKL ATASGRTWIW EVALRGGMEN 
PLFGQGLGFW SLENRLRWGL GGAVHAHNLF LDVFARSGFV GLSTLLVFLY FVFRYSVRAT 
RYTHGGSIAL AVIFLVRATF EVPLQPNAIL GAESMAMLAF FLYVIDRGAK QRDKANEPVQ 
VRAHFLRAGN FR